我有网站,在那里用户可以张贴他们的文章,我想给每个文章的访问和参考其作者的完整统计数据。在这里,实现似乎非常简单,只需为每次访问存储一个数据库记录,然后使用聚合函数来绘制图形等等。
问题是,文章在24小时内获得了大约30万的浏览量,而在短短一个月内,统计表将获得大约900万条记录,这是一个非常大的数字,因为我的服务器并不是很强大。
对于这类任务有解决方案吗?是否有算法或缓存机制可以在不损失准确性的情况下存储长期统计数据?
附注:这是我的原始统计表:
visitid INT
articleid INT
ip INT
datetime DATETIME