.cvs 文件是 ml-1m 的评分数据,数据类型如图所示,分别有user-id \ movie-id \ rating\ timestamp 四列.
我想把看了同一个电影的所有用户分到一起构成一个group,rating和timestamp也得带着,输出依然是个四维数据;并且统计一共分了几个group,每个group有多少个用户,
修改于 2021-08-31 03:18:16
您好,可以考虑如下逻辑方案:
1. 使用panda读取csv文件
2. 根据movieID创建字典
3. 将不同movieID数据分类到相应字典中即可
相似问题
领取专属 10元无门槛券
AI混元助手 在线答疑
洞察 腾讯核心技术
剖析业界实践案例