我面临着一个关于序列挖掘的棘手问题,比如我有10种产品,我有数百万条记录,每条记录都包含用户、产品和购买时间戳。每个用户可能只有1条记录或100条记录。例如:
user 1, p1, t1
user 1, p1, t2
user 1, p2, t3
user 1, p3, t4
user 1, p1, t5
user 2, p2, t6.....
现在我需要预测什么时候是为用户推广产品的最佳时机。
到目前为止,我的解决方案是,将时间分成几个类别。然后对数据应用Apriori,例如记录将如下所示
user 1, p1T1
user 1, p2T2
user 1, p3T2
user 1, p2T
我正在尝试学习Apache mahout,这是一个非常新的话题。我想实现基于用户的推荐。为此,在网上搜索后,我找到了一些示例,如下所示:
public static void main(String[] args) {
try {
int userId = 2;
DataModel model = new FileDataModel(new File("data/mydataset.csv"), ";");
UserSimilarity similarity = new P
我是新的数据科学和机器学习,并寻求一些帮助。我正在尝试用以下数据来训练一台机器:
📷
在这里,L3是目标变量。由于可以看到目标变量包含一组可能的值,所以我想知道如何使用这样的数据来训练机器。在我的测试数据中,我可能希望预测给定一个值的一个或多个值。示例测试用例:
20 c aa
'aa‘是给定的值,我希望根据值20、c和'aa’来预测其他值。做我想做的事情有可能吗?
谢谢。