我正在使用来自e1071包的R支持向量机。这是我第一个使用支持向量机的项目。
我有一个数据集,其中包含了~1k个客户超过1年的订单历史,我想预测消费者的购买情况。对于每一个客户,我都有信息,如果某一项(50%)是在某一周内购买或没有购买( 52周,又称1年)。
我的目标是预测下个月每个客户的购买量。
我相信一个月前的购买比10个月前的购买对我的预测更有意义。
我现在的问题是,我如何才能给更多的最新数据一个更高的影响?在svm函数中有一个‘重量’选项,但我不知道如何使用它。
有谁能给我个提示吗?会很感激的!
这是我的密码
# Fit model using Support Vecct
我目前正在使用支持向量机来预测用户会在给定的人口统计数据下购买哪种商品。数据集还包括某个年龄段的用户购买了每件商品的数量。它看起来像这样:
items a b c
age
15-20 10 3 10
20-25 1 5 6
25-30 2 5 6
我不确定如何将其合并到训练数据中,因为我能想到的唯一合并方法是包括一组购买商品的用户的概率值,但这非常笨拙。我的另一个想法是使用集成学习方法,将支持向量机与朴素贝叶斯分类器结合起来。我正在使用sklearn来构建我的模型。