利用Libsvm对语义分析问题进行数据训练和分类预测。但由于语义分析涉及n维问题,因此在大规模数据方面存在性能问题.
去年,利伯线性发布了,它可以解决性能瓶颈。但它耗费了太多的记忆。MapReduce是解决大数据语义分析问题的唯一途径吗?或者还有其他方法可以改善Liblinear上的内存瓶颈?
发布于 2014-05-14 12:32:29
请注意,有一个早期版本的LIBLINEAR移植到阿帕奇火花。有关一些早期详细信息,请参阅邮件列表评论和工程场地。
发布于 2014-05-14 17:06:33
您可以查看元音瓦比特。它是相当受欢迎的大规模学习,并包括平行规定。
在其网站上:
大众汽车是机器学习中速度的本质,能够很容易地从传统的数据集中学习。通过并行学习,在进行线性学习时,它可以超过任何单机网络接口的吞吐量,这是学习算法中的第一种。
https://datascience.stackexchange.com/questions/16
复制相似问题