腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(26)
视频
沙龙
1
回答
"main“java.lang.ClassCastException:[Lscala.Tuple2;在
Spark
MLlib
LDA
中
不能强制转换为scala.Tuple2
、
、
、
、
我正在使用
Spark
1.3.0 (Scala2.10.X) MLlib
LDA
算法和
Spark
Java API。当我试图在运行时从
LDA
模型
中
读取
文档
主题
分布时,我遇到了以下问题。"main“java.lang.ClassCastException:[Lscala.Tuple2;不能强制转换为scala.Tuple2DistributedLDAModelldaModel = new
浏览 0
提问于2015-07-29
得票数 1
3
回答
从Pyspark
模型
中提取
文档
主题
矩阵
、
、
、
我
已经
通过Python成功地训练了
spark
中
的
LDA
模型
:model=
LDA
.train(corpus,k=10)这很好,但我现在需要
LDA
模型
的
文档
主题
矩阵,但据我所知,我所能得到
的
只有单词-
主题
,使用model.topicsMatrix()
浏览 2
提问于2015-10-12
得票数 16
回答已采纳
2
回答
如何使用经过Apache培训
的
ML
模型
开发REST?
、
、
、
假设这种情况: 我们分析数据,用我们手头
的
任何工具训练一些机器学习
模型
,并保存这些
模型
。这是在Python
中
完成
的
,使用和API。我们知道Apache擅长批处理,因此对于上述场景来说是个不错
的
选择。现在进入生产阶段,对于每个给定
的
请求,我们需要返回一个响应,这也取决于经过训练
的
模型
的
输出。我猜想,这就是人们所称
的
流处理,通常建议使用Apache。但是,如何使用Python
中
可用<e
浏览 2
提问于2017-03-10
得票数 2
1
回答
火花多项式Logistic回归中
的
非预期系数
、
、
、
、
我在我
的
Mac操作系统Sierra
上
运行了
Spark
2.1.1
(如果这有帮助的话)。我尝试在我在网上找到
的
测试数据集
上
拟合多项logistic回归,我在这里报告前几行(我不知道如
何在
这里附加文件):1,0,261,1,273,1,27 第一栏是标签由于标签有3个类,多项式logistic回归应该执行3个二项式
模型
,然后从最大可能在该类
中
存在
的
模型
中选择
浏览 4
提问于2017-07-04
得票数 0
回答已采纳
3
回答
MALLET与NLTK
中
的
主题
建模
、
我刚刚读了一篇关于如何将MALLET用于
主题
建模
的
有趣文章,但我在网上找不到任何将MALLET与NLTK进行比较
的
文章,因为我
已经
有了一些经验。 它们之间
的
主要区别是什么?MALLET是一个更“完整”
的
资源吗(例如,在引擎盖下有更多
的
工具和算法)?或者,回答前两个问题
的
好文章在哪里?
浏览 0
提问于2011-09-20
得票数 28
回答已采纳
6
回答
Google Cloud Dataflow和Google Cloud Dataproc之间
的
区别是什么?
、
、
看看谷歌
的
云服务,DataProc似乎也可以做同样
的
事情。为什么谷歌同时提供这两种服务?
浏览 1
提问于2017-09-27
得票数 66
4
回答
神经网络解析字符串数据?
因此,我刚刚开始学习神经网络如何操作来识别模式和分类输入,我
已经
看到了人工神经网络如何解析图像数据并对图像进行分类(用卷积演示),关键是降低图像采样,每个像素刺激一个输入神经元进入网络。我得到
的
用例是用户看过
的
电影
的
“推荐引擎”。电影中有大量
的
字符串数据(标题、情节、标签),我可以想象将文本“降采样”到描述这部电影
的
几个关键词,但即使我解析出描述这部电影
的
前五个单词,我想我也需要每个英语单词
的
输入神经元来比较一组电影?我可以限制输入神经元仅限于在集合中
浏览 0
提问于2014-07-30
得票数 33
回答已采纳
5
回答
从文本内容生成标签
、
、
、
、
我很好奇是否存在一种算法/方法,通过使用一些权重计算、出现比率或其他工具,从给定
的
文本生成关键字/标签。谢谢
浏览 2
提问于2010-04-18
得票数 51
回答已采纳
4
回答
文本分类分类器
、
、
、
、
有没有人知道好
的
开源文本分类
模型
?我知道斯坦福分类器,Weka,Mallet等,但它们都需要培训。 我需要将新闻文章分类为体育/政治/健康/游戏/等等。有没有预先训
练好
的
模型
?
浏览 1
提问于2013-03-07
得票数 6
回答已采纳
3
回答
twitter/facebook评论分类为不同类别
、
、
、
、
我想知道,我应该在评论/推特
中
寻找哪些标记/标记,以便将其分类为任何一个类别。最后使用哪种分类器。我只需要一些指导和建议,我会从那里接受
的
。 请帮帮忙。谢谢
浏览 6
提问于2014-10-06
得票数 7
回答已采纳
5
回答
高维二进制稀疏数据
的
聚类算法
、
、
我有一个包含10,000个基因
的
数据集,如下所示 1 0 1 1asian每一行都意味着一个人
的
DNA
中
是否有一个基因。我们正试图根据上述数据对不同
的
族裔群体进行分类。但是首先,我们想要使用一些聚类算法来可视化集群对于不同种族群体
的
样子。我们不打算使用这种聚类算法来对组进行分类,如果我们有很好<
浏览 0
提问于2017-10-07
得票数 7
2
回答
在使用pandas_udf和Parquet序列化时内存泄漏?
、
、
、
、
我目前正在使用PySpark开发我
的
第一个完整系统,我遇到了一些奇怪
的
、与内存相关
的
问题。在其中一个阶段
中
,我想要类似于拆分-应用-组合策略来修改DataFrame。问题是,我想要应用
的
函数是一种拟合
模型
的
预测
方法,该
模型
“说”出了Pandas成语,即它是矢量化
的
,并以Pandas系列作为输入。我决定不使用GroupedMap类型
的
pandas_udf,因为
文档
规定内存应该由用户管
浏览 34
提问于2019-05-27
得票数 14
6
回答
Kafka对实时数据
的
主要优势是什么?
、
在我们
的
大数据时代,您
的
IT基础架构可能会受到各种来源数据涌入
的
影响。最重要
的
是,客户要求“实时”查看他们
的
数据,没有任何延迟时间,因此您
的
服务器需要快速处理和显示数据。Uber,Twitter,Airbnb,Yelp以及今天财富500强公司
中
超过30%
的
公司都在使用它。例如,通过集成各种数据,
如
喜欢,页面点击,搜索,订单,购物车和库存,Kafka可以帮助实时将数据提供给
预测
分析引擎,以分析客户行为。那么 Kafka
浏览 7133
提问于2018-09-14
3
回答
Apache消息传递语义
、
、
我研究了Apache
文档
中
的
消息传递语义。Apache函数所提到
的
传递语义(至少一次、最多一次和有效一次),如果我们不使用Apache函数,那么有哪些不同
的
交付语义可用呢?
浏览 8
提问于2020-04-30
得票数 3
回答已采纳
4
回答
如何计算精确度、召回率、准确率和多类案例
的
f1-score?
、
、
、
、
我正在处理一个情绪分析问题,数据看起来是这样
的
: 5 1190 3 239因此,我
的
数据是不平衡
的
,因为1190个instances被标记为5。对于分类,我使用
的
是scikit
的
。问题是我不知道如何以正确
的
方式平衡我
的
数据,以便准确地计算多类情况下
的
精确度、召回率、准确率和F1分数。sample_weight=sam
浏览 231
提问于2015-07-15
得票数 132
回答已采纳
6
回答
没有单元测试
的
敏捷
、
、
如果您正在处理
的
代码库有0%
的
单元测试覆盖率,那么谈论“敏捷开发”或声称您正在应用“敏捷方法”有意义吗?(作为一个团队,你们对此没有采取任何行动)。也许还有其他
的
方法,但我仍然看不出它们是如何工作
的
。
浏览 0
提问于2016-05-30
得票数 27
回答已采纳
7
回答
深度学习
的
主要框架有哪些可以通过腾讯云服务器学习?
、
深度学习
的
大部分知识都很深奥,作为一个深度学习领域
的
小白,想要了解一下深度学习分为哪些大致
的
框架,分别的内容又有哪些?哪些框架可以通过腾讯云服务器来开始学习呢?
浏览 2814
提问于2018-09-07
30
回答
关于数据库,每个开发人员都应该知道些什么?
、
、
考虑到野外滥用和滥用
的
数量,以及每天都会出现
的
大量与数据库有关
的
问题,可以公平地说,有些概念是开发者应该知道
的
--即使他们今天没有设计数据库或使用数据库。关于数据库,开发人员和其他软件专业人员应该知道
的
一个重要概念是什么?
浏览 19
提问于2009-12-30
得票数 209
9
回答
如何快速入门Kafka消息队列?
、
最近经常听到这个名词,但是不知道如何入门,我看到腾讯云也有相关
的
产品Ckafka产品,所以来问问~
浏览 5071
提问于2018-09-14
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark平台下基于LDA的k-means算法实现
大数据测试学习笔记之基准测试HiBench
Uber机器学习平台Michelangelo是如何使用Spark模型的?
基于 Spark 的文本情感分析,以《疯狂动物城》为例
解读微软开源MMLSpark:统一的大规模机器学习生态系统
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券