腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何在Apache Mahout中对数值
数据
进行
分类
?
、
、
、
、
我有一个格式为class, unigram count, bigram count, sentiment的数值
数据
集
。我浏览了一些Apache Mahout文档,它们都是关于
文本
数据
的。我知道我需要执行3个步骤来
分类
:转换为序列文件,矢量化序列文件,通过它来训练朴素贝叶斯
分类
器。但我很难理解在Mahout中对
文本
数据
集
进行
分类
与对数值
数据
集
进行
分类
之间的区别。
浏览 4
提问于2014-09-15
得票数 0
2
回答
如何使用Watson NLC工具包管理多个培训
集
、
据我所见,没有办法上传多个培训
集
到新的沃森NLC工具。我需要管理单独的培训
集
和它们相关的
分类
器。我在这里错过了什么?
浏览 5
提问于2016-02-24
得票数 1
回答已采纳
1
回答
如何处理此机器学习/NLP上下文感知
文本
分类
项目?见下面的说明
、
、
、
、
说明如下: Medicine -> pharmacy问题面临的- 我从一个小
数据
集
开始,然后使用 api通过查找
浏览 3
提问于2017-11-01
得票数 1
4
回答
建议
文本
分类
器训练
数据
集
、
、
、
、
我可以使用哪些免费的
数据
集
来训练
文本
分类
器?我们试图通过向他推荐最相关的内容来提高用户的参与度,因此我们认为,如果我们根据预先定义好的单词对内容进行
分类
,我们可以通过获得他对之前已经
分类
的帖子的随机数量的反馈,向他推荐吸引内容的内容。因此,出于这些原因,我们尝试了另一种解决方案,即对内容进行聚类,而不是对其进行
分类
。 谢谢:)
浏览 0
提问于2014-06-18
得票数 9
回答已采纳
1
回答
针对WEKA中的每个实例提取SVM赋值
、
、
、
、
在对每个实例使用SVM训练模型后,是否有方法提取值,以查看SVM分配给每个实例的值,以便将实例
分类
为正类或负值。我正在寻找一些解决方案,以获得所有基于SVM的分配值,针对每个实例在WEKA工具。我一直在支持向量机下使用LibSVM和LibLinear
分类
器。我需要用这些值来排名
浏览 4
提问于2018-07-08
得票数 0
回答已采纳
2
回答
推文
分类
、
、
我正在尝试机器学习,所以我想尝试对tweet进行
文本
分类
。我收集了一个小的tweet样本,但为了执行任何有监督的学习,我需要手动标记我收集的一些tweet。当我扩展我的
数据
时,这是一项艰巨的任务。有没有办法在不让我手动标记大量tweet的情况下执行
分类
?或者,无监督学习对这项任务更好吗?
浏览 4
提问于2014-05-23
得票数 0
1
回答
识别
数据
集中的
分类
变量
、
、
、
、
我有一个具有150+特性的
数据
集
,我希望将它们分隔为
文本
、类别和数字。
分类
变量和
文本
变量具有对象
数据
类型。我们如何区分
分类
变量和
文本
变量?
分类
变量有任何阈值吗?
浏览 14
提问于2022-09-10
得票数 0
1
回答
这是一个主题建模或
文本
分类
的问题吗?
、
、
如果这是
文本
分类
的问题,是否有类似的
数据
集
可用,还是我必须自己制作??我有一个电子邮件
数据
集
分类
为垃圾邮件/火腿。
浏览 0
提问于2017-03-07
得票数 0
1
回答
如何处理
数据
集中的大量类别?
、
、
我有一个“书籍”的
数据
集
,最初包含8列,其中3列包含可以
分类
的
文本
值。3列包含“语言代码”、“作者姓名”和“书名”。由于LinearRegression不接受
文本
作为输入,所以我决定使用“pandas_getdummies(.)”对这3列进行
分类
但是在对其进行
分类
之后,列数从8列超过了20072,这太高了。
数据
集
url为:https://www.kaggle.com/jealousleopard/
浏览 0
提问于2019-07-15
得票数 1
回答已采纳
1
回答
如何在NLTK Python中检测
文本
的不确定性?
、
、
、
无论评分制度如何,“一定”和“不确定”的
分类
也足以满足我的需要。 我没有找到任何关于这方面的现有工作。我该怎么处理这个?我确实有一些未经训练的
文本
数据
。
浏览 8
提问于2016-08-19
得票数 4
回答已采纳
1
回答
机器学习问题(解决ValueError:无法将字符串转换为浮动:)
、
我正在运行下面的示例代码:print(url_data.shape) #X = input Data (Urls) // Y = output (Wether
浏览 1
提问于2022-07-05
得票数 1
回答已采纳
4
回答
LDA为
文本
分类
提供良好的训练
数据
?
、
、
、
、
我将基于LDA的内容
分类
为音乐、技术、艺术、科学等通用主题9主题-> ,Technology,Arts,Science 等。我在每个文档(.txt文件)中填写了大约10,000行我认为是“纯”
分类
内容的内容a.)这是一种有效的
分类
方法(使用上述步骤)吗?
分类
仅
浏览 9
提问于2015-04-11
得票数 4
2
回答
如何在Apache Spark中进行多标签
分类
、
我想在大
数据
集
上进行多标签
文本
分类
,似乎Apache Mahout或Spark MLLib等大
数据
机器学习工具目前还不支持这一点。我想知道以前有没有人做过大
数据
集
的多标签
分类
?在不久的将来,是否有计划在Mahout或Spark中集成多标签
分类
?
浏览 13
提问于2015-06-26
得票数 5
1
回答
如何生成
分类
问题的样本
数据
集
、
、
我是
数据
科学的新手。我有一个“短
文本
”
分类
问题,输入变量要么是非结构化
文本
(名称、定义、描述等),要么是
分类
。这些字段没有太多的语义,因为它们是产品名称、区域名称、销售订单类型等。问题是,我没有任何样本
数据
集
,可以从中获得培训、测试、验证
集
,或者将其划分为k倍进行交叉验证。那么我应该如何生成样本
数据
呢?我有大约20个目标班。我可以使用regex或lucene规则对某些
数据
集
进行
分类
浏览 0
提问于2016-07-16
得票数 2
回答已采纳
1
回答
这个AES加密操作可以描述为同态操作吗?
我正在做一些关于加密
数据
集
隐私保护
分类
的工作。真的需要澄清一下。我用AES方案加密了一个
数据
集
(纯
文本
),并得到一个密码
文本
。我能够使用机器学习工具WEKA对密码
文本
进行
数据
挖掘操作(训练和
分类
),对密码
文本
进行解密,发现解密结果与对明文执行相同操作时得到的结果相匹配。这个运算能被称为同态运算吗?
浏览 0
提问于2017-08-17
得票数 0
回答已采纳
3
回答
当训练
集
包含监督
分类
中的错误
数据
时,我该怎么办?
、
、
、
我正在做一个执行
文本
自动
分类
的项目,我有很多
数据
集
如下所示:某某..。A. AA兹兹..。A.AA 然后,我将使用上述
数据
集
生成一个
分类
器,一旦新
文本
出现,
分类
器就可以用正确的CategoryName标记新
文本
(
文本
是自然语言,大小在10-10000之间)。现在,问题是,原始
数据
集
包含一些不正确的
浏览 3
提问于2013-01-22
得票数 3
1
回答
多任务学习
、
、
有人能用简单直观的方式解释一下多任务学习吗?可能一些现实世界的问题是useful.Mostly,这些天我看到许多人正在使用它来完成自然语言处理任务。
浏览 4
提问于2011-12-31
得票数 5
回答已采纳
1
回答
python中的
文本
分类
-(基于NLTK语句)
、
、
、
、
我需要对
文本
进行
分类
,我正在使用
文本
blob python模块来实现它,我可以使用朴素贝叶斯
分类
器/决策树。我对上述各点表示关注。 1)我需要将语句归类为参数/非参数。我使用两个
分类
器和训练模型使用apt
数据
集
。我的问题是,我是否需要用关键字来训练模型?或者我可以用所有可能的论点和非参数的例句来训练
数据
集
,?在
文本
分类
、准确性和检索时间方面,哪一种方法最好?( 2)由于
分
浏览 0
提问于2014-04-20
得票数 6
2
回答
利用Java中的WEKA
分类
器模型对实时
文本
进行
分类
、
、
我已经使用GUI训练了一些示例arff文件的
分类
器。经过训练后,我保存了获得的模型。我已经去过 & 了。 但是仍然找不到它的代码,.I只是获得了加载模型文件的方法,.But没有得到任何关于直接将
文本
分类
到类的线索。
浏览 2
提问于2014-01-30
得票数 2
1
回答
是否有使用强化学习进行多标签
文本
分类
的例子?
、
、
我有一个有标签的
数据
集
,我将为多标签
分类
问题(例如:5个标签)开发一个
分类
器。我已经开发了伯特和CNN,但我想知道我是否也可以使用RL进行
文本
分类
。 据我所知,使用RL我们可以使用更小的训练
数据
集
。
浏览 2
提问于2022-04-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大话文本分类
数据超市对于文本数据挖掘的流程 机器学习如何搭建文本分类器
基于keras的文本分类实践基于keras的文本分类实践
LSTM文本分类实战
Mini-VGG实现CIFAR10数据集分类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券