腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1823)
视频
沙龙
2
回答
NLTK
/
NLP
设计了一个多到
多
/
多
标签
的
主题
分类
器
、
、
、
、
我有一个由5000多个
主题
索引的XML文档组成的人工标记语料库。它们的大小从几百千字节到几百兆字节不等。是抄本的短文。他们都被编入了与段落级别一样深的索引。我很幸运有这样一个语料库可用,我正在努力教自己一些
NLP
概念。无可否认,我才刚刚开始。到目前为止,只阅读免费获得的
NLTK
书,,和浏览jacobs(?)
NLTK
食谱。我喜欢尝试一些想法。有人向我建议,也许,我可以拿双标,用朴素的贝叶斯
分类
来标记新的文档。我觉得这是错误的做法。朴素的Bayes精通一种真实/错误的关系,但是要在我的层次标记集上使
浏览 1
提问于2011-10-12
得票数 7
回答已采纳
1
回答
多
标签
和
多
标签
-
多
类
分类
的区别是什么?
、
、
我正试图将新闻文章
分类
为它们所需的类别。然而,我对上述术语(
多
标签
和
多
标签
-
多
类)感到困惑。我的数据集由2个csv文件组成。第一个文件包含新闻文章的内容。同一
对
应行号中的第二个文件由与其关联的
标签
组成。下面是第二个文件(即
标签
文件)中的示例条目:因此,对于第1行,第一个csv文件包含了标题为体育和足球的新闻文章。同样,对于第2行,第一csv中的文章有运动和媒体的
标签
。我的问题是,这是数据集
多
<
浏览 0
提问于2019-06-11
得票数 2
回答已采纳
2
回答
用
NLTK
、scikit learn和OneVsRestClassifier启动
多
标签
分类
、
、
、
、
免责声明:我是非常新的人工智能,Python,
NLTK
和科学工具包-学习。 我试图训练一个
分类
器
来将一组文档
分类
为一组
标签
。,其中
分类
器
只尝试将文档
分类
为
标签
。准确性很好,但我希望
分类
器
为文档分配0、1或更多
标签
。我怎么能这么做?遗憾的是,我不能仅仅初始化
分类
器
,告诉它是一个
多
标签
分类
浏览 5
提问于2016-03-24
得票数 2
回答已采纳
1
回答
将
多
标号问题转化为
多
类问题
、
用单个
分类
器
将
多
标签
问题建模为
多
类问题的缺点是什么?1)因此,每个
标签
组合的每个元素。2) 有一个N长度的输出向量(向量的每个元素都是一个
标签
),但是这个问题将被视为一个
分类
浏览 0
提问于2019-07-22
得票数 3
1
回答
NLTK
-
多
标记
分类
、
、
、
我使用
NLTK
对文档进行
分类
--每个文档有一个
标签
,其中有10种类型的文档。对于文本提取,我清洗文本(标点符号删除,html标记删除,低胁迫),删除
nltk
.corpus.stopwords,以及我自己的停止词集合。对于我的文档特性,我将查看所有50k文档,并按频率( frequency_words )收集前2k单词,然后
对
每个文档标识文档中也在全局frequency_words中的单词。我遇到的问题是: 这个由
NLTK
提供的
分类
器
是否适用于多个<
浏览 1
提问于2014-05-09
得票数 7
回答已采纳
1
回答
门对
NLP
有多好?
、
、
、
我正在尝试构建一个
NLP
应用程序,它本质上必须做命名实体识别(NER)。我偶然发现了。据我所知,这是一个构建
NLP
应用程序的框架。我
对
安妮进行了测试,IE系统中有了not,但是对于我的领域,NER的结果并不令人满意。事实上,任何NER,如斯坦福大学CoreNLP或
NLTK
,都没有给我必要的结果。因此,我决定
对
现有的系统进行调整,以获得预期的结果。添加新组件的门有
多
灵活?例如,有一天,如果我想使用
NLTK
的POS
标签
在大门内? 如果我想使用自定义机器
浏览 3
提问于2017-02-23
得票数 7
1
回答
多
类逻辑回归在SciKit学习中的应用
、
、
、
对于
多
类情况,我
对
Scikit的Logistic回归的正确调用有问题。我使用的是lbgfs解算
器
,并且将multi_class参数设置为multinomial。我不清楚如何在拟合模型时传递真实的类
标签
。我曾假设它与随机森林
分类
器
多
类类似/相同,其中您可以传递n_samples、m_classes数据帧。因此,这是我的问题:如何将完整的类
标签
集传递给fit函数? 我在互联网上找不到可以建模的示例代码,在StackOverflow上也找不到这个问
浏览 0
提问于2016-04-10
得票数 4
回答已采纳
2
回答
用低质量训练集训练
多
标记
分类
器
、
、
、
、
因此,我正在创建一个
主题
分类
器
,其中一个文档可能被标记为几个不同的
主题
,比如- A,B,实际上该文档属于A、B和C。在培训阶段,我希望
分类
器
学习文档属于A和B,但我不确定C类,所以我不希望它知道文档不属于C类。我考虑在输出
标签
中添加权重(低权重意味着文档不可能属于方面,高权重意味着文档确实属于方面,而中等权重意味着我不确定(因此这种情况下的惩罚将更低)。
浏览 0
提问于2016-07-31
得票数 1
回答已采纳
2
回答
文档的监督
标签
建议
、
、
、
我有成千上万的文档和相关的
标签
信息。但是,我也有很多没有标记的文档。我知道
NLTK
、gensim、word2vec和其他库
对
解决这个问题会很有用。 我将使用Python
对
该项目进行
浏览 0
提问于2017-06-26
得票数 0
3
回答
用于监督
主题
分类
的最佳Python
NLP
库
、
、
、
我有一个
标签
数据集,我已经摄取到一个数据。copyright', dtype='object') 其中,文本列包含文章的正文(文本),
主题
列包含关联
主题
的列表我想从这个数据集中训练一个模型来预测文章
主题
。我正考虑用变压
器
(https://huggingface.co
浏览 0
提问于2021-04-20
得票数 0
3
回答
机器学习文本
分类
,其中一个文本属于1到N类
、
、
、
因此,我试图(只是为了好玩)根据电影的描述
对
电影进行
分类
,其想法是“标记”电影,因此给定的电影可能同时是“动作”和“幽默”。通常,当使用文本
分类
器
时,您得到的是给定文本所属的类,但在我的示例中,我希望将文本分配给1到N标记。,告诉我每个
标签
是否属于单一文本,因此,例如,如果我想知道一篇文章是否被归类为“幽默”,我将得到以下的培训集:|在那之后,我总共用了4个
分类
器
,它们是 行动/
浏览 5
提问于2016-04-13
得票数 0
回答已采纳
1
回答
NLP
关于有序等级
多
类
分类
的术语和建议
、
、
我在医疗保健部门工作,并试图看看是否可以使用
NLP
来完成复杂句子的
分类
任务。为了解释,我有不同的
标签
,每个
标签
有多个层次。然而,我不确定正确的术语。我有
标签
X,X总是以4‘级之一的形式存在:“少数”,或1“无处不在”,或3'X和
浏览 0
提问于2022-10-24
得票数 1
3
回答
多
标签
文档
分类
、
、
、
我有一个数据库,我在其中存储基于以下三个字段的数据: id,文本,{
标签
}。请注意,每个文本都已分配给多个
标签
\标记\类。我想构建一个模型(weka \ rapidminer \ mahout),它将能够推荐\
分类
一堆
标签
\
标签
\类到给定的文本。 我听说过SVM和朴素贝叶斯
分类
器
,但不确定它们是否支持
多
标签
分类
。
浏览 3
提问于2013-05-21
得票数 7
1
回答
一个
多
标签
文本
分类
问题
、
、
、
我想解决一个
多
标签
的文本
分类
问题,但是我真的不知道如何正确地表述它,这样我就可以查找它。我的问题是:我想把句子分为三个
标签
(例如)目标、方法和结果。其结果将是: object
浏览 0
提问于2022-03-11
得票数 2
回答已采纳
1
回答
在
NLTK
中导入SVM轻型文件格式
、
、
我试图使用
NLTK
来训练一个用于
多
类文本
分类
的朴素贝叶斯
分类
器
。但我无法接触原始文本。我得到的是一个支持向量机轻型格式的文件(每一行都有一个带有特性:value
对
的实例)。我只需导入这个文件,并使用这个数据集训练和测试朴素贝叶斯
分类
器
。我想知道是否有办法将这个文件导入
NLTK
并直接用于训练
分类
器
。
浏览 0
提问于2014-03-24
得票数 2
回答已采纳
1
回答
如何计算多任务模型中的样本权重?
、
、
具体来说,我有一个输出400个类
多
类
分类
,以及一个5类
多
标签
分类
的模型。所有的课程都是不成比例的,不平衡的。在没有样本加权的情况下,
多
类
分类
器
的
分类
准确率达到90%以上,并且
对
多
标签
分类
中的某些类有较好的AUC。目标是提高
多
标签
分类
任务中的一个类的性能。这门课相当不平衡。
浏览 0
提问于2023-04-25
得票数 0
2
回答
机器学习-单级、二元类和
多
类
分类
的区别在哪里?
、
、
、
单类、二元类和
多
类
分类
的区别是什么?我就不能用上面提到的所有方法来达到我的目标吗?例如,我可以将C1、C2、C3和C4描述为四种不同的二进制
分类
训练集,并使用经过训练的模型来标记未知的数据集.对于多项式
分类
,我只需在一个训练集中定义一个训练集,其中包含C1、C2、C3和C4的所有良好样本数据,然后使用一个结果模型进行
分类
。 但是这两种方法有什么区别呢?(除此之外
浏览 0
提问于2014-10-20
得票数 6
1
回答
keras
分类
和二进制交叉熵
、
、
、
在我的例子中,我希望用LSTM模型预测在线评论的多个
标签
,比如(正、负和中性)。这些
标签
被转换成一个热点向量,在keras中使用to_categorical方法,这也在keras中有记录: array([[1., 0., 0.], [0., 0., 1.],
浏览 1
提问于2018-05-24
得票数 3
回答已采纳
1
回答
一种支持非线性核和
多
标签
的支持单
对
少的支持向量机实现
、
、
、
、
我正在寻找一个支持支持非线性内核和一个vs-rest场景的支持向量机实现,以执行
多
标签
分类
。最好是用Python编写的,或者我可以用wrappers从Python调用。我正在研究sklearn,有两个实现可以使用支持向量机进行
分类
: -支持单点rest场景下的
多
标签
分类
,但它是基于lib线性的,因此只支持线性内核。基于libsvm的 -支持非线性核,但是
多
标签
分类
是在一
对
一的缩减下完成的,它训练K
浏览 4
提问于2017-03-21
得票数 5
回答已采纳
2
回答
支持向量机
多
类文本
分类
、
、
我想
对
新闻数据集和训练数据进行
分类
,并使用IPTC
主题
代码进行
分类
(层次
分类
)。在我的项目中,我应该使用svm。就像这样:我不知道如何使用svmmulticlass 我也听说过一
对
一
浏览 2
提问于2010-07-26
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
自然语言处理简明教程
基于 TensorFlow 2.0 的长短期记忆网络进行多类文本分类
NLP 技术在微博 feed 流中的应用
9款超赞的AI开源项目!
UC 国际信息流推荐中的多语言内容理解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券