腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何从NLTK棕色语料库中的特定类别中寻找形容词
频率
、
我是这方面的初学者,我想知道是否有可能从褐色语料库中的类别中提取形容词
频率
,并用
Python
创建这个形容
词
的列表。
浏览 2
提问于2015-01-17
得票数 0
回答已采纳
2
回答
如何正确计算文本中的数字?
、
、
我想在一篇文章中找到不同字母的
频率
,其中一些字母使用对话
词
。例如,文本同时使用“U+00E5”和“̨”( U+0328),并且需要单独计算
频率
。 我该怎么做?我试过使用计数器集合,使用utf8格式打开文件,使用text.split()和list(text)拆分文本字符串,但是
python
仍然将‘list(text)’和‘̨’计数为同一个字母!
浏览 1
提问于2017-10-30
得票数 8
回答已采纳
2
回答
如何利用
python
检索弹性搜索中的词频?
、
我必须在所有与之匹配的文件中找到一个
词
的
频率
,例如:“天空”。例如:如果doc1有句话, 但当我尝试实现它时: es.search(index="abc", body={"from":0, "size":0,"term vectors":{"fieldsad
浏览 1
提问于2018-04-29
得票数 2
1
回答
Numpy:要分配的
频率
数组
、
、
、
、
在具有numpy的
python
中,最快的方法是像进入另一个数组其中,第一个数组给出每个索引的
频率
(即索引0的
频率
为0,索引1的
频率
为2,索引2的
频率
为3,等等),而第二个数组重复每个索引的次数与第一个数组中指定的次数相同。背景:--我用它来“enflate”(我找不到更好的
词
了),k矩阵M (稀疏与否)给出了长度k
频率
矢量f的k f = np.array([0,2,3,1,
浏览 0
提问于2018-04-16
得票数 0
回答已采纳
1
回答
从大型语料库中提取词频列表
、
、
、
、
我有一个名为的大型英语语料库,我想列出所有单词的
频率
。意思是它们在整个语料库中出现了多少。这个
频率
列表应该有一些特点: 非常感谢。
浏览 0
提问于2019-01-13
得票数 0
回答已采纳
1
回答
如何计算Zipf定律中单词的
频率
?
、
、
、
集合中有4个不同的单词a、b、c、d,它们的
频率
顺序为a>b>c>d。使用,这四个单词的
频率
是多少? 有没有关于Zipf定律的公式?我研究过,在Zipf定律中,最频繁的
词
发生的
频率
大约是第二频繁
词
的两倍。
浏览 1
提问于2015-05-24
得票数 1
回答已采纳
2
回答
用
Python
计算大文本中多
词
词
的
频率
、
、
、
、
我有一本字典,里面有近百万多个
词
(包含空格的
词
).这看起来就像'multilayer ceramic', 'multilayer我想用许多千兆字节的文本来统计它们的
频率
。
浏览 1
提问于2020-04-14
得票数 0
回答已采纳
1
回答
用一个真正的
词
完成匈牙利词干
、
我对
Python
的NLTK包和NLP也很陌生(我通常在R中工作,但为了NLP的目的,可能
Python
更能抓取)。我的第一个想法是将最常见的
词
或最短的单词(或
浏览 0
提问于2015-06-12
得票数 3
1
回答
情绪分析中正、负
频率
的减法
、
在积极的消极情绪分析中,用数学的方法来计算单词的正
频率
和负
频率
,而不是保持一个
词
的正
频率
和负
频率
的分数,这样做是否有意义呢?这样,每个单词都会有一个积极的“热”,其中一个很高的值表示一个非常肯定的
词
,反之亦然。这种方法将如何改变模型的性能?
浏览 0
提问于2021-02-24
得票数 0
2
回答
正规化餐厅菜式清单
、
、
、
我正试图使盘子“正常化”(错误的
词
)。我想要“拉猪肉”和“拉猪肉三明治”和"Jumbo Pork Slider“都映射到一个单一的菜,”拉猪肉“。到目前为止,我已经开始使用
Python
使用NLTK,并且在
频率
分布等方面玩得很开心。谢谢
浏览 3
提问于2015-08-26
得票数 5
回答已采纳
1
回答
使用wordnet获得句子中单词的最佳同义
词
、
、
、
我已经做了代码从wordnet获得同义
词
,它为每个单词提供了完整的同义
词
列表。因此,我希望我的代码能够根据句子从同义
词
列表中选择合适的同义
词
。例如:句子是:“我是他的哥哥”,我必须根据这个句子找出每个单词的最佳同义
词
。“长者”、“曾经”、“前辈”、“曾经”、“曾经”、“从前”、“诚实对上帝”、“年老”、“老”、“前辈”、“确定--足够”、“老”、“有时”、“诚实-上帝”、“昆坦”、“老人” 在这个句子中,最好的同义
浏览 2
提问于2017-05-25
得票数 0
2
回答
使用
python
比较两个网页最简单的方法是什么?
、
、
您好,我想比较两个网页使用
python
脚本。我怎样才能做到这一点?提前感谢!
浏览 5
提问于2011-03-09
得票数 3
回答已采纳
1
回答
在SOLR中,原始
频率
与建议
频率
不匹配。
"whs“的输出为”- (73)“,这是提出的”比实际原始
频率
(94)变化“的建议。 任何使两者
频率
相同的方法<field name="gram" type="textSpell" indexed
浏览 3
提问于2015-03-04
得票数 3
1
回答
快速创建表中键计数的方法
、
、
我有一个熊猫系列的词
频率
为一个特定的
词
跨多个文本摘录,例如10,5,10,5,3,3,2,1.我想要产生一个2列的表格,我想把
频率
这个
词
作为键,以及这个
频率
对它发生的次数。
浏览 1
提问于2013-08-05
得票数 2
回答已采纳
1
回答
如何让wordcloud2显示最高频
词
、
、
词
云首先显示
频率
最高的
词
,而wordcloud2似乎是从不同
频率
的桶中采样,因此高频
词
不一定会出现。wordcloud2的一些功能很酷,但是我怎么才能让它显示所有最常用的单词呢?
浏览 3
提问于2017-04-15
得票数 0
1
回答
德语词干词干/词缀化
、
、
、
我在一个文本语料库中收集了大量的德语单词及其
频率
(所以像"der“、"die”、"das“这样的
词
有很高的
频率
,而术语类单词的
频率
很低)。同一
词
的不同形式,如复数形式或第三人称形式确实出现,但不能保证每个单词都会出现这种情况。 我试过使用spacy.load('de_core_news_sm'),但它说它找不到模型。也许还有第二个问题:当涉及到相关
词
时,我能做些什么来确定使用这些
频率
的单词的可靠受欢迎程度?例如,单数形式
浏览 0
提问于2021-09-07
得票数 1
1
回答
将句子中的
词
转换成向量形式准备模型
、
、
我想要构建一个简单的分类器,它可以对文本是question还是simple message进行分类。我理解逻辑回归,可以创建一个简单的神经网络。 我有英文,日文,韩文,泰文的标签输入数据。在将数据输入分类器之前,如何转换这些数据?
浏览 0
提问于2018-06-12
得票数 1
回答已采纳
1
回答
创建没有整数值的节点networkX
、
、
我想从以下几个方面做出有向图: 对应于每个刺激
词
的字典列表,其中包含:key= response - word和value,其中的值是响应的
频率
,因此,刺激
词
和响应
词
之间的边缘以
频率
作为它们的权重
浏览 4
提问于2014-12-07
得票数 0
3
回答
在NLTK中实现
词
袋朴素贝叶斯分类器
、
、
、
、
它不考虑单词的
频率
作为要查看的特征(“
词
袋”)。 似乎认为,使用内置的NLTK分类器无法做到这一点。真的是这样吗?如何使用NLTK进行
频率
/
词
袋NB分类?
浏览 0
提问于2012-04-11
得票数 24
回答已采纳
5
回答
使用
Python
自动从上下文中选择标记
、
如何使用
Python
从文章或用户的帖子中选择标记? 删除一些常见的单词,并选择列表中的前10个单词作为标签。如果上面的方法是好的,什么库可以检测哪些
词
是常见的,比如“,if,you等”,以及哪些是描述性单词?
浏览 1
提问于2009-11-21
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python实现特定频率方波生成
python词云图
Python词云
Python词云实践
python生成词云图
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券