Pandas:统计单词的出现次数(来自另一个数据帧)，并输出计数和匹配的单词

文章/答案/技术大牛

发布

1回答

、

我有一个包含句子的列的dataframe (df)。我有第二个dataframe (df2)，它有一个包含单词的列。在df中的每一行，我想计算来自df2的单词在句子中出现的次数，如果确实出现，则将计数输出到新列中，并将匹配的单词输出到新列中。我已经知道如何计算，但我不知道如何

浏览 17提问于2020-08-05得票数 2

回答已采纳

1回答

Python，URL NLP:如何计算URL字符串中的所有英文单词？

、、、

我有一个有趣的问题。我有一个数十亿个URL的列表。类似于： www.fortune.comwww.asdf.com 我还有一个JSON文件形式的英语词典。如何统计URL中检测到的英文单词数？例如，对于上面的URLS，计数应该是: 1,3,0个单词(《财富》，《纽约时报》)。理想的输出是包含URL和URL中的英语单词<e

浏览 20提问于2019-09-09得票数 0

2回答

如何使用python统计数据帧中列的每行中特定字符串/单词的出现次数

、

如何统计数据帧中某一列中每一行中某些字符串/单词的出现次数？not hungryI believe him I can not believe that he does not believe me 然后我想要得到在每一行中出现的单词"not“的总数。我想要得到的是： column

浏览 14提问于2020-07-02得票数 0

回答已采纳

6回答

计算文本中每个单词出现的次数- Python

、

我知道我可以在文本/数组中找到一个单词，如下所示： print 'success' 我想要做的是阅读文本中的一个单词，并尽可能多地计数这个单词(这是一个简单的计数器任务但问题是，我真的不知道如何read已经读过的单词。最后:统计每个单词出现的次数</

浏览 2提问于2018-03-16得票数 0

回答已采纳

1回答

使用scrapy框架查找网站中最常用的5个单词

、、

通过获取页面内容和查找文本表单页面，我可以在没有的情况下找到前5个常见词。然后根据出现次数将单词转储到字典中。如何使用scrapy查找最常用的单词？我可以使用scrapy的统计数据收集模块，以便在完成爬行后可以打印

浏览 6提问于2018-12-30得票数 0

2回答

如何用另一个数据框的值过滤掉另一个数据框的值，并根据出现的次数进行统计？

、、、

我有两个数据帧，我想将df1与df2进行匹配，以查看df1中是否有df2格式的值。此外，计算这些值匹配的次数。最后，我想将这些统计数据发送到新的数据帧。这是一个细目：df1=['abc','cba']df2=['abc','cba','abc123', 'abc&#x

浏览 14提问于2020-11-19得票数 0

回答已采纳

1回答

找出一个单词在字符串中出现的次数(是否有类似于C#表达式的内容)？

、、、

我感兴趣的是找出一个单词在字符串中出现的次数。我感兴趣的是，如果这是唯一的方法，或者有其他类似的东西。C#中的 (来自SO问题)。如果我在一个循环中使用contains检查List中的某些单词是否出现在

浏览 0提问于2012-01-24得票数 2

回答已采纳

2回答

如何检查一个单词列表是否包含在熊猫数据帧中的另一个列表中？

、、、、

我正在尝试比较数据帧中不同列中的两个单词列表，并打印常见的单词。之后，我想计算一个列common_count，它是第一个列表中常用单词的计数除以总单词。最终输出将如下所示：用于创建数据帧的代码片段： raw_data = [{'id': 1, 'name': '[co

浏览 14提问于2021-02-22得票数 0

回答已采纳

4回答

统计pandas数据帧中特定单词的出现次数

、

我想使用下面的代码来计算数据帧的每一行提到单词列表的次数 df["Count"] = ( .apply(Counter)) 单词是我使用的单词列表。words = ['wooly',

浏览 58提问于2021-05-03得票数 0

3回答

统计pandas数据帧中每个特定单词的出现次数

、、

我想要计算数据帧中每个特定单词的出现次数。我目前使用的是str.containsn = a.apply(lambdax: 1).sum() 有没有一种方法可以匹配正则表达式并获得出现次数？在我的</

浏览 0提问于2013-07-10得票数 33

回答已采纳

3回答

PYTHON :如何从列中出现的单词创建列？

、、

例如，我有一个数据帧，如下所示： my_df = pd.DataFrame({'col1':['A', 'B', 'C', 'A', 'A', 'B'],'col2':['foo bar', 'bar', 'something foo', 'foo', '

浏览 2提问于2017-05-10得票数 2

2回答

查找哪些单词可能与单词X一起出现

、、、、

找出某个单词X附近出现频率最高的单词的最好方法是什么？(注:不是哪些单词与单词X最相似) 我有GloVe单词向量，所以每个向量代表一些单词在不同环境中的分布(每个维度都是一个环境)。到目前为止，我所做的是找到与单词X最接近的N个单词(通过余弦相似度)，然后对这些单词应用K-means聚类。它工作得很好，但我担心最近的</

浏览 0提问于2017-10-28得票数 0

2回答

如何计算单词在一列中出现的次数，python

、、

如何在Python中统计一个单词在一个字符串中出现了多少次？例如：----|-------2 | Round and roundfile| context1 | Hello world | {'hello':1,'world':1} 2 | Round and round | {'round':2,

浏览 2提问于2017-09-15得票数 0

2回答

存储一个段落并记录每个单词出现的次数

我想知道是否有人可以建议一种方法，我可以存储整个段落的单词，并对每个单词的频率进行计数，然后按频率从最高到最低的顺序对单词进行排序。我认为这可以使用一个二维数组和一个结构来保存计数，但我不能想出一个确切的方法来做到这一点。我目前在DevC++上编程。

浏览 2提问于2014-04-20得票数 1

3回答

MySQL计数匹配的单词

、、

如何查询以获取字段中的匹配单词计数，特别是在MySQL中。简单地说，我需要获取“搜索条件”在字段值中出现的次数。例如，它的值是"one，two，one，onetwo“，所以当我搜索单词"one”时，结果应该是3谢谢

浏览 1提问于2008-11-27得票数 2

回答已采纳

3回答

计算每个单词中出现的行数。

、

我有一个训练数据集，它是一个numpy数组，形状为(4800,1)。它有一列字符串，每一行对应于来自不同电子邮件的文本。我想要创建一个字典来统计每个单词在使用python时出现的电子邮件数量(或行数)。最后，只选择出现在至少10封电子邮件中的单词。我只能计算出在整个数据集中出现的单词的频率，而不是多少行/电子邮件。下面

浏览 1提问于2020-10-19得票数 1

回答已采纳

3回答

Python:按字母顺序打印所有术语的计数，即使是零

我正在运行一个遍历360+文本文件的循环，该循环统计每个文件中某些单词的出现次数。> for filename in os.listdir("C:\Users\Cameron\Desktop\Project"):我有两个列表，words_fra和words这将输出与计数匹配的单词，但不会打印计数为零<

浏览 1提问于2013-02-18得票数 0

4回答

词性标注-从哪里开始？

、、、

您好，我想知道如何实现这样一个任务的解决方案：我想收集有关单词频率的统计数据，但另外要确保每个单词都被正确识别(或大多数单词)。在句子“她大声哭了”中的“哭”将被归类为名词，而“不要哭”将为统计数据提供动词。另一项任务将更加困难。我想找出经常出现在一起的单词的</

浏览 3提问于2010-02-05得票数 0

4回答

计算趋势主题

、

假设我正在根据各种条件从twitter收集tweet，并将这些tweet存储在本地mysql数据库中。我想能够电脑热门话题，如推特，可以在任何地方的长度从1-3个字。有没有可能写一个脚本来做类似PHP和mysql的事情？我发现，一旦能够获得术语的计数，我就可以回答如何计算哪些术语是“热门”的，但我被困在了第一部分。我应该如何将数据存储在数据库中，如何统计长度为1-3个单词的术语在

浏览 5提问于2010-02-12得票数 5

1回答

机器学习是如何学习的？

、

我是机器学习或人工智能的新手，但我已经做了近10年的开发人员。我有一个新闻聚合应用程序，从新闻网站抓取和保存文章，我已经开发了我自己的算法，分类的新闻根据它的标题。它的工作方式是，当我获得一个新的标题时，我拆分标题的单词，并将其保存在一个名为“tag”的表中，并且我有“类别”表，然后我将手动地将一些标记(可以识别或不间断的单词)链接到类别。因为我用的</

浏览 0提问于2019-04-28得票数 1

点击加载更多