我试图通过向程序传递一个.txt文件,然后迭代所述txt文件,处理掉任何标点符号和不感兴趣的填充词,然后将处理后的字典传递给外部词云模块,来构建一个词云图像。我已经将file_contents设置为一个单词列表,并将它们拆分。然后迭代列表以用空字符串替换任何标点符号,然后将字典设置为迭代列表并将单词存储在所述字典中。一旦将结果存储到字典中,就会检查它们是否有填充词的列表,如果有匹配,则将它们替换为空字符串,然后返回dict值。我试了所有的方法,但仍然找不到我自己的问题所在。
def calculate_frequencies(file_contents):
# Here is a list o
我有像对接机这样的星云图形实例,而且它们也能工作。
我想通过星云图形工作室版本:v3.5.0连接到我的实例
有两种方式:
1- using graphd:[port] like this graphd:9669
2- using ip:port like this: 172.xx.xx.11:9669
但今天我有个错误:
我的错误消息是:
ErrBadRequest::拨号tcp 172.xx.x.11:9669: connect: no路由宿主
从谷歌分析,我有一个(长)的关键字列表,人们在搜索引擎中找到我的网站。我想找到“核心关键词”,假设的例子:
java online training
learning java
scala training
training for java
online training java
learn scala programming
理想的结果是:'java',‘在线培训’,‘培训’,'scala‘和’学习‘。
困难似乎是检测完整的短语,忽略常见的单词(用于)和处理变体(学习)。
是否有一个库可以这样做(最好是针对JVM)?还是有一个合适的算法,我可以自己实现?