我正在做关键词提取系统,在前置之后,系统通过检查与相同模式匹配的文本来提取候选关键词
现在我想知道如何找到提取的候选关键字含义之间的相似性?例如,让我们看看下面的矩阵:
k1 k2 k3
k1 1 ?1 ?2
k2 ?1 1 ?3
k3 ?2 ?3 1
how can I find the values of (?) ???
where
(?1) refer to the sense similarity degree between (k1) and (k2)
(?2) refer to the sens
我想从另一个txt文件导出一个URL列表到一个新的txt文件。第一个txt文件如下所示:
电子邮件: 631关键词: 0.0
电子邮件:61个关键词: 0.0
我正在尝试创建一个如下所示的列表:
URL
URL
我没有得到任何的输出
有人能帮忙吗?
import re
import urllib2
filename = 'C:\\file.txt'
pattern = ('^\S*')
with open(filename) as f:
for line in f:
if pattern in line: