加载搜索日志¶
加载某天用户query session
In [1]:...]:
df = df.dropna()
有效去重复¶
从每个用户的query session中,获取20个 tag 词...北海道,旅游,澳大利亚,清莱,澳洲,清迈,泰国,厦门,哈尔滨,俄罗斯,香格里拉,丽江
权重词提取¶
使用所有的用户的top 20 query tag...,汇总计算关键词出现的权重
In [8]:
alltags = jieba.analyse.extract_tags(','.join(df.querytag