大家好,我是很帅的狐狸🦊
今天分享一个免费政策分析工具。
这个工具是我(和ChatGPT)做的,用来比较两段文本的词频。
如果你的工作涉及宏观政策分析,这个工具会很好用。
所有代码都是用ChatGPT写的(包括前端),花了大概1个多小时吧。
先说说底层的分析原理——
我在之前几期的 政策分析课 上有提到过,分析政策文件有一个做法是「词频分析法」,也就是通过词语出现频次判断重要性。
这个方法,可以用来对比同级别会议或报告。
比如说,对比过去几年的国家五年规划文件,我们可以发现制造业和服务业的地位有所扭转——
过往这个分析基本靠网上的词频分析工具,不过大多都是付费的。
所以我这次手搓了一个免费的。
用法也很简单:
把最新文件(比如「十四五」规划文件)和想要对比的文件(比如「十三五」规划文件)分别贴在两个文本框——
接着可以选择要统计的高频词的个数(最少10个),还有看看是不是要用相对词频(也就是把词频除以文件的总字数,这样算出来的是百分比)。
我们也可以根据需求,看看是不是要改改分词用的词典。
接着按「词频比较」按钮就可以了。
会生成类似下面的图表(黑色的是「十四五」,黄色的是「十三五」,可以看一眼哪些是新增哪些减少了,还挺好玩的):
服务器不会储存你贴的任何文本,请放心使用。
如果实在不放心,我也把代码都开源到了github(https://github.com/raphaelxiao/policy-text-insights)。
略懂python的话,也可以在自己电脑上部署。
领取专属 10元无门槛券
私享最新 技术干货