我实现的平移算法和卢亮的目的不同,类似于我的:未登录词识别
在算法的具体设计上,还需要考虑以下几个问题:
1、窗口大小,窗口借用了tcp发包的窗口的概念,就是确认有效匹配的长度;
2、平移的方向。...我下面例子只实现了单向移动;
3、效率问题,平移算法涉及了大量的比较,找到一个最短的比较边界还挺重要;
下面是一份平移算法的原始结果,找出所有it公司的人名,感觉还可以。...,人博客,广告是,什么都,2.0发展,公司 ,微软有, Web,施密特,国互联网,500,宫玉国,陈永正,在中国,低估了,CEO王,柳传志, 不会,盖茨Google,是未来,Web2.0,薪水一,娱乐的...,什么中国,流氓软件,门户网站,张瑞敏,创始人,的IT,时最易犯,三大因素推动互联网未来发展,将是新,争议人物,周韶宁,五年内,的生活,创新 ,过多少,李开复Google,Vista,10年,中国总裁,...我正在实现一个新闻句子提取引擎,做好后放到新闻阅读器里,这样查看高燃语录(2005-2006语录)的时候,可能会更方便。