首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

文本聚类平移算法的几点问题

大概一个月前 10b lobster 也和我聊起过卢亮介绍过的平移算法,详细的介绍可以看这里:卢亮的blog。记得当时第二天就看到了carrot2的发布,carrot2 上使用了多种聚类的算法。 有些人对平移算法嗤之以鼻,比如这位。在我看来,一个算法有没有效果,要看这个算法的前提和假设,大炮打小鸟怎么瞄也不带劲儿。在文本处理领域中,比如,中文分词,特别是文本聚类的算法上从来没有一个算法可以解决所有问题,很多解决方案都是采用多个算法取长补短来达到综合效果的。 昨天写关于标签和书签的blog时想到,在改善新闻阅读器的文章分类也许平移算法用的上。周末便用了半天做了一个单向移动的平移算法。 平移算法,要考虑这个算法适用的范围,这个是前提。我实现的平移算法和卢亮的目的不同,类似于我的:未登录词识别 在算法的具体设计上,还需要考虑以下几个问题: 1、窗口大小,窗口借用了tcp发包的窗口的概念,就是确认有效匹配的长度; 2、平移的方向。我下面例子只实现了单向移动; 3、效率问题,平移算法涉及了大量的比较,找到一个最短的比较边界还挺重要; 下面是一份平移算法的原始结果,找出所有it公司的人名,感觉还可以。进一步处理后,就可以投入实际应用了:

06
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【IT资讯】全国第一的扫雷高手,因为一碗关东煮隐退了

    2013年8月31日,周丹成了中国第一。当时她到日本不足半年,呆在一所语言学校的宿舍里。 让她登顶的项目是扫雷。 那是个周末,没课,天热。她睡到大中午才起来,宿舍里没别人。像往常一样,她手边一杯冰咖啡,滑动鼠标,按键如飞,一局又一局地在笔记本电脑里刷着扫雷。 她玩得最多的是高级局——16×30的矩阵里埋了99颗雷,她需要挨个点开方格,直到排查出所有雷,才算获胜。周丹2009年就开始玩扫雷,玩得多了,目标早已不是「完成」,而是「有多快」。 她已经很快了。在她刚来日本那会儿,家人和朋友向外人介绍她时,总会加上一

    010

    解读百度架构调整:收入压力下,综合互联网公司的开始?

    罗超为虎嗅网撰稿,2013年6月8日发表于首页。 1月在北京极客公园创新大会上,在主持人问到如何看待腾讯、阿里和新浪等公司的架构调整动作时,李彦宏表示,自己的风格不是突变,而是想清楚一点调整一点。多年后回头看,公司的整体架构已发生了巨大的改变。自己并不会突然发一封信件,告知外界公司的巨大调整。 6月7日,李彦宏及百度发出邮件宣布一个规模较大的架构调整。虽没有马云倒腾出25个事业部这么巨大,但因百度向来低调谨慎,架构调整不多,上次高管轮岗还是两年前。这让这次架构调整耐人寻味。这说明,李彦宏又想清楚了一点或

    07

    智能制造-逆向工程-三维测量-标定

    光学三维测量是一项集机械,电气,光学,信息工程技术于一体的前沿技术。该技术应用光学成像原理,对现实世界的物体进行扫描,通过复杂的数据分析、数字图像处理得到目标物体的三维形态数据。该技术几乎不受目标物体的形状限制,经过处理的虚拟数据具有广泛的应用价值。本次设计课题为双目三维光学测量硬件系统设计。本文以格雷码结构光三维测量为编码原理,用SolidWorks建立三维模型,MeshLab处理点云数据图像。硬件方面,除了PC,核心器件为美国德州仪器公司研发的DLP4500系列投影仪,以其先进的DMD(数字微镜器件)技术进行光栅的投射。相位移基本算法:通过采集10张光栅条纹图像相位初值,来获取被测物体的表面三维数据。

    02

    去年国内云计算市场达数百亿 运营商发力各有侧重

    去年国内云计算市场达数百亿:产业链竞争转向完善生态系统 随着“宽带中国”战略的落地,云计算与大数据技术作为信息化转型升级的新引擎,逐渐进入技术爆发期。运营商阵营、IT阵营、互联网阵营,均在布局云计算方面不遗余力。第六届中国云计算大会信息显示,中电信、中移动、中联通以及BAT等各路公司都将重金建设或运用云计算,相关产业规模将延续火热态势,大幅增长。 去年中国云计算产业规模已达到1000亿元。于运营商而言,千亿级市场并非通行无阻的蓝海。创新领域,有互联网企业横亘;技术领域,有IT企业环伺。运营商唯有“取彼所长”

    07

    【AICC】AI将需要超百万倍计算力,三因素决定深度学习模型计算

    【新智元导读】人工智能三大支柱之一的计算目前发展是什么样的?它足以支撑人工智能的火速发展吗,会不会拖后腿,让人工智能的发展停滞?9月7日首届AI计算大会上述问题得到了很好的解答。在会上发表演讲的嘉宾首先对“计算力对新一波人工智能浪潮的影响有多大”进行了讨论。浪潮集团VP胡雷钧在主题演讲中对新的model对计算能力的需求三个因素进行了剖析,这里其中一个是网络深度,一个是网络里节点单元的个数和节点单元连接的复杂度,一个是处理的数据集的规模。 AICC首届AI计算大会,9月7日上午在北京国际饭店盛大开幕,中国工程

    03

    AI是泡沫还是有实打实的落地应用? 镁客网M-TECH AI助力中国智造产业论坛告诉你答案

    看AI行业大咖如何解读人工智能和产业的融合发展以及大趋势。 2017年即将接近尾声的时候,我们聚集了人工智能、VR行业内的先锋领袖,一同畅想“AI+中国智造”下,我们的传统产业、社会生活会发生哪些翻天覆地的变革。 12月28日,在支持单位南京新城科技园以及战略合作伙伴新加坡·南京生态科技岛的大力协助下,镁客网主办的M-TECH AI助力中国智造产业论坛在深圳圆满落幕。 AI产业是香饽饽 如果说今年科技圈的当红炸子鸡是什么? 绝对非人工智能莫属。从”AI写进政府工作报告”到国家出台的各种人工智能产业规划指导,

    00

    互联网金融这么火,安全问题如何破?

    在“互联网+”大潮中,互联网金融可谓是百花齐放,银行、支付、保险、股市、基金、小贷、征信、理财、记账,每一个细分领域都在与互联网发生化学反应。互联网俨然已成为金融行业的兴奋剂,激活了基金、股市、贷款诸多金融业务。它让基金大卖,它让2015年的股票屡现“牛市”,它让闲散资金与借贷需求精准匹配……但魅力无穷的互联网金融却难掩短板:安全。 不再面对面,安全成互联网金融的根本 互联网给金融生活带来了诸多方便:转账再也不用去银行排队,日常生活越来越少用到现金,可以像买菜一样方便地购买基金,前段时间股市暴热全民开户,都

    07
    领券