如何分析海量增长的专利信息,挖掘潜在价值?应从何入手?
专利是技术、市场和竞争信息的宝贵来源。然而,公开的专利文献总数已高达1.2亿件,仅去年一年就新增630万件。如何才能让这些海量专利文献为己所用?
专利分析为充分挖掘专利信息的价值,提供了一条不可或缺且切实可行的途径。通过专利分析,我们可以了解自身与竞争对手各自专利组合所具有的优势、存在的不足和蕴含的机会,以及全球范围内的专利申请趋势、技术全景、哪些地方可能存在空白领域等等,不一而足。
专利分析要求透彻理解底层数据,这些数据的用法和用途,以及能够解决的问题。德温特专利分析服务团队在开展专利分析方面拥有丰富的经验和技术专长。下面与您分享有助于充分发挥专利分析价值的10个技巧。
了解您的"镜头”
1
处理和分析专利数据的方法有很多种,但重要的是,知道在什么时候,以什么顺序,使用哪种方法。选择专利分析的适用方法与摄影有许多相似之处,如分辨率、不同光学元件的功效和选取、数字变焦与光学变焦的取舍等。
譬如,正如您不会使用显微镜来观察月球,您也不会使用“自由实施”(FTO) 检索来审视一个技术领域的格局分布。反过来也一样,试图通过专利全景分析进行如 “可专利性”这样的聚焦分析,也不可取。在进行专利全景分析时,需要使用数千个数据点才能对专利布局进行有效诠释。如果聚焦到仅查看三、四个数据点,这样无异于将照片放大到几个像素,只能得到模糊不清的图像。
更好的做法,是按照一定的流程使用各种工具和方法。您可以先使用全景分析的方法来确定几个具体领域进行宏观分析,然后在下一步使用可专利性或FTO检索的方法再来重新聚焦审视这些领域的某一局部。这相当于先使用望远镜选月球表面一个目标区域,然后再发射一个探测器到该区域直接拍摄月球表面更加细微的图像。虽然理论上也可以发射数千个配有摄像头的探测器到月球上,但显然不切实际。这两种方法一样有价值,但适用的场景却不一样。在处理专利数据时,也必须考虑适用的方法和使用这些方法的时机。
理解统计口径
2
专利数据集可能会非常复杂,尤其是同一个创新或发明,可能产生大量单独的专利和专利申请。在很多公开的分析当中,提及“ 专利”这一表达时并未说明其含义。不同的统计口径可能对分析结果产生天壤之别。您必须清楚,这些具体数字指的是单件“专利”还是“专利家族”(“发明”)。如果不考虑这一点,您的结论可能站不住脚。一个简单的规则是,要进行精确的专利分析,大多数情况下都可以先做“加法”,扩展数据集使其纳入所有同族专利,然后再做“减法”,归并统计专利家族的数量。使用德温特世界专利索引 (DWPI) 数据,可以轻松实现这一点,因为 DWPI 数据库的结构围绕着世界各地不同专利机构所公开的一系列专利构建了德温特专利家族,这使您能够对创新和发明进行分析,而不是仅仅对“专利” 进行分析,因为对于许多(可以说是大多数)情景而言,分析“ 专利” 的趋势可能并不合适。
深入研究,让数据说话
3
几乎所有分析都需要对专利数据进行清理。究其原因,所有专利数据库都必须迎合最广泛的潜在用户群体。与之相反,要让您所做的分析实用有效,就必须针对规模更小的读者群和用户群。这意味着需要将相关背景纳入考虑。
清理专利权人信息(即拥有该专利的实体),标引技术分类,以及总结发明的优点、用途和专利申请人类型等,这些背景信息的清理能使专利数据更适合您的公司或组织。在这之后形成的所有图表,会更加实用、易于解读并对实际行动起到指导作用。
对于特定的分析项目,进行更深入的人工阅读可能带来额外的价值。通过人工深入研究,您将变身“ 侦探”,梳理出潜藏的情报,如所有权变更、隐蔽的合并、海外布局、技术发展脉络等其他信息,使得分析师能够提供发掘出数据背后想要讲述的故事,即让数据说话。
仅使用专利分类号不足以支持深入分析
4
在考量技术分组(用途、优点、技术属性等等)时,大家经常会使用专利检索工具中各种不同的专利分类号,如国际专利分类 (IPC)、联合专利分类 (CPC) 或德温特手工代码等,直接生成可视化图表。
然而,这些分类和代码的主要目的在于辅助检索相关主题,而非用于分析。要将这样的技术分组与读者能够识别和理解的技术分类一一对应是非常困难的一件事,如果未经处理直接使用(如G01N 33/02),那么,99%的读者可能无法很快理解。
更理想的做法是,将数据和文本挖掘融入您的工作中:在使用分类代码的同时,通过文本挖掘对文字内容进行分析,并将两者结合识别出大众可以理解的技术主题。
这通常需要工具、技能和时间,但有助于对原始专利信息进行“ 翻译”从而提炼形成解读,从产品、研发项目、消费者/用户益处和市场等角度,让您的读者可以直接读懂。换言之,它让原始数据走出晦涩的“ 专利世界”,进入读者所在的现实世界。
瞄准数据背后的解读,而非图表
5
高级专利分析师深知,向不懂专利的读者直接呈现或展示“ 原始”的专利数量统计、专利家族数量统计、引用水平和时间趋势等,不难实现,但对于不了解专利的读者而言,则很难从中得出结论,形成观点和认知。
原始数据之间的相关性差、数值过于接近或差异性大等原因,都有可能导致不易可视化进而难于理解。
最佳的实践是,针对要回答的问题,创建分析模型,进而对趋势进行解读。
建模可以非常简单,如按照从最小到最大的顺序将数据点排序;也可以使用数学工具,将时间序列精炼为趋势指标,抑或使用统计工具,如平均值、中间值和模态平均值等。
平均值在使用时需要小心,因为它们可能“ 隐藏”有价值的数据点,如数据的分布情况,我们称之为“ the tyranny of the mean”。平均值在分析中占有重要位置,但可能被误用。多折线图显示数量随时间推移而变化的情况,但可能极为拥挤,不宜观察。可以将之转换为数字,使图表更容易进行比较。
其他更为复杂的模型包括,使用专利家族的多个指标来对发明进行打分和排序,然后在技术、申请人和时间等维度进行汇总。这类分析能够有效发现谁拥有该领域最强的专利组合,以及哪些技术正快速实现商业化。
本文作者:
Parijat Oak,知识产权服务副总监
Ed White,,知识产权分析服务全球总监
本文来源:科睿唯安德温特与标准事业部原文:【CDE】一图读懂药物临床试验登记与信息公示知识产权律师转载此文仅为学习交流,文章版权归原作者所有,如有版权问题请联系我们删除。
领取专属 10元无门槛券
私享最新 技术干货