加关注▲
微信号:华进知识产权
华进全新专栏:《知产研究所》第 19 期
作者:李文渊 国内专利事业部
目前AI(Artificial Intelligence,人工智能)这个话题可谓非常热门,时不时就能够看到关于AI的新闻。AI好像无所不能,能对话、能开车、能下棋、能送快递还能看病,好像有逐渐取代人类的趋势。说不定将来AI还能自动检索专利文献、撰写专利申请文件、答复审通等等,不免有种快要失业的危机感。
机器学习是一种实现AI的方法,随着AI的蓬勃发展,涉及机器学习的专利申请需求也愈来愈多,文本作者结合工作经验谈一谈涉及机器学习的方案如何申请专利。当然,机器学习本身涉及的知识非常广阔,作者也仅能够了解其中一角,如有纰漏之处还请批评指正。
目前机器学习的实现,主要是用样本数据训练模型,让模型学习到样本数据中蕴含的内在规律,然后用训练好的模型对新数据进行预测。在这个实现过程中,主要分为模型训练和模型应用两大阶段。模型训练可能涉及数据清洗、特征提取、模型内部结构变化、模型参数更新算法以及模型组合训练等阶段。模型应用则可能涉及数据采集、特征提取、模型内部结构变化、模型输出结果应用以及模型组合应用等阶段。可见,模型训练和模型应用存在交集也存在差异。
以下主要从整体上说明撰写涉及机器学习的专利申请文件时需要考虑的因素:
1
明确改进之处。上述模型训练和模型应用的各个阶段,都可以进行改进。因此,布局权利要求时,需要考虑哪个或哪些阶段做了改进,改进的阶段具体做了哪些改进,改进的重点在哪里,以及改进之处彼此间的关联,等等。明确了这些改进之处,就基本可以据此确定权利要求的布局。
2
先考虑布局模型应用的权项,再考虑布局模型训练的权项。由于模型训练可能一次性完成,但模型在训练好之后可能被重复应用,就是说模型应用再现的可能性比模型训练再现的可能性要高的多。而且模型训练一般仅在后台完成,而模型应用则有可能由前台完成,供用户使用。因此,模型应用相比模型训练更容易取证。因此,建议优先考虑构建模型应用的权利要求,再考虑构建模型训练的权利要求。
3
如果模型本身是现有技术,而且也没有针对特殊场景做特殊的调整,那么在权利要求中详细对模型进行描述的意义并不大。一般只需要在说明书中以公开充分且能够支持权利要求的基本需求进行描述即可。因为现有技术说的再细致也是现有技术,不如把撰写精力用在对实际改进点的纵向挖掘和横向扩展上。
4
如果模型不是主要的改进点,可以将模型当作黑盒处理,将数据输入模型并由模型输出结果。比如将X数据提取特征Y后输入Z模型,获得所述Z模型输出的类别。甚至在一些情况下,模型都可以不用出现。比如根据X数据的Y特征确定类别。
5
模型训练和模型应用一般不会同时出现在独权中。比如模型训练可以布局为模型应用的从权,也可以将模型训练和模型应用分别布局成不同的独权。但也有例外,比如当改进点在于对模型训练所产生中间数据的应用上,且模型训练和模型应用分割开后都是现有技术,那么就需要将模型训练和模型应用放到一起来写,以突出发明点。
以上主要是整体上说明了撰写涉及机器学习的专利申请文件时需要考虑的因素,当然还会有撰写专利申请文件的一般性要求,就不在这里赘述了。上篇的内容就到这里,希望对读者能够有所帮助。作者将在下篇中详细介绍对于机器学习实现过程中不同阶段改进的撰写处理方式。
End
编辑/赵蕊
校对/赵蕊
领取专属 10元无门槛券
私享最新 技术干货