首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习将数学家引向无法解决的问题!

一组研究人员偶然发现了一个数学上无法解答的问题,因为这个问题与奥地利数学家Kurt Gödel在20世纪30年代发现的逻辑悖论有关,而这些悖论无法用标准数学来解决。

数学家们正在研究一个机器学习问题,结果表明,“可学习性”这个问题——一个算法是否能从有限的数据中提取出一个模式——与连续统一体假设这个悖论有关。Gödel表明,使用标准数学语言,该陈述既不能证明正确,也不能证明错误。最新的结果出现在1月7日的自然机器智能一号上。

“对我们来说,这是一个惊喜,”Amir Yehudayoff说的技术-以色列理工学院在海法,谁是论文的共同作者。他说,尽管有许多技术数学问题也是同样“不可判定”的,但他没有想到这种现象会在机器学习中出现在一个相对简单的问题中。

英国斯旺西大学的计算机科学家约翰塔克(john tucker)表示,这篇论文“在我们的知识极限上是一个重量级的结果”,对数学和机器学习都有基本意义。

不是所有的集合都是相等的

研究人员通常根据算法是否能够推广其知识来定义可学习性。这个算法给出了一个“是还是否”问题的答案——比如“这张图片显示的是一只猫吗?”--对于有限数量的对象,然后必须猜测新对象的答案。

Yehudayoff和他的合作者在研究学习能力和“压缩”之间的联系时得出了他们的结果,这涉及找到一种方法,在更小的一组数据中总结大量数据的显著特征。作者发现,信息被有效压缩的能力归结为集合理论中的一个问题,即象文恩图中的集合这样的对象的数学集合。特别是,它涉及到包含无限多个对象的集合的不同大小。

集合论的创始人georgcantor在1870年代证明了并非所有无限集合都被创造成相等的:特别是整数的集合比所有实数的集合,也称为连续统一体的集合要‘小’。(实数包括无理数,以及有理数和整数)康托尔还提出,不可能有中间大小的集合——即大于整数,但小于连续统。但他无法证明这个连续体假设,也没有许多数学家和逻辑学家跟随他。

他们的努力是徒劳的。Gödel的1940年的结果(在20世纪60年代由美国数学家Paul Cohen完成)表明,连续统假设不能从集合理论的标准公理---被认为是真实的陈述---开始证明是正确的或是错误的,一般被认为是所有数学的基础。

Gödel和科恩关于连续统假设的工作暗示了可以存在平行的数学宇宙,两者都兼容于标准数学——一个连续统假设被添加到标准公理中,因此被宣告为真,在那之后,又有一个世代,它是被否认的。

学习障碍

在最新的论文中,Yehudayoff和他的合作者将可学习性定义为通过抽样少量数据点来预测大数据集的能力。与康托尔问题的联系在于选择小集合的方法无限多,但是那个无限的大小是未知的。

他们继续证明,如果连续统假设成立,一个小的样本就足以作出外推法。但如果它是假的,任何有限的样本都是不够的。这样他们就表明,可学习性问题等同于连续统假设。因此,可学习性问题也处于一种只能通过选择公理宇宙来解决的边缘状态。

Yehudayoff说,研究结果也有助于对学习能力有更广泛的了解。“如果你想理解学习,那么压缩和泛化之间的联系是非常重要的。”

伦敦大学学院的计算机科学家Peter O'Hearn说,研究人员已经发现了一些类似的“不可判定”问题。特别是,在Gödel的工作之后,共同创立算法理论的艾伦图灵发现了一类问题,任何计算机程序都不能保证在有限的步骤中回答。

但最新结果的不确定性是“罕见的”,更令人惊讶的是,O'Hearn补充道:它指出了Gödel发现的任何数学语言中固有的不完备性。他补充说,这些发现可能对机器学习理论很重要,尽管他“不确定它会对学习产生多大影响”

奥地利数学家Kurt Gödel以他的“不完备性”定理而闻名。

我一名平凡的小编 您点个赞一个评论就是对我最大的鼓励和支持

欢迎大伙一起讨论大时代的进步,谢谢您!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190114A0GXCH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券