AI经过前几年的炒作之后最近似乎进入了幻灭期。很多人提出,AI其实只是做特定的某件事情,距离所谓的AGI还很远。但是我们是不是需要实现AGI才能把AI叫做真正的人工智能呢?A16Z合伙人Ben Evans以电子产品的发展类比目前的智能家居与机器学习的发展,提出来对智能化及AI发展的新思路。原文标题为:Smart home, machine learning and discovery。
今天的“智能家居”在家庭的地位跟一、二代前的电子产品是一样的:每个人都会有一些,但我们正在设法弄清楚哪个行得通。人人都有烤面包机或者搅拌机,但没人有电子开罐器,智能家居也一样。我们还处在发现模式。
机器学习有很多相同的问题:我们如何将这些商品化组建组合成有意义的产品——不仅在家庭行得通,而且在平台和智能手机上也行得通的产品呢?
机器学习的部分挑战在于不仅要弄清楚要解决什么样的问题,而且还要弄清楚如何将之呈现给用户。部分可能是通过品牌术即可——我们也许需要说“这个就是‘AI’”来设定预期(同时也起到降低预期的作用)。、
我的祖父祖母可以告诉你他们拥有多少个电机。汽车里面有一个,冰箱里面也有一个,真空吸尘器里面有一个,总计可能会有十几个。对此今天的我们却不知道,但这个并不是一个有意义的问题,不过我们的确知道有多少自己的设备是有网络连接的。再次地,我们的孩子和孙子对此也不知道,而且这也没关系。
在这两种情况下,一波商品化组件促进了一波产品的创造。廉价直流电机、加热组件等促进了家庭的电气化,而目前的这波“智能家居”设备则是由廉价且低功耗的摄像头、wifi芯片、麦克风等促进的。(基本上是出自智能手机供应链)
同样地,在两种情况下,都有一个发现阶段:所有的部件我们都有了,但是仍然需要弄明白该怎么去组合。因此,大家提出了各种针对家用的电子设备,我们共同去弄清楚哪些行得通,在什么地方行得通——英国每个人都有一个热水壶,美国大多数人都有搅拌机,但没人有电子开罐器。同样的事情正发生在“智能家居”身上。很多产品点子都试过了——其中一些是热水壶,但也有的是开罐器,但这些只有事后才会看起来很明显。这个进程部分也正在弄清楚公司的价值去往何处——那些是现有制造商的商品(烤箱公司,锁具公司等),哪些属于来自深圳的商品,而哪些是创办新公司的机会。
所有这些都跟同时在机器学习领域(尤其是消费者产品)发生的创造和发现存在着非常直接的重合。再次地,在计算机视觉、语音以及NLP之类的东西上我们有着种类不断壮大的各种部件,以及更广泛但没那么明显的基于机器学习的模式识别。再次地,这些部件很多现在都商品化了,或者正在迅速成为商品。再次地,我们正在弄清楚怎么去组合它们,把它们开发成产品,或者添加到其他产品里面,然后呈现给用户。
那么:
用电机和发热元件我们可以做什么东西呢?
用wifi芯片、摄像头和麦克风我们可以做什么东西呢?
用图像识别、自然语言处理以及模式识别我们又可以做什么东西呢?
与此同时,这些机器学习部件本身也是智能家居的组件(ML让联网摄像头或者智能恒温器变得有用),反之亦然(智能音箱往往只是语音助理的一个端点)。
当然,“智能家居”的发现挑战部分在于这些设备相互之间的互联程度应该如何——应该是“物联网”呢?还是“连接到互联网的物”?
语音助手(基于机器学习)显然是这个难题的一部分——我要用语音控制一切吗?也许。我往往会用维恩图来思考这个——用语音告诉烤箱加热到350度是很好的做法,如果不需要我说任何东西智能门锁就能跟防盗报警器对话也不错,但是门锁并不需要连接到烤箱。也就是说,我们有一系列的扩张点解决方案(除非是部分设备已经用了10年,否则的话你不大可能会只是为了获得语音助手支持而换个烤箱)。
同样地,你也可以想想看ML在多大程度上可能会变成超越一系列点解决方案的东西——也就是是不是应该有更多的结缔组织。
硅谷的普遍观点是想要一个大一统的“AI”层就像是要一个大一统的“数据库”层一样。我们不会指望我们的照片、邮件、短信以及Instagram更新都共处着一个统一的的“数据库层”——因为那些都是不同的软件部分,即便他们使用的是同样的底层技术。同样地,机器学习也会出现在各种不同的地方做完全不一样的的事情。电池优化用ML,Google的夜晚模式用ML,但那些显然是完全不同的代码块,而且用户在使用的时候永远都不需要听“AI”的。甚至在某个东西明显是“AI”的时候,甚至在使用同样的核心技术的时候,产品也可能是完全不同的。如果我给Google Photo一张狗仔海滩边的照片,用例是“给我看我的狗在海滩边”的照片。但如果我把照片交给Google Lens,告诉我这是一条在海滩的狗并没有用处。我们买的不是电机——我们买的是钻头。我们买的不是wifi芯片组,我们也不会买‘AI’。
另一方面,机器学习的挑战部分在于不仅要弄清楚要解决什么问题,而且还要弄清楚如何呈现给用户。当你的iPhone检测到邮件中有航班确认消息并添加到你的日程里面时,它会说Siri“发现了航班”——Siri不是软件的某一块(这里的情况下它甚至都没有使用任何的机器学习),但是苹果却用来宣传成“手机正在观察并且做出建议。”这里有很多的消息传递和用户沟通问题(尤其是隐私问题)。系统经常未必能够确定自己看到的是什么——那么你会说“也许是X?”尤其是,对于语音助手或者像Google Lens这样的知识图谱来说,你怎么去沟通可以做什么不能做什么呢,不确定性又应该怎么沟通呢?也许“AI层”关乎的完全就是把消息传递给用户说这具备了ML特征,以及设定好可行的适当类型的预期。换句话说,我们也许会说这就是AI来降低预期,而不是提高预期。可能其中部分AI需要对进行“AI”的宣传好让大家理解它,也许那个“AI”品牌还会包括一些根本就不是AI的东西。
领取专属 10元无门槛券
私享最新 技术干货