前几天,SpaceX的猎鹰火箭刷屏了,所谓“十年寒窗无人问,一举成名天下知”。
在人工智能这样的领域,当然少不了“钢铁侠”马斯克的身影,我们来关注他的另一个投资:OpenAI
OpenAI的官网(openai.com)介绍中,定位为一家非盈利的研究公司,致力于通往安全通用人工智能(Safe AGI)路径的探索与实践。
这里有两个关键词:安全、通用
关于安全,马斯克是一个人工智能威胁论者,曾警示公众“我们需要万分警惕人工智能,它们比核武器更加危险!”
人工智能的研究目的是创造智能体,帮助人类更有效地解决问题。然而在《西部世界》、《银翼杀手》等科幻片中,人工智能也经常让人类陷入噩梦。
马斯克认为,对付这项威胁的方法,是对它的发明、创造和使用进行有效的监管。
关于通用(General),则是所谓“弱”人工智能与“强”人工智能的分水岭。
从本专栏的前文介绍中,大家可以知道,人工智能的基本方法是通过标签化数据对模型进行训练,图像识别要用海量图片作为数据输入,而语音识别要用海量语音作为数据输入。因此,训练出来的人工智能,都是某一领域的专家,但不能跨领域,是所谓的“弱”人工智能。
如何训练出既能读书写字又会唱歌跳舞,琴棋书画样样皆通的“强”人工智能,是一项很大的挑战。
DeepMind在这一领域作了一些尝试:
AlphaGo学习了人类棋手的经验数据,以4:1战胜人类超一流棋手李世石
AlphaGo Zero是零经验,利用自己与自己下棋产生的数据进行学习(本专栏后文将介绍此处用到的强化学习),以100:0战胜AlphaGo
AlphaZero横跨围棋、国际象棋、将棋,8小时训练战胜AlphaGo,4小时训练战胜可碾压当年“深蓝”的顶级国际象棋程序Stockfish,2小时训练战胜顶级将棋程序Elmo
然而,棋类领域的通用AI,还只算得上是通用人工智能走出的一小步......
回到OpenAI,这家公司提供了人工智能研究领域的成果、平台与工具。
Gym:提供了强化学习算法的训练环境。你可以创建自己的人工智能,零经验学习如何玩电子竞技游戏。(后文将作介绍这一非常有趣的领域)
Universe:提供了一套通用性问题的训练环境。它将人类世界的一类问题,抽象为观察(屏幕像素等)、操作(键盘、鼠标等)、激励(游戏得分、任务成功等信息)的通用界面,智能代理可以像人类使用电脑一样,经由通用界面,与待解决问题进行交互。
领取专属 10元无门槛券
私享最新 技术干货