自从阿尔法狗战胜一众围棋高手后,AI(人工智能)终会取代人类的阴云始终笼罩在人类社会上空,如今谷歌AI再一次以令人类在自认机器无法超越的视觉辨别能力上对人类发起了挑战。
近日,谷歌Arts & Culture在线博物馆计划实验室推出了一项新项目,LIFE Tags:利用“谷歌图像内容注释系统(Google’s Image Content-based Annotation ,简称ICA)”将库存超过400万张来自美国知名杂志《LIFE》的照片内容进行了像素级的分析和详细的标签标注。
“一图胜千言”的英文表述
《LIFE(生活)》杂志创建于1936年,创始人是著名的媒体巨头,出生在中国烟台的亨利·卢斯。他的成就还包括创办《TIME(时代)》周刊、《Fortune(财富)》周刊、《LIFE(生活)》杂志等。初版于1936年的《LIFE》第一次将图片作为信息的主要承载体,让照片的地位在新闻传播领域有效提升。经历了两次休刊后,2007年3月,《LIFE》杂志第三次停刊直至今日。这期间,20世纪大名鼎鼎的纪实摄影师如《胜利之吻》的作者阿尔弗雷德·艾森斯塔特、著名战地摄影师罗伯特·卡帕等等,都曾效力于此。
罗伯特·卡帕的代表作——《战士之死》
《LIFE》向来以高质量和大数量的图片报道著称,每期刊登至少50个图片版,但即便如此,也仅仅刊登了其浩如烟海的图片库的沧海一粟。超过600万张图片的库存,对生活细节记录之广泛和深入,时至今日也难有单一图片机构能够超越。如今有至少70万张《LIFE》的历史图片通过Gettyimages向全球授权,而在谷歌的Arts & Culture开放计划中,则向全世界个人开放了超过400万张承载了20世纪中叶最重要历史事件和生活片段的珍贵照片。
本次谷歌的实验室项目,就是以这400万张开放的图片作为样本,对照片的内容进行了详尽的基于画面的标签标注,向世人展示了谷歌强大的AI技术和深度神经网络应用能力。
在谷歌展示的示例中,一张排队的照片被神经网络识别出帽子、手套、报纸、女士外套、女士、绅士、鞋等元素,识别能力可谓令人惊讶。
AI分析介绍
在分析结果展示的TAGs列表页,谷歌为400万张图提取出了数千个(也可能是上万个)关键词,将相关的照片进行聚合,每个关键词后都有相关主题关联的图片数量。关键词中包括具体的物品名词如“板球”,环境名词如“餐厅”,在某些特定领域,例如汽车,展示了令人震惊的识别能力。
视频:LIFE Tags令人眼花缭乱的标签
劳斯莱斯词条甚至能够分辨出多达15款车型。
受制于人类生理极限和认知能力的限制,基于深度神经网络和机器学习的AI在图像识别领域有着人类无可比拟的优势。谷歌利用LIFE Tags这个小小的项目,向我们展示的不仅仅是这家公司在计算机科学领域高深的造诣,更进一步昭示了人类未来被AI所超越,似乎真的只是一个时间问题。
领取专属 10元无门槛券
私享最新 技术干货