首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Google发布“AI全家桶”,强力回击GPT-4o

北京时间15日凌晨1点,谷歌召开年度Google I/O开发者大会。根据谷歌官方统计,在这场110分钟演讲中,谷歌CEO桑达尔·皮查伊(Sundar Pichai)提及AI的次数高达121次,同时推出了一系列以 AI 为核心的产品和服务,覆盖 AI 模型、AI 搜索、AI 语音助手、AI 芯片等多个方面。

虽然被OpenAI抢先一步发布了重磅新品演示,但谷歌做到了OpenAI还没能做到的事——率先发布人工智能(AI)搜索引擎。

25 年前,Google开启了搜索功能;这次,Google再次拓展了搜索的边界。在此之前,当用户在使用搜索引擎时,通常以文字或图片形式呈现。而如今,作为推动将生成式 AI 添加到搜索中的一部分,谷歌引入了一个新的转折点:搜索生成体验(SGE)。

据介绍,在最新Gemini的加持下,谷歌搜索将具备多步骤推理能力,可以一次性处理带有多个限制条件的长问题、帮助用户进行头脑风暴,并支持视频搜索,让用户通过拍摄视频来搜索解决方案,这些功能将先在美国推出,其他国家“很快”也会跟进。

同时,谷歌搜索还引入视频。Gemini会让用户上传演示其要解决的问题的视频,然后启动搜索在论坛和互联网的其他区域以找到解决方案。

另外,除了将Gemini能力加持到搜索引擎外,谷歌还将为Gmail应用程序提供一些有趣的新功能,包括长电子邮件线程的摘要。用户还可以直接与Gemini聊天,从整个收件箱中查找详细信息。

叫板OpenAI

同时,谷歌还带来最新、最先进的视频生成模型Veo和迄今为止质量最高的文本到图像模型Imagen 3,直接对标 Sora类型的视频生成技术和Dall-E文生图技术。

据介绍,Veo能够生成超过一分钟的高质量1080p视频,涵盖多种电影和视觉风格。Veo具备高级的自然语言和视觉语义理解能力,能准确呈现细节并捕捉情感基调。与之相结合的是Imagen 3,Google最高质量的文本到图像生成模型,Imagen 3 可以更好地理解自然语言、提示背后的意图,并结合较长提示中的小细节。

除了在文生视频模型方面与OpenAI的竞争外,谷歌在AI助手领域也展开反击。

在OpenAI推出能够实现人类级别响应的智能助手GPT-4o后,谷歌的AI智能体项目Project Astra也重磅登场。

在演示视频中,Astra能够通过手机摄像头或智能眼镜看到的内容来分析响应语音命令。它成功地识别出代码序列、为电路图提出改进建议、能够通过镜头“看到”伦敦国王十字区,并提醒用户智能眼镜的放置位置。

据介绍,谷歌在Gemini的基础上开发了Astra的原型,可以通过连续编码视频帧、将视频和语音输入组合到事件时间线中以实现更快地处理信息。通过语音模型,谷歌也强化了智能助手的说话能力,让其能够给出更快速的回应。

不过,在演示视频中,谷歌AI助手的回应速度似乎还是会比GPT-4o稍慢一些,语音所表现出的感情色彩也平淡一些。

皮查伊表示,谷歌计划从今年开始将Astra的功能添加到其Gemini应用程序及其产品中。不过,他也强调,虽然最终目标是“让Astra在公司的软件中实现无缝连接”,但该产品将被谨慎推出,并且“商业化之路将由质量驱动”。

Google的大模型底座

会上,谷歌还全面发布Gemini 1.5 Pro,可提供具有增强的性能和突破性、最高200万Token长文本能力,并且已经向全球开发者开放。

据悉,全新Gemini 1.5 Pro具有原生音频理解、系统指令、JSON 模式等,能够使用视频计算机视觉来分析图像(帧)和音频(语音)的视频,这使其具有人类水平的视觉感知。使用深度神经网络,Gemini 1.5可以以超人的精度识别图像(和视频帧)中的物体、场景和人物。

随后,谷歌推出全新Gemini 1.5 Flash模型。

DeepMind首席执行官 Demis Hassabis认为,成本问题一直是大模型开发的痛中之痛,某些应用程序需要更低的延迟和更低的服务成本。而为了解决这一痛点,谷歌推出Gemini 1.5 Flash 模型——比 1.5 Pro 更轻的模型,该模型旨在兼顾快速和成本效益。

“Gemini 1.5 Flash 擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等,”Demis称,谷歌创建 Gemini 1.5 Flash 是因为开发人员需要一个比 Gemini 1.5 Pro 更轻、更便宜的模型。

在硬件方面,谷歌将于今年晚些时候推出交付第六代数据中心AI芯片TPU Trillium。皮查伊表示,每块芯片的计算性能将比第五代提升4.7倍,谷歌通过扩大芯片的矩阵乘法单元(MXU)和提高整体时钟速度来实现这一目标。此外,第六代将比第五代芯片节能67%,谷歌还将Trillium芯片的内存带宽提高了一倍。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OhMMPHDUalHzcHNTftp1YVCA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券