BlockBeats 消息,5 月 15 日,谷歌今日凌晨召开「I/O 2024」年度开发者大会,发布了一款全新的 AI 代理(Agent)产品 Project Astra,可以像 OpenAI 发布的 GPT4o 一样,实现跨文本、音频、视频多模态实时推理。还推出了 Gemini 1.5 Pro 的更新,其人工智能模型很快将能够处理更多数据,以及新的更小的 Gemini 1.5 Flash AI 模型。此外谷歌还发布了用于生成高清视频的最新模型「Veo」,以及最高质量的文本到图像模型 Imagen 3,该模型承诺提供逼真的图像,并且「比我们之前的模型更少分散注意力的视觉伪影」。
领取专属 10元无门槛券
私享最新 技术干货