1、Meta开源了新的人工智能“Image Bind”
Image Bind人工智能模型,可以将六种类型的数据链接到一个单一的嵌入空间中。
大多数生成式AI工具通常依赖于只能将两种类型的数据链接在一起的系统。例如,Midjourney通过将文本和图像中的信息链接在一起来生成图片。
但是Image Bind具有将图像、文本、音频、深度、温度和运动等六种数据绑定在一起并理解信息的能力。这类似于人类如何从单个图像中感知感官体验。
该模型目前只是一个研究项目,没有直接的实际应用,但它展示了未来的人工智能模型如何能够像人类一样产生多感官体验。
2、谷歌凭借其在人工智能领域的最大突破赢得了互联网。
谷歌I/O大会上,谷歌公布了他们最新的AI创新:
Gmail“帮我写”功能可以根据用户输入的提示建议和创建完整的电子邮件草稿。
地图的沉浸式视图允许用户在旅行前预览旅程,包括空气质量、交通和天气信息。
Google照片的“魔术编辑器”可帮助用户以更强大的方式编辑照片,例如重新定位主题、重建照片的缺失部分以及调整光线和颜色。
PaLM 2 模型:谷歌最新的语言模型,在具有改进的逻辑和推理能力的多语言文本上进行训练,并针对安全和医学知识等专业领域进行微调。
Gemini:Google的新多模式基础,在工具和API集成方面非常高效,旨在实现记忆和规划等未来创新。
Bard现在支持100多种语言的编码功能,它还可以直接与其他Google应用程序和第三方工具/扩展程序聊天。
每日AI靓图
领取专属 10元无门槛券
私享最新 技术干货