一.什么是Gemini?
上个月,谷歌宣布推出 Gemini 最新、最强大的人工智能模型,旨在与 OpenAI 的 GPT 正面交锋。Gemini 在构建时考虑到了多模态,这意味着它能够理解文本、图像、视频、音频和代码。
Gemini一共有三个版本。Nano 和 Pro 现在已经上市,“Ultra”将于明年初上市
一.
二.什么是Goohle AI Studio?
Google AI Studio是一个是一个免费的基于网络的工具,提供访问谷歌的人工智能生成模型,包括双子座。它可以让你轻松地测试谷歌的人工智能模型,并试验不同的场景和用例。GoogleAI Studio 允许您导出许多流行编程语言的代码,包括 Python、 JavaScript 和其他语言。
三.如何使用Goohle AI Studio?
让我们首先浏览一下 Google AI Studio 的用户界面,看看如何立即开始测试并为我们的应用程序生成代码。
先说第一件事!前往 Google AI 网站并使用您的 Google 帐户登录。
单击“在 Google AI Studio 中获取 API 密钥”后,您将被重定向到我们将创建第一个提示的主页。
单击“新建” (如下所示)后,您将有几个选项可供选择。继续并选择“自由格式提示”。它只是一个交互式文本区域,您可以在其中编写提示并从模型生成响应。
目前,Vertex AI Gemini API 和 Google AI Studio 支持以下模型:
好的,对于这个示例,我们将切换到Gemini Pro Vision模型并编写由文本和下面的图像组成的多模式提示:
Gemini 将处理文本提示,然后识别图像中的内容,然后根据给定的信息响应提示。
我们开始做吧:
什么在这种情况下,Gemini Pro Vision 犹豫了一下并做出了如下回应:
“纯素食者不食用任何动物产品,因此不会喝牛奶。可以订购植物性牛奶替代品,例如燕麦奶、豆奶或杏仁奶。”
我向 GPT-4 询问了同样的问题,这就是答案:
您提供的图片显示了一杯咖啡,饮料表面似乎有拿铁艺术。如果饮料是用牛奶制成的,则它不适合纯素食者,就像纯素食者一样不食用乳制品。然而,如果用来制作拉花艺术的牛奶是植物性替代品,例如豆奶、杏仁奶、燕麦奶或任何其他不含乳制品的牛奶,那么它就适合纯素饮食。”
总体体验下来觉得,还是先用GPT-4V吧