

1、实时视频通话功能
OpenAI 的视频模式感觉就像 Facetime 这样的视频通话,因为 ChatGPT 会实时响应用户在视频中展示的内容。它可以看到用户周围的事物,识别物体,甚至记住自我介绍的人。在 OpenAI 的“12 Days of Shipmas”活动的一部分中,ChatGPT 使用视频功能帮助冲泡咖啡。ChatGPT 看到了咖啡用具,指示何时放入过滤器并对结果进行评论。
它也与谷歌 最近宣布的 Project Astra非常相似,用户可以在其中打开视频聊天,Gemini 2.0 将回答有关它所看到内容的问题,例如识别在伦敦街头发现的雕塑。从很多方面来看,这些功能都是 Humane Pin 和Rabbit r1等 AI 设备宣传的更高级版本:让 AI 语音助手回答有关它在视频中看到的内容的问题
2、共享屏幕
新的屏幕共享功能将 ChatGPT 从应用程序带入浏览器领域。
对于屏幕共享,三点菜单允许用户退出 ChatGPT 应用。他们可以在手机上打开应用并询问 ChatGPT 所看到的内容。在演示中,OpenAI 研究人员触发了屏幕共享,然后打开消息应用,请求 ChatGPT 帮助回复通过短信发送的照片。 值得一提的是,谷歌也有这个功能,包括上周微软发布的。
上周,微软发布了Copilot Vision 的预览版,Pro 订阅用户可在浏览网页时打开 Copilot 聊天。Copilot Vision 可查看商店网站上的照片,甚至可帮助玩地图猜谜游戏 Geoguessr。谷歌的 Project Astra 也能以同样的方式读取浏览器。
3、圣诞老人
为了增加趣味性,OpenAI 还在高级语音模式中推出了“圣诞老人模式”。新的预设声音听起来很像穿着红色西装的快乐老人。
与仅限于特定用户的新功能不同,“圣诞老人模式”现已向拥有移动应用程序、ChatGPT 网络版本以及 Windows 和 MacOS 应用程序高级语音模式访问权限的用户开放,有效期至 1 月初。
不过,与圣诞老人的聊天不会保存在聊天记录中,也不会影响 ChatGPT 的记忆。
甚至连 OpenAI 也感受到了圣诞气氛。
很好,现在我们来实操一下语音的功能,讲重点,这里我们以网页版的举例
1、我们登录网站,https://chatgpt.com/,进入之后点击语音模式

2、点击允许,我们选择圣诞老人
open AI比谷歌gemini2.0好的地方在于,它支持中文,并且能够以中文回复

接下来就是愉快的和gpt对话的时间了
除此之外,还可以进行视频对话功能,gpt能够识别人类图像和声音,并且能够记住10分钟前的内容,我们来看一下官方发布会的一些记录
比如,Kevin就开始给它出题了——要求它回忆大家身上的某些特征,并说出对方的姓名

比如戴着圣诞帽的人是谁?谁又戴着鹿角?

接下来就是一道难题,让Chatgpt帮忙指导手冲咖啡

我们可以见到,每一点,chatgpt都完成的非常完美
写在最后
随着科技的飞速发展,人们对于新兴技术的期待也日益高涨。在今天的直播中,虽然实时视频通话等新功能的推出在一定程度上满足了用户的部分需求,但整体执行与更新频率却似乎并未达到大家的预期。不少用户纷纷表示,他们期待已久的功能并未如期而至,这不禁让人感到一丝担忧。
用户体验至上,莫如是也