先说说GPT4这轮更新,这轮更新我们称之为”turbo“更新吧。
先上我们认为比较全面客观的SUPERCLUE测评结果。
由于GPT4-TURBO多项测试满分,所以,这个分数只是测试的上限,不是模型的上限。GPT4-turbo的真实能力上限可能更高。
至于国产模型,我懒得说了。
知乎上有个帖子,大家可以去看。
还是回到满是干货的GPT4-TURBO。
目前在ALPHA版本里面,我们已经看到各种神操作,比如体育解说员、游戏解说,APP生成器,网站生成器等等。
我们虽然还没有用到alpha能力,但GPT4-TURBO还是能用到的。那么,我们来上点真实任务的测试吧。
比如,可以直接输入PPT,然后让它输出讲稿。。
(同样声称能做到的有WPS AI,大家可以试试,反正我从来都做不到)
做文档分析,当然也是非常强悍的。而且,我们上面的任务不仅仅是分析,而是让它真正的理解文档,并基于文档的思路构建量化指标!
做过量化的同学们可能会深感震撼!因为这活放到过去,满打满算一整天都未必干得好!
他还会构建一个一个数据集,去逐步完善整个代码。
这些内置的工作能力,都是近期创业公司在AGENT层面上的创新方向。
但是,很显然的是,GPT4-TURBO一出,很多还在工程阶段的创新,实际上在效果上已经落后了。很多讲故事的项目DEMO才刚做完,还没来得及讲故事,就已经被GPT4的升级版把实用级别功能拍死在沙滩上了。
从这个角度来说,GPT4一方面支持了创新的爆发,另一方面又压制了很多创新的泡沫化。
如果从估值来看,我们会看到GPT4让很多小项目的收益预期函数变得非常不稳定,GPT4本身可以支持很多创新快速迭代,因此小项目的存活期很短。
最典型的是AI绘画领域,去年还惊为天人;今年此时已经烂大街了。而很多基于简单技术构造的应用,也完全达不到过去的逻辑下所构想的天花板。
这就是MAAS时代的新商业逻辑,模型端能力成为了极其重要的商业竞争力主核,以前依靠在应用端另辟蹊径的聪明人们,会惊讶的发现,单一功能性的”smart“,已经不足以维持强大的竞争力。
所以,这就要求创新者更快找到规模增长的密钥,尽快踏入变现直接相关的环节。拼的,仍然是眼力和执行速度。
大模型测评
每月50块的文心一言4.0VIP会员来了!它能取代GPT4吗?
想让它全自动做漫画?还早!——本地试用国产多模态大模型浦语·灵笔实录
【普通人用AI】三大国产AI APP,能画图能语音对话,哪个更适合当你的数字助理?
你的AI大模型自由已来!中国大模型全面开放,谁能超越GPT4?
GPT4如期升级!可以搜索,可用插件,来感受单纯的强大吧
昆仑天工模型实测体验:优点不够突出,限制比较明显
【长测】真干活行不行?国产大模型们和chatGPT结合AI绘画的真实工作体验
领取专属 10元无门槛券
私享最新 技术干货