暂无搜索历史
好久不更了,一怪我奇懒,二怪大模型太勤。大模型23年的热点就像那款口香糖是一浪接着一浪,我又习惯先搞清楚原理,结果这边刚读完论文那边就又来了新的,最后只能狗熊掰...
现在所有的生成模型(本来想严谨一点,加个“大语言模型”限定一下AOE,后来脑子快速过了一遍感觉不加也挺稳,欢迎打脸)都存在一个问题,就是“幻觉”问题。
最近好像又开始了新一波的Ai焦虑,刚开始我会把这些现象归结为“公号文章看多了”,有些公号确实故意夸大Ai的本事,导致很多行业都在担心自己的工作会不会被Ai替代,...
最开始ChatGPT刚出来的时候,我们都以为未来NLP甚至AI的开发范式是:巨头炼丹,虾米调参。总之,后端模型从此与散户无缘 。
未必所有人都知道Llama是什么。Llama是买它AI(MetaAI)推出来的开源大语言模型,所谓开源,主要是指开放模型结构和权重文件,有了这些,既可以直接使用...
今年AI大热,AIGC、大模型、AGI以及FLOPS等等让人半懂不懂的词不断在各种头条新闻中出现,想学这方面内容,该怎么入手呢?
AIGC是现在很火的一个概念,每天都有新闻,很多人都在谈论,但昨天听机工社郭老师直播我才突然意识到,“什么是AIGC”本身反而介绍很少,有一点名可名非常名的味道...
现在大语言模型大热,一会儿语言模型一会儿自然语言处理的一下容易搞不清楚,这里的“语言”又和语言学有什么关系,这篇就来捋一捋。
这俩月我一直在想俩问题,一个是为什么这俩月突然多了这么多国产LLM,另一个是这么多国产LLM有什么区别。
最近这段时间上了很多大语言模型,有企业的也有开源的,性能提升肯定是有的,只是总感觉名字千变万化,功能不离其宗,过去——其实就是不到两个月前——那种一天刷好几次邮...
我之前已经写过很多ChatGPT和大语言模型门槛的文章,譬如说算法,包括模型结构和训练方法,譬如说高算力,譬如说大数据。除此之外还有种种工程细节。
ChatGPT大杀特杀以后,最常问的问题之一就是能不能替代搜索引擎。最初我的回答是“不能”,现在我的回答同样是“不能”。
ChatGPT出来以后很多人都在说开源,认为只要OpenAI大发善心或者哪个高超的黑客黑进服务器,把ChatGPT的源码发出来放到网上,那么到不了第二天天亮,全...
ChatGPT刚出来的时候,很多人说OpenAi这次将谷歌打得措手不及,对于这个观点,我并不赞同。我一直认为谷歌的AI水平应该是业界的领头大哥,不是因为我是谷粉...
这次GPT-4发布可谓万众瞩目,最重要的升级就是多模态,也就是不止支持文本,还支持图片了。
这也算是个老话题了。最开始在AI生成代码,大家都在关心码农转行是该开滴滴还是送外卖的时候,就有人说自己放在Github上的代码被AI抄袭了,圈内讨论过一阵为了训...
Ai绘画在不同人眼里关注点可能完全不同,我研究AI,在我看来,AI绘画是多模态在技术和应用两方面都一举取得里程碑式的成果。这个成果不发展下去,实在是太可惜了,毕...
ChatGPT一出来,一堆搞NLP的立马哭了。为什么?不该问为什么哭,而该问为什么还不哭。
在人工智能领域,自我意识是个很重要的话题,哪怕不是人工智能的终极目标,至少也是重要目标。但是,很难。现阶段我们连意识如何运作都还一头雾水,再谈人工触发只能是一本...
ChatGPT真的很火,真的。虽然ChatGPT两个月前发布就已经让我大受震撼,但年后突然涌出一大批ChatGPT的介绍文章,一看发布者,居然全是荐股号、投资号...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市