发布

新智元

专栏成员
8823
文章
6522946
阅读量
210
订阅数
阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑
它仅用320亿参数,便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1(370亿被激活)相媲美。
新智元
2025-03-06
50
智源BGE-VL拍照提问即可精准搜,1/70数据击穿多模态检索天花板!
近日,智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了原有生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最佳效果。
新智元
2025-03-06
30
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025
近年来,随着扩散模型的发展,风格迁移技术在文本引导的图像生成任务中取得了显著突破。
新智元
2025-03-06
50
全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理
就在刚刚,我们在未经监督微调的2B模型上,见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」!
新智元
2025-03-06
00
讯飞星火X1单挑满血版DeepSeek-R1,全国产算力单机部署!中国AI再下一城
时隔一个半月,星火X1在数学能力上大幅跃升,仅以70B参数规模,便追平了o1和DeepSeek-R1。
新智元
2025-03-04
530
台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?
就在刚刚,芯片代工巨头台积电计划在美国投资1000亿美元,这超过了公司之前宣布的一项650亿美元投资。
新智元
2025-03-04
520
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法
用户已经习惯于将大模型如ChatGPT、Llama-3-chat等当作聊天对象,然而在用户和聊天助手的会话中,有的用户提示(例如一些命令或请求)不能在一轮会话中结束,需要大语言模型和用户进行多轮会话。
新智元
2025-03-04
460
Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场
一大早,AI大神Karpathy发出质疑,「目前存在一种评估危机,我真的不知道现在该看哪些指标了」。
新智元
2025-03-03
760
历时6个月,Hugging Face开源LLM「超大规模实战手册」!200页3万字4000次训练
最近,Hugging Face发布了一个「超大规模训练手册」,教我们如何在GPU集群上训练LLM。
新智元
2025-03-03
730
超越人类!DeepMind强化学习新突破:AI在「我的世界」中封神!
DeepSeek R1与OpenAI o系列模型的爆发,掀起了人工智能领域的新一轮浪潮。
新智元
2025-03-03
720
小模型指导大模型!田渊栋等爆锤蒸馏:新方法更高效、更透明、更可控
「下一个token预测」(next token prediction,NTP)是大语言模型(LLMs)不断取得突破的核心技术。
新智元
2025-03-03
810
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。
新智元
2025-03-03
400
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。
新智元
2025-03-03
500
刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席
划重点:今天起,GPT-4.5会向所有ChatGPT Pro版用户开放,包括网页端、移动端和桌面端。另外所有付费开发者也能使用了。
新智元
2025-02-28
720
机器人诞生「运动自我意识」,哥大华人登Nature子刊:照镜子学会自我建模
「我们人类不能持续呵护机器人、为他们修理损坏的部件或调整性能的负担。机器人需要学会‘照顾’自己,才能真正发挥作用。这就是自我建模技术如此重要的原因。」
新智元
2025-02-28
880
超越DeepSeek推理,效率更高!斯坦福马腾宇新作:有限数据,无限迭代
大型语言模型的「推理能力」现在成了NLP皇冠上的明珠,其核心难题在于「缺乏高质量训练数据」,标注数据需要领域专家,成本非常高昂且难以扩展;现有高等数学论文和定理的数量也非常有限,远少于其他任务的数据源。
新智元
2025-02-28
800
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类
近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了,而且还在一众推理模型中,直接拿下了TOP 1!
新智元
2025-02-28
530
黄仁勋:感谢DeepSeek!英伟达财报破纪录,Blackwell开卖血赚800亿老黄笑疯
出人意料的是,英伟达2025财年第四季度,情况一片大好,并未受DeepSeek影响!甚至,还连创三大纪录。
新智元
2025-02-28
400
加速度计成本暴降1/400!哈工大首次突破精度、量程瓶颈|AAAI 2025 Oral
低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。
新智元
2025-02-28
930
AI未来的机遇与潜力在哪?世界经济论坛联合埃森哲、毕马威发布权威报告
随着科技浪潮的奔涌向前,人工智能(AI)已从前沿概念深度融入社会经济的方方面面,成为推动产业变革与创新发展的核心力量。
新智元
2025-02-28
1260
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档