首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具

机器之心

专栏成员
9695
文章
7388304
阅读量
288
订阅数
推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确
当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大学伯克利分校与艾伦人工智能研究所突然扔出了一颗深水炸弹:别再卷 token 了,无需显式思维链,推理模型也能实现高效且准确的推理。
机器之心
2025-04-21
240
一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型
该版本经过量化感知训练(Quantization-Aware Training,QAT)优化,能在保持高质量的同时显著降低内存需求。
机器之心
2025-04-21
590
语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音,更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。这一突破性进展的背后,是大规模语音数据的积累和大模型技术的快速发展。
机器之心
2025-04-21
290
从国家级实验室前沿技术到聚焦能源智能化落地,中科类脑获国家级产业资本亿元投资
「 AI 的尽头是能源!」马斯克与 Sam Altman 的隔空对话,将能源革命与智能革命的交汇点推向全球视野。当前,这一进程正在中国加速。
机器之心
2025-04-19
520
Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来?」
机器之心
2025-04-19
1210
AI应用创业公司:大模型最近的突破,全是作弊
「AI 大模型自去年 8 月以来就没有太大进步」。这是一位 AI 创业者在近期的一篇博客中发表的观点。
机器之心
2025-04-19
400
CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原
视频人物抠像技术在电影、游戏、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复杂背景和多目标干扰时,如何实现一套兼顾发丝级细节精度及分割级语义稳定的视频抠图系统,始终是个挑战。
机器之心
2025-04-18
1230
以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
基于大语言模型,智能体具备自主思考、规划,调用工具并处理复杂任务的能力,且无需依赖人类明确的驱动指令。在底层技术持续突破的当下,智能体正在重塑人机交互方式。
机器之心
2025-04-18
1090
何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
完整排名地址:https://www.nature.com/magazine-assets/d41586-025-01125-9/50860378
机器之心
2025-04-18
560
72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
作为公认的新范式,它可以让整个智能驾驶系统反应更快,更加拟人,能处理以往方法无法解决的大量 corner case,被认为是自动驾驶通向 L3、L4 的正确方向。
机器之心
2025-04-18
350
JHU提出最强ToM方法,AutoToM横扫五大基准
心智能力(Theory of Mind, ToM)是指通过观察他人的行为来理解他们内心想法的能力,这一能力对开发具备社会智能的智能体至关重要。
机器之心
2025-04-18
600
「开源版GPT-4o」来了!这个17B国产模型生图效果比肩4o,还可商用
前段时间,GPT-4o 火出了圈,其断崖式提升的生图、改图能力让每个人都想尝试一下。虽然 OpenAI 后来宣布免费用户也可以用,但出图慢、次数受限仍然困扰着没有订阅 ChatGPT 的普通人。
机器之心
2025-04-16
1350
免费用!阿里通义大模型上新,超逼真音视频生成SOTA!
近日,阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker,只需上传一段参考视频,不仅能学会视频中人物的表情和声音,还能模仿说话风格。相比传统的数字人生产流程,该方法能够有效降低制作成本,提高生成内容的真实感和互动体验,满足更广泛的应用需求。目前该项目已在魔搭社区、HuggingFace 开放体验入口,并提供了十多个模板,所有人可以直接免费使用。
机器之心
2025-04-16
1330
30年悬案告破,平均曲率流的奇点真相曝光,揭晓「冰块融化」的数学秘密
一块冰块漂浮在水中,随着时间推移,它会逐渐融化成一个微小的冰粒,最终完全消失。在这个过程中,冰块表面变得越来越光滑,所有不规则形状和锐利边缘都会逐渐消失。
机器之心
2025-04-16
580
更长思维并不等于更强推理性能,强化学习可以很简洁
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。
机器之心
2025-04-15
860
过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
赵俭,北京邮电大学本科三年级,研究方向为大语言模型。刘润泽,清华大学硕士二年级,师从李秀教授,研究方向为大语言模型与强化学习,特别关注大模型推理能力增强与测试时间扩展,在 NeurIPS、ICML、ICLR、AAAI 等顶级学术会议发表多篇论文,个人主页:ryanliu112.github.io。
机器之心
2025-04-15
600
中科大、中兴提出新后训练范式:小尺寸多模态模型,成功复现R1推理
本文第一作者为邓慧琳,中国科学技术大学硕博连读四年级,研究方向为多模态模型视觉理解、推理增强(R1强化学习)、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。
机器之心
2025-04-15
980
不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型
我们知道,如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。
机器之心
2025-04-13
2150
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。
机器之心
2025-04-13
490
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
近日,LLM360 推出了 MegaMath:全球目前最大的开源数学推理预训练数据集,共计 3710 亿(371B)tokens,覆盖网页、代码和高质量合成数据三大领域。
机器之心
2025-04-13
1010
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档