发布

机器之心

专栏成员
9541
文章
7249741
阅读量
286
订阅数
英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。
机器之心
2025-03-06
00
大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。
机器之心
2025-03-06
10
大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达
该论文的第一作者是清华大学计算机系研究生温佳鑫,蚂蚁技术研究院副研究员关健为共同第一作者。
机器之心
2025-03-06
10
半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题
故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay conjecture),这是数学群论中最大的未解难题之一。
机器之心
2025-03-04
340
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
本文是北京大学彭宇新教授团队在多轮交互式商品检索的最新研究成果,已被 ICLR 2025 接收并开源。
机器之心
2025-03-04
570
DeepSeek推出后,移动端AI风向要变
DeepSeek R1 正在对整个科技领域产生巨大影响,颠覆人们有关 AI 的认知。在移动端,革新正在快速发生。
机器之心
2025-03-04
350
多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%
近段时间,DeepSeek R1 推理模型引爆了国内外社交媒体,让人们见识到了大语言模型类人的深度思考能力。
机器之心
2025-03-04
420
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。
机器之心
2025-03-04
440
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。
机器之心
2025-03-03
1040
千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?
两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?但当他们确认彼此的 AI 身份后,一切变得超乎想象了。
机器之心
2025-03-03
850
ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
现实世界的机器人距离科幻小说里的机器人世界还有多远?通用灵巧操控何时才能实现?朝着这一伟大的目标,研究通用灵巧操控轨迹跟踪的 DexTrack 便应用而生。
机器之心
2025-03-03
790
DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
就在所有人以为 DeepSeek 预告的 5 天开源告一段落时,今天中午 12 点 11 分,官方 𝕏 帐号再次更新,宣告「开源周」还在继续。不过这第六天 DeepSeek 并没有开源新的软件库,而是介绍了 DeepSeek-V3/R1 的推理系统。
机器之心
2025-03-03
470
16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
昨天,芯片巨头 AMD 举办了最新发布会,正式发布了最新的 AMD RDNA 4 图形架构,并推出了采用该架构的 Radeon RX 9000 系列显卡,包括 RX 9070 和 RX 9070 XT 两个型号。这意味着,中高端显卡市场迎来了又一重量级选手,为玩家们提供了更多样的选择。
机器之心
2025-03-03
870
大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围
对于人工智能,有一个话题总会时而冒出来:「AI 是否或能否具有自我意识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab 和 Mila - 魁北克人工智能研究所等机构的一项研究却揭开了这神秘问题的一角。
机器之心
2025-03-03
350
ICLR 2025|AI不语,只是一味根据人类意图推理3D空间定位
图一:我们引入了 3D 意图定位(右),这一新任务旨在根据人类意图句子(例如:“我想要一个能支撑我的背部、缓解压力的物品”),在 3D 场景中通过 3D 边界框检测目标物体。相比之下,现有的 3D 视觉定位(左)依赖于人类的推理和参考来进行检测。该示意图清晰地区分了观察和推理的执行方式:左侧由人类手动完成,右侧则由 AI 自动完成。
机器之心
2025-03-03
480
开源的胜利!RISC-V与AI今日全面「会师」
DeepSeek 的爆火震撼 AI 行业后,也带动相关行业余震不断。其中,达摩院玄铁在春节期间宣布适配 DeepSeek-R1 系列蒸馏模型,引发半导体行业高度关注,新兴的开源指令集 RISC-V 在 AI 方向展现出强劲的动力。
机器之心
2025-02-28
690
谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
随着 AI 能力的提升,一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和,比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。
机器之心
2025-02-28
550
ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
文章全面探讨了大语言模型在预训练数据选择上的重要性,并提出了一种名为 DataMan 的数据管理器,用于对预训练数据进行质量评分和领域识别,以优化 LLMs 的预训练过程,本文由浙江大学和阿里巴巴千问团队共同完成。
机器之心
2025-02-28
1010
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
当前的 AI 领域,可以说 Transformer 与扩散模型是最热门的模型架构。也因此,有不少研究团队都在尝试将这两种架构融合到一起,以两者之长探索新一代的模型范式,比如我们之前报道过的 LLaDA。不过,之前这些成果都还只是研究探索,并未真正实现大规模应用。
机器之心
2025-02-27
970
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
2024 年底,微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型(SLM)。仅用了 40% 合成数据,140 亿参数的 Phi-4 就在数学性能上击败了 GPT-4o。
机器之心
2025-02-27
400
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档