首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >2025十大技术博文:量子芯片与AI代理

2025十大技术博文:量子芯片与AI代理

原创
作者头像
用户11764306
发布2026-05-25 15:12:47
发布2026-05-25 15:12:47
210
举报

2025年度阅读量最高的十篇技术博文

从量子计算突破、机器人基础模型,到某机构Aurora数据库的演进以及代理式AI的进展,以下是2025年最吸引读者关注的技术文章。

一、Chronos-2:从单变量到通用预测

随着基础模型的出现,时间序列预测经历了变革,超越了从单个时间序列进行外推的传统统计方法。基于原始Chronos模型的成功(该模型在Hugging Face上已被下载超过6亿次),某机构研究人员推出了Chronos-2,旨在通过上下文学习以零样本方式处理任意预测任务。

完整Chronos-2流程:输入时间序列(目标变量和协变量)首先通过鲁棒缩放方案进行归一化,然后添加时间索引和掩码元特征。得到的序列被分割成非重叠的块,并通过残差网络映射到高维嵌入。核心Transformer栈对这些块嵌入进行处理,并生成与输入中被掩码的未来块相对应的多块分位数输出。每个Transformer块在时间注意力层和组注意力层之间交替:时间注意力层聚合单个时间序列内跨块的信息,而组注意力层在每个块索引处聚合组内所有序列的信息。与仅支持单变量预测的前代不同,Chronos-2可以联合预测多个协同演化的时间序列(多变量预测),并整合促销计划或天气条件等外部因素(协变量信息预测)。该模型的组注意力机制使其能够捕捉变量间的复杂交互,在历史数据有限的冷启动场景中尤其有价值。

二、某机构发布Ocelot量子芯片

量子计算长期以来承诺对某些问题实现指数级加速,但量子设备对环境噪声的极端敏感性限制了实际应用。某机构新的Ocelot芯片在应对这一挑战上取得了突破。Ocelot使用了基于“猫量子比特”(得名于薛定谔著名思想实验)的玻色子量子纠错技术。

传统量子纠错方法每个逻辑量子比特需要数千个物理量子比特才能达到可用的错误率,造成巨大的资源开销。Ocelot的创新架构在物理层面指数级抑制比特翻转错误,同时使用简单的重复码来纠正相位翻转错误。这种方法实现了接近1秒的比特翻转时间——比传统超导量子比特长一千倍以上——同时保持足够的相位翻转时间以进行纠错。其结果是:一个距离为5的纠错码总共只需要9个量子比特,而等效的表面码实现则需要49个量子比特。

三、代理式AI的科学前沿

随着代理式AI系统从概念走向现实,关于这些系统应如何共享信息和进行策略交互的根本性科学问题开始浮现。某机构学者Michael Kearns探讨了几个将塑造能够代表用户自主行动的AI代理发展的研究前沿。一个有趣的问题是:代理之间将使用什么语言进行交流?虽然代理必须用自然语言与人类沟通,但代理之间的通信在使用神经网络的“母语”——嵌入(即意义在表示空间中被表示为向量)时可能更高效。正如今天的网站以多种人类语言提供内容,我们可能看到一个“代理化网络”,其中内容被预先翻译成标准化的嵌入。

上下文共享提出了另一个挑战:代理必须平衡共享工作记忆的好处与隐私问题。当旅行代理与酒店预订服务谈判时,它应该分享多少关于你偏好的上下文信息,又应该保留多少财务信息?

四、Mitra:用于增强表格基础模型的混合合成先验

受大型语言模型在不同文本语料库上训练的启发,某机构研究人员开发了Mitra,一个完全在合成数据集上预训练的表格基础模型。Mitra背后的关键洞察是:合成先验的质量决定了模型泛化的能力。Mitra的训练混合体包括结构因果模型(将因果依赖图与概率方程相结合)以及流行的基于树的方法(如梯度提升、随机森林和决策树)。

作为AutoGluon 1.4的一部分发布,Mitra通过上下文学习展示了最先进的性能:当以中等数量的示例为条件时,它可以预测新数据集的标签,无需梯度更新或特定任务的训练。

五、数据库创新十年:某机构Aurora的故事

当某机构Aurora于2015年推出时,它承诺将MySQL的成本效益与高端商业数据库的性能相结合。关键的创新是将计算与存储解耦,这背离了传统数据库架构。通过将持久性问题转移到单独的、专门构建的存储服务,并将缓存和日志层卸载到可扩展、自愈的系统,Aurora解决了云计算中的核心约束:网络。这种面向服务的架构保护数据库免受性能差异和故障的影响,同时支持性能、可用性和持久性的独立扩展。

在过去十年中,Aurora持续演进。2018年推出的Aurora Serverless带来了按需自动扩展,让客户可以根据工作负载需求调整计算容量,使用包括超量预订、反应式控制和分布式决策在内的复杂资源管理技术。截至2025年5月,所有Aurora产品都已实现无服务器化:客户不再需要选择特定的服务器类型,也无需担心底层硬件、补丁或备份。

六、用于将文本转换为结构化数据的轻量级LLM

将非结构化或结构不良的数据转换为符合模式的干净记录,是医疗健康到电子商务等各个领域的关键任务。某机构研究人员引入了SoLM(结构化对象语言模型),这是一个轻量级专用模型,通过一种新颖的自监督去噪方法,训练生成特定模式的对象。关键创新是置信度感知的子结构集束搜索,它在键值对层面而非单个token层面应用集束搜索,使用单独训练的置信度模型来预测每个键值对的概率。这种方法显著提高了准确性,同时降低了幻觉风险。

七、使用生成式AI进行多模态信息检索

传统的基于嵌入的信息检索将查询向量与数据库中的每个可能的响应向量进行比较,随着数据集增长,这一过程耗时。某机构的GENIUS(生成式通用多模态搜索)模型采用不同的方法:它使用输入查询直接生成数据项的ID代码。在CVPR 2025上展示的GENIUS是一个多模态模型,其输入和输出可以是图像、文本或图像-文本对的任意组合。两个关键创新支撑了GENIUS的性能:语义量化和查询增强。

八、基础模型时代的科学

基础模型已经改变了语言和计算机视觉,但它们在计算流体动力学等科学领域的应用较为缓慢。某机构应用科学家Danielle Maddix Robinson探讨了基础模型在时间序列预测(包括单变量和时空数据)中的应用。科学基础模型面临大型语言模型所没有的挑战:严重的数据稀缺、不可违背的物理定律约束,以及在安全关键应用中进行鲁棒不确定性量化的需求。对于单变量时间序列,Robinson及其同事使用合成预训练数据来解决数据稀缺问题。对于天气预测和空气动力学等领域的时空预测,研究人员发现了不同架构在准确性和内存消耗之间的重要权衡。

九、某机构构建首个用于多机器人协调的基础模型

管理某机构履约中心数千个移动机器人的车队需要预测机器人的未来位置,以在分配任务和路线时最小化拥堵。某机构的DeepFleet基础模型学习从部署在履约中心和分拣中心的超过一百万个机器人收集的数十亿小时真实导航数据中预测机器人位置。与从多样化文本中学习通用能力的语言模型一样,DeepFleet学习通用的交通流模式,使其能够快速推断情况将如何发展,并帮助分配任务和为机器人规划避开拥堵的路线。研究人员实验了四种不同的模型架构——以机器人为中心、机器人-场地、图像-场地和图-场地——每种架构对基本设计问题给出了不同的答案。

十、揭开AI代理的神秘面纱

AI代理代表了生成式AI的一次飞跃,从聊天界面转向代表用户自主行动的系统——预订旅行、进行购买、构建软件。某机构副总裁兼杰出工程师Marc Brooker揭开了代理核心组件的神秘面纱,并解释了AWS的Bedrock AgentCore框架背后的设计选择。代理的核心是循环运行模型和工具以实现目标。用户提供目标;代理使用LLM规划如何实现它;代理根据模型的指令重复调用工具(数据库、API、服务),并在收到响应时更新其计划。但使此类系统在实践中工作需要复杂的基础设施。AgentCore使用Firecracker微虚拟机为每个代理会话提供安全、高效的隔离,启动时间以毫秒计,开销低至几兆字节。当所需操作没有API时,某机构的Nova Act支持计算机操作,允许代理通过指向和点击与任何网站交互。FINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2025年度阅读量最高的十篇技术博文
    • 一、Chronos-2:从单变量到通用预测
    • 二、某机构发布Ocelot量子芯片
    • 三、代理式AI的科学前沿
    • 四、Mitra:用于增强表格基础模型的混合合成先验
    • 五、数据库创新十年:某机构Aurora的故事
    • 六、用于将文本转换为结构化数据的轻量级LLM
    • 七、使用生成式AI进行多模态信息检索
    • 八、基础模型时代的科学
    • 九、某机构构建首个用于多机器人协调的基础模型
    • 十、揭开AI代理的神秘面纱
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档