暂无搜索历史
我们推出Lumine,这是首个用于开发通用AI智能体的开放方案,能够在挑战性3D开放世界环境中实时完成长达数小时的复杂任务。Lumine采用类人交互范式,以视觉...
"文本思维"与"图像思维"范式显著提升了大语言模型 (LLMs) 和视觉语言模型 (VLMs) 的推理能力。然而,这些范式存在固有局限:(1) 图像仅能捕捉瞬时...
现代大语言模型主要通过显式文本生成(如思维链 (CoT))来训练其“思考”能力,但这将推理过程推迟到训练后阶段,且未能充分利用预训练数据。我们提出并开源了 Ou...
测试时扩展旨在通过增加计算资源来提升大语言模型 (LLM) 的推理性能。该领域的流行方法包括基于采样的测试时扩展方法,其核心机制是在推理阶段为单一输入生成多条推...
我们提出 QeRL,一种面向大语言模型 (LLMs) 的量化增强强化学习框架。尽管强化学习对大语言模型的推理能力至关重要,但其资源消耗大,需要大量 GPU 内存...
分层推理模型 (HRM) 是一种创新方法,它采用两个小型神经网络,以不同的递归频率运行。这种受生物学启发的技术,在数独、迷宫和 ARC-AGI 等复杂谜题任务中...
自 John von Neumann 和 Alan Turing 以来,计算系统与大脑的关联一直激励着先驱理论家。诸如大脑这类均匀无标度生物网络具有强大特性,包...
阿拉伯文档OCR (Optical Character Recognition) 因该语言的连笔书写、字体多样、变音符号及从右至左的排版方向而始终面临挑战。尽管...
OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling
基于强化学习 (RL) 的语言模型 (LMs) 后训练可在无需监督微调的情况下增强复杂推理能力,DeepSeek-R1-Zero 已验证此特性。然而,有效运用 ...
近年来,大量开源基础模型不断涌现,在诸多热门领域取得显著突破,其性能已逼近闭源模型。然而,在高价值但挑战性更强的科学专业领域,现状却是或仍依赖于专家模型,或通用...
大语言模型 (LLM) 在软件工程中的日益普及,亟需对其生成代码进行严格的安全性评估。然而现有基准存在明显局限:仅关注孤立代码片段、采用缺乏可复现性的不稳定评估...
我们推出 InternVL 3.5,这是一个全新的开源多模态模型家族,显著提升了 InternVL 系列在通用性、推理能力和推理效率方面的表现。其核心创新在于级...
我们推出 GLM-4.5,这是一个开源的混合专家(MoE)大语言模型,总参数量达 3550 亿,激活参数量为 320 亿,其特色是支持思维模式与直接响应模式的混...
大语言模型驱动的智能体(Agent)近年来在复杂任务上展现了惊人的能力——从多轮推理、跨工具调用,到信息检索与整合。然而,性能的提升往往伴随着成本的飙升:更多的...
思维链 (Chain-of-Thought, CoT) 提示技术已被证实能显著提升大语言模型 (Large Language Model, LLM) 在多类任务...
具备可验证奖励机制的大规模强化学习(RLVR)已证实其在挖掘大语言模型(LLM)单次推理任务潜力方面的有效性。在实际推理场景中,大语言模型常借助外部工具辅助任务...
图形用户界面 (Graphical User Interface, GUI) 定位技术将自然语言指令映射到精确的界面坐标以实现自主交互。现有强化学习方法采用二元...
LLM 刚开始火热的时候,有个词非常热门,叫做提示词工程,甚至有各种网文声称市面上可能会招聘大量的提示词工程师,当初在一些招聘网站上倒是也的确能搜索到这样的岗位...
大语言模型 (LLM) 的推理性能本质上取决于其所接收的上下文信息。本综述系统性地提出了上下文工程 (Context Engineering) 这一新兴学科领域...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市