首页
学习
活动
专区
圈层
工具
发布

#数据

24: 2026 推理工程师能力矩阵:多模态扩展层

安全风信子

作者:HOS(安全风信子) 日期:2026-01-18 来源平台:GitHub 摘要: 2026年,多模态大模型已成为主流,能够同时处理文本、图像、音频等...

600

电脑空间告急?一键清理攻略+超强工具推荐!

gavin1024

数据显示,65%的用户因硬盘爆满导致工作效率下降。当系统提示"存储空间不足"时,盲目删除文件不仅治标不治本,还可能误删关键数据。本文结合权威评测与实战经验,为您...

1400

当黄仁勋将存储定义为「AI运行内存」,基础设施该如何实现物种进化?

机器之心

一根 256 GB 内存条标价 5000 美元?这个价格已经轻松超过了英伟达顶配显卡 RTX 5090 的市场溢价。

1100

从平面几何出发:形式化验证如何驱动MLLM的推理能力跃迁

机器之心

在迈向通用人工智能(AGI)的征途中,多模态大语言模型(MLLMs)虽然在视觉理解与文本生成上展现了惊人的能力,却始终面临一道难以逾越的鸿沟:如何在复杂的数学与...

1100

机器人终于「懂」家务了!伯克利MomaGraph让机器人像人一样做家务

机器之心

想象这样一个日常画面:你吩咐家用机器人「烧壶开水」,它却当场卡壳——水壶在哪?该接自来水还是过滤水?先插电还是先按开关?水开了又该如何判断?这些对人类而言像呼吸...

2000

VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物

机器之心

这一数据集的构建,填补了真实世界 4D 几何控制数据的空白,为模型的训练提供了坚实的基础。

1000

开源8300小时标注数据,新一代实时通用游戏AI Pixel2Play发布

机器之心

随着人工智能在代码以及图片生成方面日益成熟,越来越多的研究人员也开始关注 AI 模型在游戏领域中的表现。实际上,游戏在 AI 的发展早期就已经是一个重要的研究方...

900

大模型听懂语音却反而变笨?港中深与微软联合解决语音大模型降智问题

机器之心

这是最主流的做法,即通过监督微调(SFT)利用静态的 “语音 - 文本” 数据对进行训练,或者通过知识蒸馏(Distillation)让文本分支作为 “老师” ...

1300

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

机器之心

Self-E 用同一个网络在两种「模式」下工作:一方面像 Flow Matching 一样从真实数据学习分布的局部结构;另一方面用「模型自身正在学到的局部估计」...

1300

Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

机器之心

众所周知,互联网上的高质量文本数据正在接近枯竭。对于自回归(AR)模型来说,通常我们只让模型把数据「看」一遍(1 Epoch)。如果让 AR 模型反复在同一份数...

1200

端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统

机器之心

一个智能驾驶系统,在迈向高阶自动驾驶的过程中,应当具备何种能力?除了基础的感知、预测、规划、决策能力,如何对三维空间进行更深入的理解?如何具备包含法律法规、道德...

1400

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

机器之心

假如你是一个致力于将 AI 引入传统行业的工程团队。现在,你有一个问题:训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业...

600

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

机器之心

“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”

1400

Flink源码阅读:Kafka Connector

Jackeyzhe

LookupTableSource:LookupTableSource 不会全量读取表的数据,它在需要时会发送请求,懒加载数据。目前只支持 insert-onl...

900

「生成式AI前沿观察」:办公革命、医疗突破与技术伦理的十字路口

90后小陈老师

Anthropic针对性推出符合HIPAA(美国医疗信息隐私法案)标准的医疗级AI服务,允许医院、医疗机构及个人用户合规处理受保护的健康数据。其核心亮点是“数据...

800

DeepSeek AI助手完全使用指南:从小白到高手的效率进化论

用户1241275

🌟重点功能抢先看:注册3分钟即用 | 代码自动生成 | 论文降重神器 | 日报自动生成 | 私人知识库搭建

600

腾讯技术面:数据库核心八股终极典藏版

腾讯云开发者

国内云厂商从2010年左右正式推出云服务开始,关系数据库作为核心产品,18年以前聚焦于传统关系型数据库如何更好的上云托管,提供开箱即用,以及企业级的高性能、高可...

1600

复盘2025:在WAF的缝隙里开出花来(附EDU通杀0DayPOC)

逍遥子大表哥

中国XX集团的站群,前台参数cart,后台参数username(借助宽字节绕过转义)。username处有SQL报错返回。

900

凯哥 丨 AI 进入存算解耦的新纪元

凯哥

凌晨,大贵刷到一篇 arXiv 新稿,标题拗口得像论文界的“冷启动广告”: 《Conditional Memory via Scalable Lookup: A...

1600

块存储、文件存储与对象存储的多维度技术差异对比,包含架构解析

ICT系统集成阿祥

核心优势:支持海量数据(PB级以上)的无限扩展,元数据丰富(可自定义业务属性);通过RESTful API/SDK实现跨平台、跨地域访问,适配云原生、大数据应用...

800
领券