首页
学习
活动
专区
圈层
工具
发布

#论文

DeepSeek 新视觉模型论文:以视觉原语思考让 AI 学会"指图说话"

勇哥AI笔记

DeepSeek 最新视觉模型论文《Thinking with Visual Primitives》(2026.05)。

600

90%的人只看到矩阵乘法,却不知道大模型偷偷藏了200年前的搬土问题和物理学相变

用户1493530

我在南开读软件工程硕士的时候,第一次认真推 Transformer 的注意力公式,盯着看了半天,心想这也太朴素了吧,就是矩阵乘法加一个归一化。但越往后学越觉得不...

5110

计算机科学领域有哪些里程碑式的发现或理论,深刻改变了我们的生活?

用户1493530

我挑了 8 个,按时间线串起来。不搞那种一人一句的百科式罗列,每个都往深了讲,讲到你能感受到这些东西为什么重要。

2010

植物当玩家,人类当观众:Plant.play() 的反直觉设计

mixlab

Shadow:挺有启发的一篇论文。当人类降级为观察者/解释者,系统反而能促成我们重新思考。

4010

AI修图修的是记忆:为什么我们愿意让算法改掉真实发生过的事

mixlab

听起来像在撒谎。但CHI 2026的论文结论很反直觉:大多数人觉得修改后的照片比原图更"真实"——不是因为接近客观事实,而是因为更接近主观感受。

3010

AI队友越能干,团队表现越差?这份研究的结果出人意料#CHI2026论文解读

mixlab

这听起来违反直觉,但最近一篇论文用实验数据验证了这个现象 —— 背后的原因更值得细究。

4010

教你 3 分钟搭建 AI 智能体到微信小程序(无需编码)

陈宇明

不管是写工作总结、朋友圈文案、小红书笔记、还是学生党写论文提纲,点开就能用,完全不用憋半天写不出一个字

28610

为什么 OpenClaw 会成为 AI 安全新战场:攻击面扩张与安全研究新浪潮

安全风信子

arXiv:2603.10387 是 2026 年第一季度发表的一篇重量级论文,由来自斯坦福大学、麻省理工学院和卡内基梅隆大学的安全研究团队联合撰写。论文题目为...

17820

我们和AI的每一次对话,都在加热城市

疯狂学习GIS

全球人工智能数据中心投入运营后,周边地表温度平均升高2°C。通过刻画AI算力扩张在地球表面刻下的热痕迹,我们发现可能有3.4亿人生活在这片"数据热岛"之中。

11710

首篇「Attention Sink」综述

Amusi

几乎所有 Transformer 都在做一件反常的事:把大量注意力集中到少数几个特定 Token 上。这不是 bug,而是 Transformer 固有的「注意...

11710

高校论文防AI代写:如何用AI生成识别服务守护学术诚信?

gavin1024

ChatGPT等AI工具的普及让大学生论文"AI代写"成为全球性难题。如何在不侵犯学生隐私的前提下,高效准确地识别AI生成的论文内容?本文分析高校面临的AI代写...

14110

让PLC听懂人话:大语言模型进军工业控制必读论文清单(收藏版)!

Hello工控

我们在做整个RealPLC产品时,需要引用的相关论文在这里分享给在研究LLM和PLC结合的朋友。

12310

DeepSeek-V4 深度解读:百万上下文背后的工程细节

deephub

1M token 上下文设置下,DeepSeek-V4-Pro 的单 token 推理 FLOPs 仅为 DeepSeek-V3.2 的 27%,KV Cach...

35710

时间序列预测增强方法总结:频域、分解、patch

deephub

避免过于激进地扰动整个频谱——那样做有把增强样本推出分布的风险,原论文对此有比较详细的讨论。不过在 TPS 论文 的统一比较里,Dominant Shuffle...

10310

没人整理过的 DeepSeek 进化史:25篇论文里的技术蜕变

勇哥AI笔记

DeepSeek Coder 不是后来的"论文版"(arXiv论文2401.14196于2024年1月才提交),而是2023年11月就作为模型发布了。

50310

一种大图小目标检测的思路:DINOv3预训练特征 + YOLO26检测头

javpower

DFL(Distribution Focal Loss)这个设计在2019年的论文里提的,用来解决边界框回归的问题。核心是把坐标建模成离散的分布,而不是直接回归...

42120

深度学习将会有一套真正的科学理论

DrugIntel

深度学习是当今最强大也最神秘的技术。神经网络能以超人水平完成视觉、语言、蛋白质折叠等任务,但我们没有统一的科学框架解释它为何有效。训练方法大多源自试错,超参数调...

26910

Nat. Mach. Intell. | 用线性复杂度捕捉分子世界的 超距感应 ——Euclidean Fast Attention

DrugIntel

分子动力学(Molecular Dynamics, MD)模拟是理解蛋白质折叠、材料相变、化学反应机理的核心工具。其准确性完全依赖于对原子间相互作用力的精确描述...

10510

AI 写的代码总让你觉得差点意思,是因为它在等你说这 5 件事

随机比特

腾讯 | 高级前端工程师 (已认证)

上周三晚上,我让 Claude Code 帮我写一个"读 csv,存进 Postgres"的脚本。

10910
领券