在今年(2026 年)初的几个月里,国内开发者社区爆发了一场让人津津乐道的“养虾热”——大家把部署和运行开源自驱型智能体 OpenClaw 戏称为“养龙虾”。从...
经过2024至2026年的残酷洗牌,开源大模型生态已彻底告别百团大战,形成了高度集中的寡头格局。选择Google Gemma、Alibaba Qwen与Meta...
在 2024 年底至 2025 年初,中国 AI 公司 深度求索(DeepSeek) 连续发布了其多模态大模型系列——DeepSeek-VL(后迭代为 Deep...
本节目标:理解什么是大语言模型,它是怎么来的,又能做什么。读完本文,你将对 LLM 拥有一个清晰的全景认知,并能跟上 2026 年的最新技术进展。
随着大语言模型(LLM)的普及,检索增强生成(RAG)技术成为解决大模型知识时效性、准确性问题的核心方案,通过引入外部知识库,为模型提供实时、可控的上下文,从而...
2026年4月29日,DeepSeek 官方在网页端悄然上线了“识图模式”,并配以标志性鲸鱼“摘下眼罩”的宣传图,宣告其多模态能力正式落地。此前,DeepSee...
在当今的商业语境中,“大模型(LLM)”三个字往往与算力霸权、顶尖算法科学家和动辄千万的硬件投入深度绑定。这种由巨头主导的叙事,在无形中构建了一道极高的心理壁垒...
显存占用 = 模型参数 × 量化位宽 + 上下文窗口 + KV Cache + 激活值
🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
HappyHorse-1.0 是阿里巴巴 ATH 事业群推出的首款 AI 视频生成模型,凭借在 Artificial Analysis Video Arena ...
如果你正在国内环境里使用 OpenCode,大概率会遇到一个问题:工具本身很好用,但模型 API 的接入、网络访问、账号额度和模型切换都比较麻烦。
多模态大模型是指能够同时处理和生成多种数据类型(如文本、图像、音频、视频等)的AI模型。典型代表包括:
无人机(UAV)正在从"能飞的传感器"变成"能听、能思考、能协作"的智能节点——前提是要把 LLM 和 MLLM 塞进机载资源受限、链路不稳的环境。由 Yous...
DeepSeek-V4预览版于2026年4月正式上线并同步开源,这是DeepSeek迄今最强大的模型系列。