暂无搜索历史
这次开源,可以发现很多更细节的内容,不过我就不过多介绍了,只是最令人失望的是,他的开源协议,禁止商用!!!
vLLM 是本号的常客,SGLang 写的不多,主要是我用它也不多,之前偶尔写过 SGLang 怎么用、跑什么模型,也比较浅
GPT-5.4 来了,Opus 4.6 来了,Gemini 3.1 来了,Grok 4 也来了
3 月份我连写了 vLLM 0.18 和 vLLM 三月四连发,假期发现 vllm v0.19.0 发了
昨天 Andrej Karpathy(斯坦福 PhD、OpenAI 创始成员、前特斯拉 AI 总监、CS231n(全球最火深度学习课程)缔造者)发了条长推,炸了...
想象一下,Claude Code 或者 Cursor 直接帮你发消息、拉日程、管待办……听起来是不是很爽?
Karpathy 最近搞了一个叫 autoresearch 的项目,一出手就在圈内炸了锅。
今天再来聊聊 vLLM 在 2026 年 3 月密集发布的四个重大更新——Semantic Router v0.2 Athena、NVIDIA Nemotron...
刚好这个周末,我的 Plus 额度也差不多耗光了,索性停下来,认真写一篇图文版入门。
今天不聊模型效果,聊一个非常致命的安全问题。就在昨天,AI 圈出了个大事,很多项目每天都在用的 litellm 被人下毒了!
想发大模型论文,却还在“模型规模”上打转?那你跟顶会大概率无缘了!研究风向已经变了, “能力深化与场景适配”才是王道。
还有个示例:Qwen3.5-4B 搜索了 20 多个网站,引用了其来源,并找到了最佳答案!
上周刚写完 vLLM v0.17.1 紧急补丁,修了一个让 Qwen3.5 越跑越蠢的隐形 Bug,v0.18.0 就来了。
HF-agent 是一个 HF CLI 插件,它使用 llmfit 检测用户的硬件并推荐他们可以实际运行的模型,然后使用最合适的模型启动本地 llama. cp...
本文实测 24GB 显存的 4090 单卡启动 Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF Q4...
我一直比较谨慎,这玩意权限实在太大,项目也不过半年,几十万行代码都是 AI 生成,甚至连review 都是 AI,马斯克这个 meme 很好的说明了普通人接入 ...
今天想和大家聊一个我觉得值得继续关注的项目:Violoop。如果你最近一直在看 OpenClaw,大概会发现,最近讨论重点已经变了。前阵子大家还在研究怎么装、怎...
你有没有过这种体验:用 Claude Code 写了一天代码,debug 了 3 个小时,好不容易搞定了,第二天打开项目——完全想不起来昨天到底改了啥、为什么这...
API 是 Agent 连接真实世界的接口,GitHub 上有个宝藏仓库,叫 public-apis[1]。41 万 + Star,是 GitHub 历史上最受...
小龙虾太火了,但是开源版 OpenClaw 太难配置了,它更适合国外用户的操作习惯。
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市