暂无搜索历史
最近在做知识卡片时遇到了一个问题:我用 SVG 制作的精美卡片,里面用了 foreignObject 嵌入 HTML 内容来实现自动换行,效果非常好。
用 Claude Code 的朋友越来越多了,但配置这玩意儿属实有点劝退人。什么 ~/.claude/ 目录下一堆 JSON 文件,什么 MCP 服务器配置,稍...
vLLM 团队刚刚发布了一个重磅项目 —— vLLM Semantic Router v0.1 Iris,这是一个面向多模型协作(Mixture-of-Mode...
如果你一直关注 AI Agent 领域,可能听说过 MCP(Model Context Protocol),那玩意儿去年炒得火热。但今天我要说的是,Skills...
受Simons启发,制作了一系列html实现的小工具,最近整理了一下,做了个极简风格的工具箱门户。
今天给大家介绍一个我最近在用的 AI 编程神器 —— OpenCode。4.6万 Star,500+ 贡献者,每月被 65 万开发者使用。这货基本上就是开源版的...
HY-MT1.5(Hunyuan Translation Model Version 1.5)是腾讯混元团队推出的专业翻译大模型,包含两个版本:
vLLM v0.13.0 来了,对 DeepSeek 深度优化全模态大模型部署,vLLM-Omni 来了,100% 开源
今天给大家分享一个让我眼前一亮的开源项目——Presenton,一个完全本地运行的 AI PPT 生成器。说实话,市面上 AI 做 PPT 的工具一大堆,Gam...
我看官方部署文档,虽然模型文件只有 230GB,但是如果想要支撑更高上下文达到理想效果,所需显存还是蛮高的:模型权重 220GB+ 每百万 Tokons 上下文...
今天分享一个让我眼前一亮的工具——Quotio。如果你和我一样,同时订阅了 Claude、Gemini、OpenAI、Qwen 等多个 AI 服务,然后每天在各...
安装,简单实用,实测也写过文章:我给谷歌新开源的 Gemini CLI 打 99 分
上周初智谱 GLM-4.7、MiniMax-M2.1 同时发布最新旗舰大模型,我做了简单实测,后来又拿国内外各家旗舰大模型做了设计、绘制圣诞树的测试,MiniM...
今天介绍一个让我眼前一亮的开源项目:Wren AI,一个 GenBI(生成式商业智能)Agent。
前文我介绍了vLLM v 0.13.0版本更新的内容,然后介绍了部署多模态/全模态大模型的vLLM-Omni简介及安装
vLLM 是我们公众号的常客了,几乎所有关于大模型本地部署的文章都是用 vLLM 启动的
本号经常会分享,比如 uv速查表 Linux 速查表 R 语言速查表 Gemini CLI 速查表
在大规模生产环境中,高效管理请求分发至多个模型副本至关重要。传统负载均衡器往往缺乏对 LLM 推理有状态特性(如 KV 缓存)的感知,无法处理复杂的服务模式(如...
** 🔥 亮点**: ⚙ 模型参数:总参数 309B,激活参数 15B。 🏗 混合注意力:5:1 交错的 128 窗口 SWA + 全局 | 256K 上下...
前文我升了 CUDA、部署了 DeepSeek-OCRDeepSeek-OCR 本地部署(上):CUDA 升级 12.9,vLLM 升级至最新稳定版 DeepS...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市