暂无搜索历史
本号经常会分享,比如 uv速查表 Linux 速查表 R 语言速查表 Gemini CLI 速查表
在大规模生产环境中,高效管理请求分发至多个模型副本至关重要。传统负载均衡器往往缺乏对 LLM 推理有状态特性(如 KV 缓存)的感知,无法处理复杂的服务模式(如...
** 🔥 亮点**: ⚙ 模型参数:总参数 309B,激活参数 15B。 🏗 混合注意力:5:1 交错的 128 窗口 SWA + 全局 | 256K 上下...
前文我升了 CUDA、部署了 DeepSeek-OCRDeepSeek-OCR 本地部署(上):CUDA 升级 12.9,vLLM 升级至最新稳定版 DeepS...
在人工智能飞速发展的今天,有一本书早在2006年就已问世,却始终屹立不倒,被全球学者奉为经典,称为机器学习的“圣经”。它就是克里斯托弗·毕晓普(Christop...
最近的 OCR 大模型我都做了本地部署和测试,还写了一个 API 统一对接这三个模型
DeepSeek-OCR 本地部署(上):CUDA 升级 12.9,vLLM 升级至最新稳定版
DeepSeek-OCR 开源有段时间了,我曾详细测试过DeepSeek 最新开源 OCR 模型,实测,也推荐过基于它的 web 端应用:一个强大的开源 OCR...
Kimi 真能打 DeepSeek R1 吗?实测我用相同的几个题目测试了 DeepSeek R1、Kimi K2 Thinking、Qwen3-Max、文心一...
官方特别说明:云端模型仅在 Ollama 的云平台上可用,运行时会明确显示正在连接到 Ollama 的云平台。这是与 Google 合作,使用 Google C...
Unsloth 出圈是 DeepSeek-R1 爆火的时候,它发布了最小 1.58 位量化版本的 R1,把 DeepSeek-R1 这个非常大的模型(它有 67...
Gemini 3 来的还有点静悄悄,最开始只是 i 流传出一个 Model Card,几乎在所有基准测试中拿下第一
GitHub 发布的 2025 年度开发者趋势报告一文中提到 2025 年最热门的项目分布在 AI 基础设施(vllm、ollama、huggingface/...
再也不用担心找论文选题找到头秃了!我算是发现了:时间序列才是最香的发文风口!这两年顶会对这方向可以说越来越关注,特别是ICLR和AAAI,时间序列相关的论文接收...
https://github.blog/news-insights/octoverse/octoverse-a-new-developer-joins-gith...
今天我们来深入探讨物理信息神经网络(Physics-Informed Neural Networks, PINN)——这个结合深度学习和物理规律的新兴技术,正在...
Ollama 背后执行推理的核心技术其实是由 llama.cpp 承担的,GGUF 模型格式也是由 llama.cpp 的作者所开发。
《构建世界级语言模型的实战指南:先进语言模型训练背后的挑战、决策与现实》:https://huggingface.co/spaces/HuggingFaceTB...
https://www.geoffreylitt.com/2025/07/27/enough-ai-copilots-we-need-ai-huds
之前介绍并测试过 DeeoSeep 最新开源 OCR 模型的 Latex 公式识别能力:DeepSeek 最新开源 OCR 模型,实测,不如百度,然后介绍了一个...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市