暂无搜索历史
GitHub 发布的 2025 年度开发者趋势报告一文中提到 2025 年最热门的项目分布在 AI 基础设施(vllm、ollama、huggingface/...
再也不用担心找论文选题找到头秃了!我算是发现了:时间序列才是最香的发文风口!这两年顶会对这方向可以说越来越关注,特别是ICLR和AAAI,时间序列相关的论文接收...
https://github.blog/news-insights/octoverse/octoverse-a-new-developer-joins-gith...
今天我们来深入探讨物理信息神经网络(Physics-Informed Neural Networks, PINN)——这个结合深度学习和物理规律的新兴技术,正在...
Ollama 背后执行推理的核心技术其实是由 llama.cpp 承担的,GGUF 模型格式也是由 llama.cpp 的作者所开发。
《构建世界级语言模型的实战指南:先进语言模型训练背后的挑战、决策与现实》:https://huggingface.co/spaces/HuggingFaceTB...
https://www.geoffreylitt.com/2025/07/27/enough-ai-copilots-we-need-ai-huds
之前介绍并测试过 DeeoSeep 最新开源 OCR 模型的 Latex 公式识别能力:DeepSeek 最新开源 OCR 模型,实测,不如百度,然后介绍了一个...
大型语言模型(LLM)在处理超长上下文时面临着巨大的计算和内存成本挑战,这严重限制了它们在文档理解、代码分析和复杂推理等关键应用中的潜力。传统的解决方案,如扩展...
这类是 Agent 入门时首先要理解的核心概念,直接决定系统的协作模式与应用场景。
多模型服务的挑战: 你有两个大语言模型,每个都能单独运行在GPU上,但无法同时加载。传统方案迫使您在两个不理想的选择中权衡:
6月MiniMax M1开源,原生支持 100 万 token 的上下文长度十分抢眼,刚刚MiniMax M2 开源了,感受了一下,还算优秀,除了TOP5级的实...
https://medium.com/@prathamgrover777/kv-caching-attention-optimization-from-o-n%...
现在的 AI 编程都在往命令行发展了,Claude Code、Codex CLI、Gemini-CLI、Qwen Coder 等等
之前偶尔关注智谱,是看到美国商务部把它列为实体清单,还有 OpenAI 点名它是全球战略的竞争对手
💥DeepSeek V3.2-Exp炸裂升级!长文本处理效率翻倍,API价格腰斩!
Ollama 发布新 app,文档聊天,多模态支持,可在 macOS 和 Windows 上使用
前文:DeepSeek 更新了,我更期待量化版介绍过 DeepSeek-V3.1-Terminus 升级修复之前“极”bug 并加强 Agent 能力之后,我就...
昨天大模型世界很热闹,其实最近新模型一直不断,尤其是 Qwen,中间我也有测试,时间紧张没有发文
今天给大家介绍一个由中国人民大学自然语言处理与信息检索实验室(RUC NLPIR)开发的高效RAG研究Python工具包 - FlashRAG。这个工具包专门为...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市