首页
学习
活动
专区
圈层
工具
发布

#model

Prefill Decode分离部署大模型(dynamo框架)

Michael阿明

NVIDIA Dynamo 是一个高吞吐量、低延迟的推理框架,旨在为多节点分布式环境中的生成式 AI 和推理模型提供服务。Dynamo 设计为与推理引擎无关(支...

15810

特斯拉要求美制车型零部件“去中化”,目标两年内完成

芯智讯

11月15日消息,继美国通用汽车被传出要求供应商排除中国零部件之后,电动汽车大厂特斯拉也被曝要求在美国制造的车型排除中国零部件,目标是在未来两年内完成过渡。

11610

dify源码分析(1)

golangLeetcode

在本地部署完dify后Dify使用deepseek,我们发现启动了10个容器,我们先从这10个容器的功能开始探索dify的源码

14210

golang源码分析:langchaingo(2)

golangLeetcode

接着我们看下提示词补全的调用是如何实现的github.com/tmc/langchaingo@v0.1.13/llms/llms.go

11710

如何分析临床纵向数据:研究目的及分析方法

医学和生信笔记

临床中有很多对同一群体多次重复测量的纵向数据,如果能充分利用,其提供的信息和价值远远超过横断面数据。然而纵向数据的分析并不简单,需要根据实际情况综合考虑。本文主...

10910

R语言对数线性模型

医学和生信笔记

在一些生物医学研究中,很多时候反应变量不符合正态分布的假设,或者反应变量为属性变量或离散型变量,往往需要借助于广义线性模型(generalized linear...

10210

Ilya Rice: How I Won the Enterprise RAG Challenge

AlphaHinex

Just like humans, LLMs handle complex problems better when breaking them down in...

12610

特斯拉将搭载豆包大模型和DeepSeek大模型

春哥大魔王

8月22日,字节跳动方面发布消息称,特斯拉与火山引擎已于近日达成合作,在国内,火山引擎将为特斯拉提供大模型服务,助力特斯拉智能座舱交互体验升级。 全新上市的特...

16010

智能定义:从物理第一原理设计智能生态系统 “Model evidence is all you need”

CreateAMind

Designing Ecosystems of Intelligence from First Principles

12310

层次推理模型 Hierarchical Reasoning Model

CreateAMind

另一类方法是神经采样模型(neural sampling models)92,它将神经信号过程视为在概率分布上的推断,其工作机制类似于玻尔兹曼机。这类模型通常需...

10810

特斯拉Robotaxi在o奥斯丁的运营范围超过了Waymo

春哥大魔王

从运营范围来说,特斯拉在奥斯汀的“一夜间”的进展就超过了Waymo数年的筹备和付出。

8610

Model Context Protocol (MCP) C# SDK v0.9.0-preview.1 发布

张善友

在对 modelcontextprotocol/csharp-sdk 发布版本 v0.9.0-preview.1 进行了深度的切片式解剖与全面架构审查之后,本报...

29610

J. Chem. Inf. Model. | 加速肽类药物研发!中南大学董界等: 全新的多肽 ADMET系统评估智能预测平台

DrugOne

今天介绍一篇来自中南大学湘雅药学院在 JCIM上发表的最新成果。论文通讯作者为曾文彬教授、董界副教授。近年来,肽类药物研发的关注度持续提升,然而多肽ADMET的...

24320

25:【HuggingFace】model下载超级慢 / ConnectionError → 国内镜像 & hf.co缓存

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年HuggingFace模型下载慢和...

1K10

54. vLLM 核心模块逐文件:model_runner.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入解析vLLM核心模块model_runner.py,揭示其...

27210

50. Harmony Format 解析:vLLM的统一 token 化方案

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析了Harmony Format在vLLM中的设计原理、...

13010

【阅读笔记】Winscale: An Image-Scaling Algorithm Using an Area Pixel Model

AomanHao

论文提出“area pixel model”:把像素视为具有均匀光强的正方形小瓦片;面积守恒、能量守恒,更符合图像采集物理过程。

14410

特征重要性分析的常见误区

安全风信子

作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 特征重要性分析是机器学习模型调试和优化的重要工具,但在实际应用中存...

15410

正则化到底在惩罚什么:安全复杂度控制中的惩罚机制

安全风信子

作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 正则化(Regularization)是机器学习中控制模型复杂度、...

11610

偏差-方差权衡的工程解释:安全攻防中的模型稳定之道

安全风信子

作者:HOS(安全风信子) 日期:2026-01-09 来源平台:GitHub 摘要: 偏差-方差权衡(Bias-Variance Tradeoff)是机...

14910
领券