首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

TurboQuant压缩算法是什么

jack.yang

TurboQuant是谷歌研究院(Google Research)在 2026 年初正式发布的新型向量压缩算法,该技术旨在显著降低大语言模型(LLM)和向量搜索...

2610

万字详解:谷歌研究院推出的TurboQuant压缩算法 —— 极致压缩如何重塑大模型推理的未来

jack.yang

2026 年,生成式人工智能已进入“长上下文时代”。从 Claude 3 的 200K tokens 到 Gemini 2 的 1M tokens,大语言模型(...

610

从业务架构视角看数字化转型:以跨境供应链自动化为例

老王聊企服

在当前的 B2B 存量竞争时代,“数字化转型”已从战略选修课转变为生存必修课。然而,脱离具体业务场景谈转型往往会陷入宏观叙事的误区。从业务架构师的视角来看,数字...

500

EdgeCrafter:10M 参数达到 51.7 AP,姿态估计超越 YOLO26-Pose——让紧凑 ViT 在边缘端一打三

CoovallyAIHub

边缘设备上的密集预测任务(目标检测、实例分割、人体姿态估计)至今仍被 YOLO 等 CNN 架构主导,紧凑型 Vision Transformer(ViT)即使...

1500

万字详解偏度(Skewness):数据不对称性的灵魂解码

jack.yang

本文将带您亲手触摸偏度的温度:🔹 为何收入报告必须标注偏度?🔹 为何右偏数据中“均值>中位数>众数”是铁律?🔹 为何小样本偏度值可能完全失真?——答案尽在手工推...

2510

什么是知识图谱补全?如何预测缺失的关系?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

3100

什么是知识图谱?实体、关系、属性分别是什么?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

1700

云端 Agent 架构实战:三大模型 Function Calling 能力横评与生产部署方案

用户12330412

在云原生 Agent 架构中,Function Calling 是连接大模型与后端微服务的核心桥梁。模型能否准确、稳定地生成工具调用指令,直接决定了 AI 应用...

5110

Transformer 架构:大模型时代的基石

jack.yang

在 Transformer 出现之前,处理序列数据(如文本、语音)的主流模型是 RNN(循环神经网络) 及其变体(如 LSTM、GRU)。但 RNN 存在两大致...

13820

RAG向量数据库如何实现增量更新?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

7010

RAG系统如何支持多模态检索?图文检索如何实现?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

9410

别人都在介绍 SAM 3,这个项目直接把它变成实时检测器:80 类 25 倍加速

CoovallyAIHub

SAM 3 发布后迅速成为视觉语言模型的热门话题,但一个实际问题随之而来:它每次只处理一个文本提示,要检测 N 个类别就要跑 N 遍完整推理,80 类 COCO...

10910

什么是Self-RAG?如何让模型自主判断是否需要检索?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

10610

RAG系统中如何处理多跳问答(Multi-hop QA)?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

8810

小模型 + OpenClaw,模型私有化的时代真正到来了

不做虫子

过去这一年,整个科技圈都在疯狂堆算力,搞“大模型军备竞赛”。千亿、万亿参数满天飞,似乎 AI 只有越做越大、在云端用庞大的算力集群跑着,才是唯一的出路。但这十年...

18010

🎨 Langflow:开发者构建 AI Agent 的“可视化 IDE”

jack.yang

在 2026 年的 AI 开发生态中,Langflow 已经从一个简单的 LangChain 可视化工具,进化为构建复杂 AI Agent 的全功能“可视化 I...

17710
领券