首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

​当AI开始自己造AI——从ForgeTrain到MiniCPM5-1B,一条跑通了的链路

IT蜗壳-Tango

如果你是开发者,你大概有过这种感觉:训练框架调来调去,优化好像到头了。如果你是技术管理者,算力成本年年涨,10%的训练效率提升就意味着真金白银的节省。如果你只是...

000

多智能体大模型钓鱼邮件检测系统 MultiPhishGuard 技术研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

传统钓鱼邮件检测依赖人工特征与单模型判别,在 AI 生成式钓鱼、语义伪装、多维度逃逸攻击下存在鲁棒性不足、可解释性差、误报漏报偏高的问题。arXiv 论文 Mu...

300

驯服AI巨兽:大模型微调训练营的云端编程实战全景

用户12502927

在2026年的今天,通用大模型(Foundation Models)虽然展现了惊人的泛化能力,但在垂直领域的实际应用中,往往面临着“懂常识不懂行话”、“有逻辑没...

900

AI大模型微调:让通用"天才"变身行业"专家"的关键一跃——腾讯云实战指南:从数据到部署,七步打造你的专属大模型

用户12339161

2026年,大模型已不再是实验室里的"奢侈品"。GPT-4、DeepSeek-V4、Qwen2.5……通用模型在开放域对话、代码生成上展现出惊人的"通才"能力。...

6610

同样标注为 Claude,为何效果差异明显:中转链路模型一致性排查实录

AiKey Labs

同一个模型名、相似的任务输入,线上表现却波动明显。表现形式通常不是“直接报错”,而是:

2911

小程序接入大模型,这几条路各有什么坑

程序员阿树

想给小程序加个 AI 对话功能,第一反应一般是:直接在前端调大模型 API 不就行了?

6110

从零搞懂大模型:定义、起源、计量单位与完整分类|入门必看干货

虫无涯

最近大模型风口持续火爆,不管是求职、副业、技术深耕,绕不开的第一件事,就是系统搞懂到底什么是大模型。像我刚入门只会跟风听GPT、通义千问、DeepSeek,但对...

7620

分布式还是集中式?中大型企业如何部署一套可治理的 AI Agent 系统,让 AI 从个人提效到组织改造

极客洞察

过去很多人用 AI,是把它当成一个问答工具。写一段文案、总结一份材料、解释一段代码,或者帮忙把一堆杂乱的信息整理成一页报告。到了 Agent 阶段,AI 开始能...

6310

立足智能未来:大模型微调——掌握AI定制核心能力的终极钥匙

用户12502937

IDC数据显示:2026年中国企业级AI智能体市场规模已达449亿元,到2029年有望突破3320亿元,年复合增长率高达107%。Gartner更是一针见血——...

11510

2026大模型备案落地指南

aigc合规师虎虎

佛山迫无科技 | aigc合规师 (已认证)

核心技术特征:项目全程不触碰大模型权重、不进行模型训练与微调、不修改底层算法架构。开发工作仅集中在应用层,通过标准HTTP/HTTPS接口,调用腾讯云、百度、阿...

23310

Gemini 3.5 Flash发布后,Gemini是否有被踢出大模型御三家的风险?

鱼片粥来碗豆腐

最近几天,大模型圈子里最热闹的事莫过于刚结束的 Google I/O 大会。Google 这次毫无预兆地直接掏出了全新的 Gemini 3.5 Flash,并且...

18410

Replicate平台部署与微调大语言模型

用户11764306

该平台已提供 FLAN-T5、GPT-J 和 LLaMA 的官方版本,您也可以推送任何其他自定义模型。同时,平台发布了语言模型微调的预览版。

7010

一招教你如何快速免费无限调用 DeepSeek-V4-Flash,本地终端直接用

不吃香菜AI

绝大多数开发者都不知道这个隐藏福利!无需充值、无需付费,就能在本地终端中无限制调用 284B 参数的 DeepSeek-V4-Flash,全程白嫖、稳定可用,核...

94110
领券