首页
学习
活动
专区
圈层
工具
发布
首页标签腾讯技术创作特训营S17#我与AI

#腾讯技术创作特训营S17#我与AI

大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68

未闻花名

在大模型的训练与推理过程中,我们应该经常会看到GEMM,General Matrix Multiply and Accumulate,就是矩阵乘加运算,GEMM...

911

离职的同事,没有消失,只是住进了服务器里

算法一只狗

腾讯 | 后台策略工程师 (已认证)

最近,一个github仓库突然出现,而且仅仅几天的时间,其star数量就达到了7K

7600

大模型应用:拆解大模型算力需求:算力是什么?怎么衡量?如何匹配?.64

未闻花名

对大模型而言,算力核心体现在“单位时间内完成矩阵乘法、注意力计算等核心操作的次数”。

35762

大模型应用:大模型内存与显存深度解析:我们该如何组合匹配模型与显卡.63

未闻花名

在大模型本地化部署的学习路上,我们都会经历懵懵懂懂、茫然无措的阶段,不是被五花八门的模型给整迷糊了,就是被一系列硬件适配问题困住:模型参数与显存占用到底如何精准...

29152

大模型应用:联邦学习融合本地大模型:隐私合规推荐的核心流程与实践.62

未闻花名

在当下购物形式日益丰富、消费需求愈发多元的浪潮中,个性化推荐已成为连接用户与商品的核心纽带,直接影响用户体验与平台转化效率。然而,推荐系统的优化始终面临一对核心...

19332

大模型应用:电商智能推荐:基于本地大模型的冷启动智能推荐系统实例.61

未闻花名

推荐系统是连接用户与信息的桥梁,核心目标是在海量信息中为用户精准匹配其感兴趣的内容、商品或服务,广泛应用于电商行业、内容平台、生活服务等场景。其核心价值体现在:

24442

DeepSeek、豆包、元宝、ChatGPT等AI平台生成内容,复制到Word文档再无乱码

FormatAI

用AI写论文、写报告、出卷子,生成内容很快,但复制到Word就崩了——公式变乱码、表格错位、代码块缩进全没。这不是AI的问题,是格式转换的问题。本文对比4种技术...

1.1K00

从 MiMo-V2-Pro 到 Omni、TTS,小米这次把 Agent 时代的牌摊开了上周,一款名为Hunter Al

算法一只狗

腾讯 | 后台策略工程师 (已认证)

从 MiMo-V2-Pro 到 Omni、TTS,小米这次把 Agent 时代的牌摊开了

27000

GPT-5.4初步体验:一个真正面向工作流的大模型出现了

算法一只狗

腾讯 | 后台策略工程师 (已认证)

凌晨2点的时候,GPT-5.4直接发布。目前在ChatGPT、API和Codex上都能够直接使用

1K10

Nano Banana 2:速度、质量与世界知识融合的图像生成新拐点

算法一只狗

腾讯 | 后台策略工程师 (已认证)

谷歌最新的 Nano Banana 2(即 Gemini 3.1 Flash Image) 发布啦,相比前代感觉亮点确实不少。

39320

Gemini 3.1 Pro 登顶背后:效率、稳定性与工程化能力的全面升级

算法一只狗

腾讯 | 后台策略工程师 (已认证)

Gemini 3.1 pro它来了,它在 Gemini 3 系列的基础上,核心推理方面实现了飞跃。相比上一代版本,这次升级并不是简单的参数堆叠,他在“推理深度、...

71810

国产之光 万卡超集群是怎样炼成的:液冷为基,RDMA为脉,机房为脑

早起的鸟儿有虫吃

🌐 成为国家超算互联网平台最大算力资源池欢迎各产品线销售/BD(寻找潜在的目标客户、建立合作关系)邀客户 旅游 ,参观 , 会议 方式 进行商务洽谈,技术合作

60510

DeepSeek 新模型上线实测:1M 上下文背后,是进化还是取舍?

算法一只狗

腾讯 | 后台策略工程师 (已认证)

最近在DeepSeek官网上,上线了一个新的版本,这个版本或为V4正式发布前的最终灰度测试阶段。

1.6K10

《GraphQL状态图建模与低时延控制能力解析》

程序员阿伟

物联网设备态联拓扑的规模化落地进程中,设备状态图的高效查询与控制指令的低时延调度,已然成为构筑全域物联交互体系的核心命题,传统物联查询接口的刚性范式,始终难以适...

12710

《GraphQL批处理与全局缓存共享的底层逻辑》

程序员阿伟

微前端架构在分布式前端体系的深度落地过程中,跨应用数据请求的冗余分发已然成为制约前端整体效能提升的核心桎梏,传统碎片化的请求发起模式下,彼此解耦的微应用针对同源...

10710

《面向第三方的GraphQL开放平台设计指南:安全可控治理手册》

程序员阿伟

传统开放平台的粗放式管控逻辑,无法适配GraphQL查询灵活度高、资源消耗差异大的运行特征,极易引发资源分配不均、服务负载失衡、价值核算模糊、交互行为无迹等问题...

11000

《GraphQL 强类型架构下的错误处理体系设计指南》

程序员阿伟

构建GraphQL错误处理规范的首要核心,是完成异常域的全链路精细化拆解与语义化专属归类,彻底摒弃传统扁平化、无层级的错误分类模式,基于GraphQL请求从入口...

9900

《零信任架构运维监控信任体系构建实操手册》

程序员阿伟

内部运维工具的访问路径重构,核心在于以“身份态锚定”为核心构建全链路信任校验体系,彻底摒弃传统架构中基于内网网段的准入逻辑,将每一次运维访问请求都拆解为身份、环...

10800

《分布式跨域业务事务可用性与性能度量手册》

程序员阿伟

传统基于单点服务的观测体系,往往会陷入“局部达标、整体失准”的认知盲区,当业务事务在多服务间流转时,节点间的衔接损耗、状态传导偏差、流程闭环断层等隐性问题,会直...

11300
领券