首页
学习
活动
专区
圈层
工具
发布
首页标签腾讯技术创作特训营S17#我与AI

#腾讯技术创作特训营S17#我与AI

大模型应用:医疗行业大模型:从生成前校验到生成后审计的应用实践.73

未闻花名

医疗行业对准确性、合规性、安全性有着极高的要求,大模型在医疗场景,如病历撰写、医嘱辅助、医学科普、诊断建议参考等,不能简单直接的“输入-输出”,否则可能出现医疗...

9642

大模型架构算力对比:Decoder-only、Encoder-Decoder、MoE深度解析.71

未闻花名

代表模型:GPT 系列、LLaMA 系列、Qwen 系列等。 主要应用场景:自然语言生成任务,包括智能对话、文本创作、内容摘要、代码生成等。 核心特点:

13442

DeepSeek 悄悄上线专家模式:不是终极形态,但可能是产品成熟的开始

算法一只狗

腾讯 | 后台策略工程师 (已认证)

DeepSeek悄悄在网页端搞了个大动作——输入框上方多了两个图标,一个闪电,一个钻石,分别对应「快速模式」和「专家模式」。没有发布会,没有官方博客,甚至一条推...

42430

大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68

未闻花名

在大模型的训练与推理过程中,我们应该经常会看到GEMM,General Matrix Multiply and Accumulate,就是矩阵乘加运算,GEMM...

22532

离职的同事,没有消失,只是住进了服务器里

算法一只狗

腾讯 | 后台策略工程师 (已认证)

最近,一个github仓库突然出现,而且仅仅几天的时间,其star数量就达到了7K

30010

大模型应用:拆解大模型算力需求:算力是什么?怎么衡量?如何匹配?.64

未闻花名

对大模型而言,算力核心体现在“单位时间内完成矩阵乘法、注意力计算等核心操作的次数”。

57362

大模型应用:大模型内存与显存深度解析:我们该如何组合匹配模型与显卡.63

未闻花名

在大模型本地化部署的学习路上,我们都会经历懵懵懂懂、茫然无措的阶段,不是被五花八门的模型给整迷糊了,就是被一系列硬件适配问题困住:模型参数与显存占用到底如何精准...

49352

大模型应用:联邦学习融合本地大模型:隐私合规推荐的核心流程与实践.62

未闻花名

在当下购物形式日益丰富、消费需求愈发多元的浪潮中,个性化推荐已成为连接用户与商品的核心纽带,直接影响用户体验与平台转化效率。然而,推荐系统的优化始终面临一对核心...

23032

大模型应用:电商智能推荐:基于本地大模型的冷启动智能推荐系统实例.61

未闻花名

推荐系统是连接用户与信息的桥梁,核心目标是在海量信息中为用户精准匹配其感兴趣的内容、商品或服务,广泛应用于电商行业、内容平台、生活服务等场景。其核心价值体现在:

29842

DeepSeek、豆包、元宝、ChatGPT等AI平台生成内容,复制到Word文档再无乱码

FormatAI

用AI写论文、写报告、出卷子,生成内容很快,但复制到Word就崩了——公式变乱码、表格错位、代码块缩进全没。这不是AI的问题,是格式转换的问题。本文对比4种技术...

1.4K00

从 MiMo-V2-Pro 到 Omni、TTS,小米这次把 Agent 时代的牌摊开了上周,一款名为Hunter Al

算法一只狗

腾讯 | 后台策略工程师 (已认证)

从 MiMo-V2-Pro 到 Omni、TTS,小米这次把 Agent 时代的牌摊开了

33600

GPT-5.4初步体验:一个真正面向工作流的大模型出现了

算法一只狗

腾讯 | 后台策略工程师 (已认证)

凌晨2点的时候,GPT-5.4直接发布。目前在ChatGPT、API和Codex上都能够直接使用

1.1K10

Nano Banana 2:速度、质量与世界知识融合的图像生成新拐点

算法一只狗

腾讯 | 后台策略工程师 (已认证)

谷歌最新的 Nano Banana 2(即 Gemini 3.1 Flash Image) 发布啦,相比前代感觉亮点确实不少。

41020

Gemini 3.1 Pro 登顶背后:效率、稳定性与工程化能力的全面升级

算法一只狗

腾讯 | 后台策略工程师 (已认证)

Gemini 3.1 pro它来了,它在 Gemini 3 系列的基础上,核心推理方面实现了飞跃。相比上一代版本,这次升级并不是简单的参数堆叠,他在“推理深度、...

78910

国产之光 万卡超集群是怎样炼成的:液冷为基,RDMA为脉,机房为脑

早起的鸟儿有虫吃

🌐 成为国家超算互联网平台最大算力资源池欢迎各产品线销售/BD(寻找潜在的目标客户、建立合作关系)邀客户 旅游 ,参观 , 会议 方式 进行商务洽谈,技术合作

62210

DeepSeek 新模型上线实测:1M 上下文背后,是进化还是取舍?

算法一只狗

腾讯 | 后台策略工程师 (已认证)

最近在DeepSeek官网上,上线了一个新的版本,这个版本或为V4正式发布前的最终灰度测试阶段。

1.7K10

《GraphQL状态图建模与低时延控制能力解析》

程序员阿伟

物联网设备态联拓扑的规模化落地进程中,设备状态图的高效查询与控制指令的低时延调度,已然成为构筑全域物联交互体系的核心命题,传统物联查询接口的刚性范式,始终难以适...

12810

《GraphQL批处理与全局缓存共享的底层逻辑》

程序员阿伟

微前端架构在分布式前端体系的深度落地过程中,跨应用数据请求的冗余分发已然成为制约前端整体效能提升的核心桎梏,传统碎片化的请求发起模式下,彼此解耦的微应用针对同源...

10810

《面向第三方的GraphQL开放平台设计指南:安全可控治理手册》

程序员阿伟

传统开放平台的粗放式管控逻辑,无法适配GraphQL查询灵活度高、资源消耗差异大的运行特征,极易引发资源分配不均、服务负载失衡、价值核算模糊、交互行为无迹等问题...

11500
领券