@小森 - 个人中心 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

@小森

LV2

全部文章

Open_R1_Complete_Training_Guide
Open R1是由Hugging Face团队开发的完全开源的DeepSeek-R1复现项目，目标是构建R1推理管道中缺失的组件，让所有人都能复现和构建类似的推...
@小森 2025-07-312025-07-31 08:17:53
优化、函数、模型、配置、数据
LangChain_从基础到高级
LangChain 的核心思想是链式操作（Chaining）- 将多个处理步骤通过管道操作符 | 连接起来，形成一个完整的数据处理流水线。
@小森 2025-07-272025-07-27 08:16:59
系统、函数、基础、路由、调试
MCP协议详细教程
Model Context Protocol (MCP) 是一个开放协议，旨在标准化应用程序为大语言模型(LLM)提供上下文的方式。可以将MCP比作AI应用的U...
@小森 2025-07-262025-07-26 08:01:02
服务器、工具、教程、协议、MCP
LangChain聊天机器人教程
欢迎来到 LangChain 聊天机器人的世界！🎉 在这个教程中，我们将学习如何使用 LangChain 构建智能聊天机器人，并探索两种不同的消息存储方式。
@小森 2025-07-252025-07-25 08:07:39
模型、配置、存储、机器人、教程
LangGraph基础教程
在 LangChain，致力于让构建大语言模型应用变得简单。你可以构建的一种大语言模型应用是智能体（agent）。构建智能体令人兴奋，因为它们可以自动化许多以前...
@小森 2025-07-242025-07-24 08:37:04
工具、接口、模型、配置、搜索
深入浅出Diffusion模型：从原理到实践的全方位教程
近年来，生成式人工智能（Generative AI）领域取得了爆炸性的进展，模型能够根据简单的文本提示创作出逼真的图像、连贯的文本，乃至更多令人惊叹的内容。在这...
@小森 2025-06-102025-06-10 08:24:53
教程、模型、实践、数据、原理
Vue框架引入
后起之秀,指的是vue之前有react,react之前有Angluer,尤雨溪也是参考了react写的好的部分。
@小森 2025-06-022025-06-02 10:05:30
插件、函数、框架、模型、数据
国内开源医疗模型研究报告
随着人工智能技术的快速发展，医疗AI领域正经历前所未有的变革。开源医疗模型作为这一领域的核心技术基础设施，不仅推动了医疗智能化进程，也为医疗工作者提供了强大的辅...
@小森 2025-04-162025-04-16 13:47:07
服务、模型、数据、医疗、开源
DeepResearch产品形态与发展研究报告
DeepResearch是一种AI驱动的智能研究工具，旨在解决复杂、知识密集型的研究任务。其核心功能包括：
@小森 2025-03-072025-03-07 10:22:09
行业、模型、开源、产品、工具
LlamaIndex 应用完整指南
LlamaIndex 是一个强大的框架，专门用于构建基于LLM的数据应用。它的主要目标是帮助开发者创建能够与私有数据交互的LLM应用。
@小森 2025-03-052025-03-05 08:26:11
存储、工作流、数据、索引、优化
Retrieval Augmented Generation (RAG) 研究报告
近年来，大型语言模型 (LLM) 在自然语言处理领域取得了显著的进展，展现出强大的文本生成能力。然而，LLM 仍然存在一些局限性，例如容易产生“幻觉”（生成不准...
@小森 2025-02-242025-02-24 08:21:27
搜索、系统、开发、模型、数据
DeepSeek 全面分析报告
DeepSeek 是一款由中国人工智能初创公司 DeepSeek 开发的大型语言模型 (LLM)，于 2025 年 1 月发布，迅速成为全球人工智能领域的一匹黑...
@小森 2025-02-232025-02-23 08:32:41
数据、DeepSeek、开源、服务、模型
GroK 3研究报告
大模型（Large Language Models, LLMs）是人工智能领域的重要突破，特别是在自然语言处理（NLP）中。这些模型通过处理数十亿参数，能够理解...
@小森 2025-02-212025-02-21 08:53:55
架构、模型、效率、性能、测试
指针生成网络（PGN）详细指南（引入）
我们首先要了解的是seq2seq（Sequence-to-Sequence）模型。它最早由Google在2014年的一篇论文中提出，是第一个真正意义上的端到端的...
@小森 2025-01-242025-01-24 08:02:27
指针、self、编码、模型、网络
带有coverage机制的PGN模型架构
在生成摘要时，我们可能会遇到重复生成某些词或短语的问题。coverage机制就是为了解决这个问题而设计的，它通过记录已经关注过的源文本部分，来避免重复关注和生成...
@小森 2025-01-232025-01-23 11:25:46
腾讯技术创作特训营S11#重启人生
Flash Attention V3使用
Flash Attention 是一种针对 Transformer 模型中注意力机制的优化实现，旨在提高计算效率和内存利用率。随着大模型的普及，Flash At...
@小森 2025-01-062025-01-06 08:17:26
编码、模型、性能、优化、flash
使用DeepSpeed进行大模型推理加速的指南
DeepSpeed是一个开源工具库，旨在通过系统优化和压缩技术加速大规模模型的推理和训练过程。
@小森 2025-01-032025-01-03 20:42:39
腾讯技术创作特训营S11#重启人生
检索增强生成（RAG）
检索增强生成（Retrieval-Augmented Generation, RAG）是一种结合了检索机制和生成模型的先进技术，旨在提高自然语言处理系统的准确性...
@小森 2025-01-032025-01-03 10:00:19
模型、数据、系统、数据库、存储
大模型Prompt-Tuning方法
Fine-Tuning属于一种迁移学习方式，在自然语言处理（NLP）中，Fine-Tuning是用于将预训练的语言模型适应于特定任务或领域。Fine-Tunin...
@小森 2024-12-312024-12-31 10:39:01
腾讯技术创作特训营S11#重启人生
训练基于Transformer的翻译任务模型
🤗机器翻译是自然语言处理领域中的一个重要任务，其中Transformer模型其强大的表征能力和并行计算能力，成为机器翻译的主流模型。
@小森 2024-12-312024-12-31 10:37:23
mask、src、翻译、模型、数据

12 3 4 5 6 7 8...11 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
齐鲁师范学院 | 人工智能
暂未填写个人网址
山东省 | 济南市
加入社区时间：2024-01-23

个人成就

获得 237 次赞同
文章被阅读 119.5K 次

关注了：4关注者：42