用户7353950

文章/答案/技术大牛

发布

LV1

发表了文章 2025-06-282025-06-28 16:38:30

DeepSeek GRPO：原理及相关技术解析

本文深入探讨了 DeepSeek 提出的组相对策略优化（GRPO）算法。通过阐述其背景与动机，详细剖析核心原理，包括分组采样、归一化相对奖励及 KL 散度约束等...

用户7353950 2025-06-282025-06-28 16:38:31

DeepSeek、模型、算法、优化、原理

发表了文章 2025-06-192025-06-19 12:52:49

深度解析 RAG（Retrieval-Augmented Generation）技术原理

随着人工智能技术的飞速发展，信息处理和知识利用的效率与精度成为了科研与产业界关注的焦点。在这一背景下，RAG（Retrieval-Augmented Gener...

用户7353950 2025-06-192025-06-19 12:52:49

模型、数据、系统、原理、存储

发表了文章 2025-06-152025-06-15 12:45:24

Spring AI 详细介绍及使用示例解析

Spring AI 是 Spring 官方推出的开源框架，旨在为 Java 开发者提供便捷的 AI 能力集成方案，于 2024 年 10 月 18 日正式发布 ...

用户7353950 2025-06-152025-06-15 12:45:24

数据、spring、开发、开发者、模型

发表了文章 2025-06-152025-06-15 12:44:12

Spring AI 与 LangChain4j 对比分析，实际项目中该如何选择？

一、引言在 Java 技术栈中，Spring AI 和 LangChain4j 是目前比较热门的两个 AI 开发框架。它们都为开发者提供了便捷的 AI 功能...

用户7353950 2025-06-152025-06-15 12:44:13

spring、工具、开发、开发者、模型

发表了文章 2025-04-072025-04-07 10:54:06

大模型实现通用智能机理与数据驱动的智能涌现

随着人工智能技术的飞速发展，大模型在实现通用智能方面展现出惊人的潜力。通用智能是指机器能够像人类一样理解和处理各种复杂任务，涵盖语言、视觉、逻辑推理等多个领域。...

用户7353950 2025-04-072025-04-07 10:54:06

性能、优化、基础、模型、数据

发表了文章 2025-03-172025-03-17 20:13:23

DeepSeek 的张量切片重计算和动态精度调节技术

DeepSeek 的张量切片重计算（Tensor Slice Recomputation, TSR）技术和动态精度调节技术是其高效训练体系中的关键优化手段。其核...

用户7353950 2025-03-172025-03-17 20:13:24

DeepSeek、深度学习、模型、效率、优化

发表了文章 2025-03-172025-03-17 20:10:38

高维数据映射：提升大模型训练效率的关键

随着人工智能技术的飞速发展，大模型在自然语言处理、计算机视觉、语音识别等领域取得了显著的成果。然而，大模型的训练面临着诸多挑战，其中高维数据带来的计算复杂度和内...

用户7353950 2025-03-172025-03-17 20:10:38

模型、数据、算法、效率、优化

发表了文章 2025-03-172025-03-17 20:10:06

大模型如何构建高维语义空间

在自然语言处理（NLP）领域，大模型的发展标志着语言理解能力的一次飞跃。大模型能够处理复杂的语言任务，如机器翻译、文本生成、情感分析等，其核心在于构建高维语义空...

用户7353950 2025-03-172025-03-17 20:10:06

性能、架构、模型、数据

发表了文章 2025-03-132025-03-13 21:26:18

微服务与大模型MoE设计思想的深度剖析

在当今快速发展的软件工程与人工智能领域，微服务架构和大模型MoE（Mixture of Experts）设计分别代表了分布式系统设计和深度学习模型架构的重要进展...

用户7353950 2025-03-132025-03-13 21:26:18

设计、系统、微服务、服务、模型

发表了文章 2025-03-132025-03-13 21:26:08

DeepSeek R1与V3：技术架构、性能与应用场景的深入解析

随着人工智能技术的飞速发展，大型语言模型（LLM）已成为推动自然语言处理领域进步的重要力量。在这一背景下，深度求索（DeepSeek）公司推出了两款备受瞩目的大...

用户7353950 2025-03-132025-03-13 21:26:08

性能、DeepSeek、架构、模型、设计

发表了文章 2025-03-102025-03-10 20:51:14

小米HAD与特斯拉FSD：智能驾驶技术的巅峰对决

随着智能驾驶技术的快速发展，小米和特斯拉作为全球领先的科技企业，分别推出了自己的自动驾驶解决方案——小米HAD（端到端全场景智能驾驶）和特斯拉FSD（Full ...

用户7353950 2025-03-102025-03-10 20:51:17

优化、摄像头、数据、算法、系统

发表了文章 2025-03-072025-03-07 17:55:05

Manus刷屏！全球首款通用型AI智能体发布

Manus是由Monica.im团队开发的全球首款通用型AI智能体（Agent）产品，于2025年3月6日正式发布。

用户7353950 2025-03-072025-03-07 17:55:05

优化、代理、工具、架构、数据

发表了文章 2025-03-032025-03-03 21:51:51

DeepGEMM：全球首个开源的 FP8 矩阵加速器技术解析

随着人工智能和深度学习的快速发展，计算效率和资源优化成为研究和工业应用中的关键问题。矩阵乘法（General Matrix Multiplication,GEM...

用户7353950 2025-03-032025-03-03 21:51:51

架构、模型、性能、优化、开源

发表了文章 2025-03-032025-03-03 21:51:44

小米集团300亿AI研发投入：从硬件生态到AI原生的全面升级

在全球人工智能竞争进入“场景定义技术”的新阶段，小米集团宣布今年投入300亿元用于AI研发。这一战略不仅标志着其从“硬件生态公司”向“AI原生企业”的转型，更将...

用户7353950 2025-03-032025-03-03 21:51:44

研发、硬件、模型、数据、系统

发表了文章 2025-03-032025-03-03 21:51:20

为什么大模型用的是参数而不是数据库？

在当今数字化时代，人工智能和数据管理技术正深刻改变着我们的生活和工作方式。其中，大模型和数据库是两个极为重要的概念。它们虽然都与数据相关，但其本质、作用和实现方...

用户7353950 2025-03-032025-03-03 21:51:20

关系型数据库、模型、数据、数据库、存储

发表了文章 2025-02-272025-02-27 21:17:02

DeepSeek EP并行专家通信技术解析：打破大模型训练瓶颈

在人工智能领域，尤其是大规模语言模型和混合专家模型（Mixture-of-Experts,MoE）的研究与应用中，通信效率一直是制约模型性能和训练速度的关键因素...

用户7353950 2025-02-272025-02-27 21:17:02

模型、通信、效率、优化、DeepSeek

发表了文章 2025-02-262025-02-26 21:42:13

DeepSeek FlashMLA：技术架构与原理解析

在当今人工智能领域，大语言模型（LLMs）的发展正以惊人的速度改变着我们的生活和工作方式。然而，随着模型规模的不断扩大，如何在有限的硬件资源下高效运行这些模型，...

用户7353950 2025-02-262025-02-26 21:42:13

优化、原理、DeepSeek、架构、模型

发表了文章 2025-02-252025-02-25 19:55:38

DeepSeek开源周：开启AI技术新时代的创新引擎

在当今数字化时代，人工智能（AI）已成为推动全球科技进步的核心力量。从自然语言处理到计算机视觉，从强化学习到深度学习框架，AI技术正以前所未有的速度改变着我们的...

用户7353950 2025-02-252025-02-25 19:55:38

开源、开发者、模型、优化、DeepSeek

发表了文章 2025-02-252025-02-25 08:49:44

强推理模型解决组合爆炸问题的关键方法与实践

在人工智能领域，组合爆炸问题是一个长期存在的难题。它指的是当问题规模增大时，可能的状态或组合数量指数呈级增长，导致计算资源和时间消耗急剧上升。这一问题尤其在需要...

用户7353950 2025-02-252025-02-25 08:49:44

优化、递归、模型、实践、搜索

发表了文章 2025-02-252025-02-25 08:49:15

预训练模型与强推理模型：人工智能时代的认知革命

人工智能技术的演进史，本质上是人类对智能本质的探索史。在深度学习浪潮席卷全球的十年间，两条技术路线逐渐显现出清晰的轮廓：以海量数据为燃料的预训练模型，与以逻辑推...

用户7353950 2025-02-252025-02-25 08:49:15

架构、模型、数据、系统、人工智能

12 3 4 5 6 7 8...21 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-05-19

个人成就

获得 681 次赞同
文章被阅读 833.1K 次

关注了：1关注者：54