首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >学习AI需要的基础知识

学习AI需要的基础知识

原创
作者头像
用户11850891
发布2025-09-25 11:00:50
发布2025-09-25 11:00:50
110
举报

在下不才,在研究AI算法一段时间以后回顾总结,要学习AI,大致需要几方面的基础知识。首先说一句,下面提到的基础知识是指研究AI算法(即构造和训练模型),期望成为算法工程师所需要的基础知识。如果你只想做AI应用,那需要的基础就不一样了。

数学

数学是构造模型的理论基础,在AI算法研究中经常用到的数学知识有:

中学数学

幂函数

是指形如f(x) = x^a 的函数,其中x是自变量,a是指数(或幂)。讲出来大家应该都知道,但是在某些资料里提到幂函数(Power Function)时需要知道是什么概念。

对数

对数是指数的逆运算,具体来说,如果a^b = c ,那么\log_a c = b 。其中a叫做底数,c叫做真数。对数大量出现在损失函数中。

高等数学

微积分初步(导数)

神经网络训练中大量包含求导运算。因为梯度本质是偏导数,因此反向传播中计算梯度用到大量求导运算。

线性代数

线性代数有简单有复杂,深度学习中主要用到的是大学数学(上)阶段的线性代数,主要包含逐元素乘法、矩阵乘法和点积。

逐元素乘法(Element-wise Multiplication)指两个形状完全相同的矩阵对应位置相乘。

矩阵乘法(MatMul):C(i, j)为矩阵A第i行行向量与矩阵B第j列列向量对应分量的乘积之和。

点积( Dot-Product )用于向量乘法。对于两个 n 维向量 a = a₁, a₂, ..., aₙ 和 b = b₁, b₂, ..., bₙ,它们的点积为:

a · b= a₁b₁ + a₂b₂ + ... + aₙ*bₙ

概率论与数理统计

神经网络本质是一个概率模型。很多网络(包括分类网络)输出实际是一个概率分布。常用到的概念有条件概率、最(极)大似然函数等;

凸分析

深度学习的损失函数需要是凸函数。理科和工科的凸函数定义不一样。在人工智能领域以“下凸”为凸函数,即如果函数图像上任意两点之间的连线位于函数图像上方,则认为该函数为凸函数。

计算机

编程技术

数学是AI算法的理论基础,编程就是AI算法的实践基础。在动手实现算法理论时,经常会遇到各种各样的意外情况,比如库版本不兼容、张量shape不符要求导致无法运算等问题。因此如果没有良好的编程能力,就无法将好的理论付诸实践、拿到结果,也无法看懂别人编写的优秀开源代码。在算法领域用到的编程以python为主,深层次应用也会用到其它语言。

硬件基础(机算计组成结构与原理)

计算机是软硬结合的一门科学,程序需要运行在硬件上。懂计算机硬件可以帮助你了解程序运作机制、搭建理想的程序(算法)运行平台、充分利用硬件的并行计算能力,提升程序运行速度。另外现在很火的“算力”领域也是以计算机硬件为基础,懂硬件可以帮助你更快的上手算力服务器(如果你以后工作会用到的话)。

懂计算机硬件可以帮助你了解x86平台和ARM平台的区别,以及32位指令集和64位指令集的区别。

操作系统

只有计算机硬件是无法运行程序的,需要操作系统进行调度。熟悉操作系统基础知识可以帮助你更好的管理和调试你的程序。例如了解文件系统(绝对路径和相对路径)可以帮助你更好的保存和读取文件,避免出现必要文件找不到的问题。

此外在人工智能生产环境中,经常使用Linux操作系统,熟练掌握Linux系统(包括操作命令、软件包安装卸载、用户与用户组、文件访问权限等)可以让你更快的融入大厂的AI算法开发工作。此外端侧AI开发(开发板)基本都是Linux系统。

数据结构与算法

对提升程序运行效率帮助很大,(发)论文经常会用到。

英语

调试Bug

程序运行的天然环境是英文环境,报错提示基本都是英文。因此好的英语阅读能力可以帮助你更快找到报错的原因,调试好Bug。

看教程、资料

目前有很多优秀的AI教程和资料(原文)使用的都是英语,懂英文可以让你更快的获得先进的AI知识、理解关键技术。这点我认为很重要,我看到过一些似是而非的教程(大多是中文),看多了容易误入歧途。

读论文

和上一条类似,主流的AI论文(包括DeepSeek等国内公司发的)都是英文,懂英文可以让你更快的理解、掌握权威的AI知识。

写在最后

列出以上基础是我对自己研究AI中遇到的一些基础问题进行回顾的总结。并不是说一定要全部掌握才能开始学习AI。如果你已经有一部分基础,可以边学习AI边把需要的基础补上。此外现在主流的深度学习框架已经把模型训练过程做了很好的封装,训练模型并不需要你从头进行数学计算。以上就是我的一点心得,如果您有什么意见和建议欢迎提出!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数学
    • 中学数学
      • 幂函数
      • 对数
    • 高等数学
      • 微积分初步(导数)
      • 线性代数
      • 概率论与数理统计
      • 凸分析
  • 计算机
    • 编程技术
    • 硬件基础(机算计组成结构与原理)
    • 操作系统
    • 数据结构与算法
  • 英语
    • 调试Bug
    • 看教程、资料
    • 读论文
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档