数学—AI人工智能基石

AI在可预见的多年内还将以爆发的态势增长，AI人才需求与日俱增，但普通程序员困于没有扎实的专业数学基础，局限在AI应用层开发，在进一步构建自己的AI模型、调参优化、处理数据并评估性能方面无法突破，甚至很多教程也基于有相关高等数学基础而设计，对于大部分毕业后再未接触过数学的开发人员有相当的难度，鉴于此本课程严选AI强关联数学干货，降低学习门槛、可视化呈现、数学与代码结合的程序员友好课程设计，广泛覆盖AI所必备的数学基础，旨在消除程序员在深入AI领域的数学屏障，无论你是想夯实数学基础，还是深耕AI领域，这门课程都将是你的首选。

数学与AI项目实例紧密融合，学员动手实操，避免一看就会，一用就废

大语言模型的数学原理
手工实现一个
分类问题神经网络
实现一个自动微分框架
大手搓一个python矩阵类

项目简介

深入大语言模型的核心数学原理：分解大语言模型的结构，亲手实现一个简单大语言模型。综合在整个课程中所学，理解数学为大语言模型提供的算法和理论基础、优化方法以及在数据分析和处理中的关键作用；通过实验直观的感受大语言模型的语义逻辑，观察模型深层的向量脉动；从而更有效的使用大模型，为更深入的工作打下基础

项目内容：

对应数学原理：

Transformer总体架构，历史和现状

矩阵运算；均值，方差，归一化；激活函数；概率分布与条件概率链式法则与梯度下降

Embedding，位置编码：将离散的单词映射为连续向量，保留语义，引入位置编码以保留序列顺序信息

向量空间；相似度计算；周期性信号；主成分分析 PCA

注意力机制：包括 Q、K、V 的计算及点积注意力公式

矩阵分解；特征值与特征向量；点积；归一化；Softmax 函数与概率分布；均值，方差

解码器：掩码多头注意力（Masked Multi-Head Attention）和上下文融合，生成文本输出的过程

条件概率与贝叶斯定理；梯度下降与反向传播；链式法则与自动微分；信息熵

项目简介

从数学原理入手，深入剖析神经网络的核心原理。课程将带领学生用Python从零实现一个简易的全连接神经网络（含输入层、隐藏层、输出层），网络中关键组件包括：激活函数（Sigmoid 和 Softmax）、损失函数（交叉熵）以及训练数据的处理方法。通过一个真实分类数据训练并验证模型效果。每一步代码实现均对应数学公式推导，重点解释梯度计算、反向传播等关键概念。

项目内容：

对应数学原理：

神经网络结构

矩阵运算（矩阵乘法、加法）；线性代数基础；非线性变换；函数复合与链式法则；

Sigmoid激活函数：激活函数的作用及其数学表达式；解释其如何引入非线性特性。

指数函数与对数函数；导数与梯度；单调函数性质；

Softmax激活函数：介绍 Softmax 激活函数的定义及其在多分类问题中的应用；讲解如何将原始输出转换为概率分布。

指数函数与归一化；概率分布与条件概率；偏导数计算；

交叉熵 (Cross-Entropy)损失函数：解释交叉熵损失函数的定义及其在分类任务中的作用；讨论如何衡量预测值与真实值之间的差异。

最大似然估计；梯度下降与优化理论；

Softmax-Cross-Entropy 的偏导数：推导 Softmax 和交叉熵组合的损失函数的偏导数；讲解反向传播中梯度的计算方法。

复合函数求导；链式法则；偏导数与梯度更新规则；

训练数据处理：讲解数据标准化的必要性及其数学原理；介绍均值归一化和标准差缩放的方法。

统计学基础：均值、方差、标准差；

项目简介

深入探讨自动微分的数学原理，并带领大家手工实现一个基于自动微分的神经网络框架。从自动微分的基础原理出发，通过构建计算图、实现反向传播算法，逐步理解神经网络中梯度计算的本质。课程将涵盖自动微分的前向模式和反向模式，并通过代码实现softmax和交叉熵损失的自动微分，最终将自动微分集成到神经网络中，展示其在模型训练中的强大优势。

项目内容：

对应数学原理：

神自动微分的原理：计算图，前向传导：介绍自动微分的核心思想，包括计算图的构建和前向传导过程；讲解如何将数学表达式分解为基本操作节点。

计算图的定义；前向传播的流程；链式法则；函数复合与偏导数

自动微分之后向传导：深入讲解反向传导的过程，基于链式法则递归计算每个节点的梯度；实现梯度的自动累积。

指链式法则；反向传播算法；偏导数与梯度计算；递归的应用

代码实现 Softmax + 交叉熵的自动微分：实现 Softmax 激活函数和交叉熵损失函数的自动微分，推导其梯度公式并验证结果。

Softmax 函数的定义与性质；交叉熵损失函数；复合函数求导；梯度下降优化

将实现的自动微分应用到神经网络中：将自动微分框架应用于一个简单的神经网络，完成前向传播、反向传播和参数更新，训练模型完成分类任务。

神经网络结构；梯度下降法；参数更新规则；损失函数与优化目标

项目简介

带领学生深入理解矩阵操作在科学计算和机器学习中的核心作用，并通过动手实践，从零开始实现一个完整的矩阵类。课程内容覆盖矩阵的基本操作及其背后的数学原理，包括加减乘除、点积、转置、行列式计算、高斯消元法和 LU 分解等。在编码过程中，我们将逐一解析这些操作的数学基础，帮助学生建立从理论到实践的完整认知。

项目内容：

对应数学原理：

重载加减乘除运算符：重载矩阵类的加法、减法、数乘和矩阵乘法运算符，支持矩阵之间的基本运算。

矩阵加减法；数乘运算；矩阵乘法规则

实现矩阵的点积运算：实现矩阵的点积（内积）运算，用于科学计算和机器学习中的权重更新和激活函数计算。

指点积定义；矩阵维度匹配；向量内积与矩阵乘法的关系

实现矩阵的转置：实现矩阵的转置操作，即将矩阵的行变为列，列变为行。

转置矩阵的定义；索引变换；对称矩阵的性质

实现递归求矩阵的行列式：使用递归方法计算矩阵的行列式，基于拉普拉斯展开公式。

行列式的定义；代数余子；递归

实现高斯消元法求矩阵的秩：使用高斯消元法将矩阵化为阶梯形矩阵，进而求解矩阵的秩。

复高斯消元法；阶梯形矩阵；矩阵的秩与线性无关性

实现舒尔补方法对矩阵LU分解：使用舒尔补方法实现矩阵的 LU 分解，即将矩阵分解为下三角矩阵L和上三角矩阵U的乘积。

统LU 分解的定义；舒尔补方法；线性方程组的求解与矩阵分解

慕课网诚意钜献，为你量身定制

数学基础薄弱、缺乏实践的大学
生（数学停留在应试层面的）

想转AI专业的大学生，以及有意
转型AI领域的程序员和开发人员

已在AI领域工作，想进一步提
升、深入底层开发的职场人士

想深入大模型原理，想对大模型
微调，上下文学习，Prompt
Engineering，和想训练自己的
大模型，有更高追求的同学

真正从0到1的AI工程师养成，更系统更顺滑的AI大模型学习路径

系统掌握AI必备数学知识

打通视觉，NLP，机器学习，深度学习

实战16大AI大模型多领域项目

资深技术专家授课，精准干货+专业指导，让你的每分钟收获满满

GuoSr

算法工程师

硕士毕业于人工智能专业，曾长期在知名外企担任项目专家，深度参与多个AI项目的全流程工作，包括筹划、开发与实施，拥有AI理论知识和丰富的实践经验。同时，具备跨领域的产品开发经验，熟悉软件开发与人工智能的结合应用，深刻理解程序员在人工智能领域的痛点与挑战。

除了出色的视频内容，这里有伴你整个职业生涯的“成长社区”

学习时你能在这里获取答案，工作后你能在这里解决难题

由于课程类型与教学目标不同，学习服务会有不同，具体服务可在线咨询

问答专区

作业专区

笔记专区

资料专区

横向拓展，超全配套教辅资源；纵向延伸，源码开放更助知识理解

编程遇难点，名师来指点；疑难汇总一键查看，海量问答覆盖全面

多方位知识面，分层巩固吸收；学练测一体，一对一项目点评

脱离时空限制，随记随查很方便；总结课程重点，分享提升代码经验

横向拓展，超全配套教辅资源；纵向延伸，源码开放更助知识理解

编程遇难点，名师来指点；疑难汇总一键查看，海量问答覆盖全面

了解更多

课程大纲及学习周期安排

为保证课程内容紧跟市场变化，课程章节将逐步开放，直至课程完结

阶段一：线性代数：批量数据规律的研究

5门课 · 课程总时长：15小时

第1周
第2周
第3周
第4周
第5周

线性代数入门：由来、与人工智能的关系

介绍课程，配置开发环境，快速入门编程，了解线性代数的基本概念和应用，学习线性代数核心概念-走进矩阵

课程安排：

1、准备编程环境
2、Matplotlib快速上手、练习
3、常用科学计算，机器学习库的介绍和对比
4、线性代数入门练习
5、从数值到多维数据--计算机批量数据处理的基石：标量、向量、矩阵、张量到底是什么？
6、批量数据核心操作：向量的加减乘除
7、机器学习中的尺子：向量范数
8、让数据动起来，矩阵乘法与变换
9、对称矩阵、对角矩阵……这些特殊矩阵的what和why

矩阵进阶运算与矩阵分解

深入学习矩阵的高级运算和性质，包括转置、逆、迹、秩等以及矩阵计算的基石：矩阵分解

课程安排：

特征分解

学习特征分解的定义、代码调用、直观理解、手工计算方法和性质。

课程安排：

奇异值分解SVD

深入学习奇异值分解的定义、代码调用、直观解释、作用、与特征值分解的关系、伪逆等。

课程安排：

主成分分析PCA

学习主成分分析的直观理解、协方差矩阵、分解过程、与SVD的关系、应用等。

课程安排：

阶段二：线性代数实战

2门课 · 课程总时长：9小时

第6周
第7周

Numpy快速上手，用Python实现矩阵

帮助怼Numpy不太熟悉的同学提供了Numpy快速入门知识，再通过带同学自己手工实现一个python矩阵操作的类来加深对矩阵运算规律和性质的理解。

课程安排：

1、机器学习和数据科学的基石：Numpy的介绍
2、Numpy数组的灵活操作：数组的创建，索引，切片
3、更有效的内存使用：Numpy的复制和视图
4、灵活的数组过滤：布尔数组索引
5、数据变形记：维度调整与遍历
6、多维数据拼接：concatenate, stack, hstack, vstack, dstack
7、不同形状的数组能运算：Numpy的广播机制
8、Numpy的矩阵操作以及算数运算的支持
9、数据升维降维：添加，删除维度
10、Numpy相关知识点练习
11、为什么需要自定义矩阵类？筑牢机器学习的基石
12、让矩阵数据一目了然？重载类的字符串表达实现可视化调试
13、重载加减乘除运算符
14、实现矩阵的点积
15、实现矩阵的转置
16、实现递归求矩阵的行列式
17、实现高斯消元法求矩阵的列
18、Python实现一个矩阵类的练习

数据处理方法与矩阵与图形变换

学习常用的数据处理方法，包括正态分布、数据归一化、标准化、模型正则化等。学习矩阵在图形变换中的应用，包括缩放、旋转、剪切、移动、组合变换、倾斜等。

课程安排：

阶段三：微积分：研究数据变化的规律与模型优化

3门课 · 课程总时长：8小时

第8周
第9周
第10周

微积分入门，微积分核心基础

介绍微积分的基本概念，包括斜率、切线、极限、导数、穷竭法、曲线下面积等，学习极限、连续性、斜率和导数的基本概念和计算方法。

课程安排：

微积分进阶与多元微积分

学习常见函数的导数、微分公式、链式规则、高阶导数、不定式和洛必达法则等。学习多元微积分的基本概念，包括偏导数、偏导数规则、梯度向量、高阶偏导数等。

课程安排：

积分基础

学习积分的基本概念，包括积分的直观理解、不定积分与定积分、积分的性质等。

课程安排：

阶段四：微积分实战和进阶

5门课 · 课程总时长：10小时

第11周
第12周
第13周
第14周
第15周

用微积分知识实现一个神经网络

实现多分类问题的神经网络，学习回归问题与分类问题、神经网络结构、激活函数、损失函数等。

课程安排：

1、从回归到分类的问题建模
2、神经网络结构
3、S型曲线转化为二分类概率：sigmoid激活函数
4、将神经元输出压缩为概率的激活函数：softmax
5、如何量化预测结果与真实标签的差距的损失函数：交叉熵 cross-entropy
6、反向传播核心：Softmax与交叉熵联合求导的数学技巧
7、数据标准化：为什么特征缩放能加速神经网络收敛？
8、从微积分推导到Python代码的完整实现
9、练习：实现分类神经网络

ROC曲线与分类性能评估

学习分类问题与回归问题的区别，ROC曲线的定义和应用，混淆矩阵等。

课程安排：

神经网络梯度问题

研究神经网络的梯度消失和梯度爆炸问题，学习ReLU激活函数、正则化技术等。

课程安排：

神经网络自动微分

学习自动微分的原理和实现，包括计算图、前向传导、后向传导等。

课程安排：

偏导数与模型优化与支持向量机SVM

学习偏导数的链式法则、雅可比矩阵、神经网络中的偏导数、黑塞矩阵、牛顿法优化器等。学习支持向量机SVM的基本概念，包括超平面、硬间隔、软间隔、Hinge Loss损失函数、核函数等。

课程安排：

阶段五：概率论：应对现实世界中不确定性、神经网络的理论基础

4门课 · 课程总时长：8小时

第16周
第17周
第18周
第19周

概率基础与离散概率分布

学习概率的基本概念，包括机器学习中的不确定性、概率的直观理解、频率派与贝叶斯派、随机变量等。学习离散概率分布，包括伯努利分布、二项分布、多项伯努利分布、多项分布等。

课程安排：

连续概率分布与概率密度估计

学习连续概率分布，包括正态分布、指数分布、泊松分布、帕累托分布等。学习概率密度估计的基本概念，包括直方图、参数密度估计、核密度估计等。

课程安排：

最大似然估计，贝叶斯概率

学习最大似然估计的基本概念，包括似然、最大似然、正态分布的最大似然函数、逻辑回归等。学习贝叶斯概率的基本概念，包括贝叶斯定理、贝叶斯分类器、朴素贝叶斯分类器等。

课程安排：

贝叶斯回归

学习贝叶斯回归的基本概念，包括贝叶斯回归、正则化等。

课程安排：

1、贝叶斯回归，用概率的眼光和工具来重新认识回归问题
2、贝叶斯回归数学推导：先验分布选择与后验概率更新机制
3、贝叶斯回归的代码实现
5、正则化技术解析：贝叶斯先验分布与L2正则化的数学等价性
6、练习：贝叶斯回归

阶段六：综合实战、总结

1门课 · 课程总时长：10小时

第20周

大语言模型实现：深入大语言模型的核心数学原理

分解大语言模型结构，亲手实现一个大语言模型。综合整个课中所学，理解数学为大语言模型提供的算法和理论基础、优化方法以及在数据分析和处理中的关键作用；直观感受大语言模型的语义逻辑和模型深层的向量脉动

课程安排：

1、生成式AI预训练与微调的核心骨架Transformer的总体架构析
2、文本语义建模与序列位置敏感性增强：词嵌入与位置编码
3、自注意力机制数学推导：权重动态分配与机器翻译对齐优化
4、解码器核心技术栈：掩码多头注意力与跨层上下文融合的文本生成控制

热搜

最近搜索清空

数学—AI人工智能基石

程序员友好设计，4大独家优势架构数学内核与工程实践桥梁

围绕AI筛选知识点，一站式掌握与AI紧密关联的数学知识体系,只学有用的

数学与AI项目实例紧密融合，学员动手实操，避免一看就会，一用就废

项目简介

项目内容：

对应数学原理：

项目简介

项目内容：

对应数学原理：

项目简介

项目内容：

对应数学原理：

项目简介

项目内容：

对应数学原理：

还有一套机器学习工具与框架，让你更高效的学习和构建业务解决方案

慕课网诚意钜献，为你量身定制

学前技术储备

真正从0到1的AI工程师养成，更系统更顺滑的AI大模型学习路径

资深技术专家授课，精准干货+专业指导，让你的每分钟收获满满

GuoSr

除了出色的视频内容，这里有伴你整个职业生涯的“成长社区”

学习时你能在这里获取答案，工作后你能在这里解决难题

由于课程类型与教学目标不同，学习服务会有不同，具体服务可在线咨询

课程大纲及学习周期安排

为保证课程内容紧跟市场变化，课程章节将逐步开放，直至课程完结

线性代数入门：由来、与人工智能的关系

课程安排：

矩阵进阶运算与矩阵分解

课程安排：

特征分解

课程安排：

奇异值分解SVD

课程安排：

主成分分析PCA

课程安排：

Numpy快速上手，用Python实现矩阵

课程安排：

数据处理方法与矩阵与图形变换

课程安排：

微积分入门，微积分核心基础

课程安排：

微积分进阶与多元微积分

课程安排：

积分基础

课程安排：

用微积分知识实现一个神经网络

课程安排：

ROC曲线与分类性能评估

课程安排：

神经网络梯度问题

课程安排：

神经网络自动微分

课程安排：

偏导数与模型优化与支持向量机SVM

课程安排：

概率基础与离散概率分布

课程安排：

连续概率分布与概率密度估计

课程安排：

最大似然估计，贝叶斯概率

课程安排：

贝叶斯回归

课程安排：

大语言模型实现：深入大语言模型的核心数学原理

课程安排：

选课遇到问题？添加指导老师微信，1V1为您解答~ 发送“课程名称”至老师微信，还可领取课程专属福利！

程序员数学体系课

LLM算法工程师全能实战营

LLM应用开发平台特训营

AI人工智能算法工程师

鸿蒙原生应用开发工程师

物联网/嵌入式工程师

LLM大语言模型

Java工程师

Python全能工程师

前端工程师

选课遇到问题？添加指导老师微信，1V1为您解答~
发送“课程名称”至老师微信，还可领取课程专属福利！