复习目标学会所有核心名词、意义、本质作用总纲高等数学本质上研究三件事变化、累积、逼近。也就是核心问题数学工具本质作用一个量如何变化导数、微分描述瞬时变化率一个量累计了多少积分描述总量、面积、体积、功一个复杂对象如何近似极限、级数、泰勒公式用简单东西逼近复杂东西理工科高数不是为了算题而存在的它是为了描述世界物体运动、信号变化、神经网络优化、图像处理、概率密度、热传导、电路、机器学习损失函数本质都离不开高数。第 0 部分高数的整体地图高等数学主要包括函数极限连续导数微分中值定理不定积分定积分微分方程多元函数微分学重积分曲线积分与曲面积分无穷级数不是每个证明都掌握而是先建立“数学世界观”。第一天一元函数微积分1. 函数变量之间的关系1.1 什么是函数函数就是一种对应关系意思是给一个输入 (x)按照某种规则得到一个输出 (y)。比如输入 2输出 4输入 3输出 9。1.2 函数存在的意义现实世界中大量问题都是“一个量影响另一个量”。比如所以函数的本质是把现实中的因果关系、依赖关系抽象成数学关系。2. 定义域、值域、对应法则定义域函数允许输入的 x 的范围。比如要求所以定义域是值域函数输出 (y) 可能取到的范围。比如值域是对应法则输入和输出之间的规则。比如对应法则就是“平方再加 1”。本质作用定义域告诉你这个数学模型在哪些输入下有意义。值域告诉你这个模型可能产生哪些结果。对应法则告诉你输入如何变成输出。3. 基本初等函数高数最常见的函数有指数函数为什么重要它的特点是也就是它的变化率等于它自己。所以它天然适合描述场景原因人口增长越多增长越快细菌繁殖当前数量决定增长速度复利本金越多增长越快神经网络激活常用于非线性建模概率分布高斯分布、指数分布中大量出现对数函数为什么重要对数是指数的反函数。它可以把乘法变成加法所以在计算机、信息论、机器学习中非常重要。比如交叉熵损失意思是如果模型给正确答案的概率越小惩罚越大。4. 极限无限接近的思想4.1 什么是极限极限研究的是当 (x) 趋近某个值时函数 (f(x)) 趋近什么。写作意思是当 (x) 越来越靠近 (a)(f(x)) 越来越靠近 (A)。4.2 极限存在的意义极限是高数的地基。因为很多东西不能直接算只能通过“无限逼近”定义。比如概念为什么需要极限瞬时速度不能直接用平均速度只能令时间间隔趋近 0切线斜率不能直接用割线只能让两点无限接近面积曲边图形不能直接算只能切成无限多个小矩形无穷级数无限项求和需要极限连续性左右无限靠近时函数值是否一致4.3 一个经典例子瞬时速度平均速度如果 (\Delta t) 越来越小这就是导数。所以导数的本质是极限下的变化率。5. 左极限、右极限左极限意思是 (x) 从左边靠近 (a)。右极限意思是 (x) 从右边靠近 (a)。极限存在的条件存在当且仅当本质作用左右极限用来判断一个函数在某个点附近是否稳定地趋向同一个值。比如分段函数、跳跃函数、信号突变都要看左右极限。6. 无穷小与无穷大无穷小如果那么 (f(x)) 是无穷小。本质越来越接近 0 的量。比如时(x)、(x^2)、(\sin x) 都是无穷小。无穷大如果那么 (f(x)) 是无穷大。本质越来越大无法被有限数限制。比如本质作用无穷小用来描述局部误差。无穷大用来描述爆炸增长、发散行为。7. 等价无穷小7.1 什么是等价无穷小如果那么意思是当 (x) 很小时(f(x)) 和 (g(x)) 几乎一样。7.2 常见等价无穷小7.3 本质作用等价无穷小的作用是把复杂函数在局部变成简单函数。比如因为所以这就是高数里的“局部近似思想”。8. 连续没有断裂的函数8.1 什么是连续函数 (f(x)) 在 (xa) 处连续需要满足也就是极限值等于函数值。8.2 连续的直观理解连续函数就是图像不断、不跳、不炸。比如是连续的。但这个函数在 (x0) 不连续因为左边趋向 1右边趋向 2。8.3 本质作用连续意味着输入发生微小变化输出也只发生微小变化。这对理工科非常重要。比如场景连续的意义机械系统小扰动不会导致系统崩溃图像处理像素变化应有平滑响应优化算法参数微调时损失函数变化可控物理建模真实世界大多数宏观量连续变化第二部分导数与微分9. 导数瞬时变化率9.1 导数的定义它来自平均变化率当 Δx→0时就变成瞬时变化率。9.2 导数的几何意义导数是曲线在某一点的切线斜率。如果函数在上升。如果函数在下降。如果可能是极值点。9.3 导数的物理意义如果表示位置那么表示速度。表示加速度。所以数学概念物理意义函数位置一阶导数速度二阶导数加速度9.4 导数的本质作用导数回答的问题是某个量现在变化得有多快这是优化、控制、建模的核心。比如机器学习中表示损失函数 (L) 对参数 (w) 的变化率。如果这个导数很大说明参数稍微变一下损失会变化很多。10. 常见导数公式必须熟练掌握这些公式不是死背它们代表不同类型函数的变化规律。11. 求导法则11.1 加减法则意思是总变化率等于各部分变化率之和。11.2 乘法法则为什么不是简单的 (fg)因为两个量都在变。比如矩形面积如果长和宽都变化面积变化来自两部分长变化带来的面积变化宽变化带来的面积变化。11.3 除法法则用于处理比值关系。11.4 链式法则这是最重要的求导法则。本质是外层变化率 × 内层变化率。比如外层是内层是所以11.5 链式法则的理工科意义神经网络反向传播就是链式法则。模型可能是损失对某个参数的影响需要一层层传回去所以你学链式法则就是在学深度学习的数学根基。12. 高阶导数12.1 二阶导数是一阶导数的导数。如果一阶导数表示变化率那么二阶导数表示变化率的变化率。12.2 几何意义如果函数图像向上凸像碗。如果函数图像向下凸像山。12.3 物理意义位置的一阶导数是速度速度的一阶导数是加速度所以12.4 本质作用二阶导数告诉你函数弯曲程度、趋势是否加速变化。在优化中13. 微分局部线性近似13.1 什么是微分如果这叫微分。其中13.2 微分的本质微分的本质是在一个很小的范围内用直线近似曲线。比如这就是局部线性近似。13.3 为什么重要复杂函数很难直接算但在局部可以近似成直线。这在理工科里极其重要场景微分的作用误差估计输入误差导致输出误差数值计算用近似代替精确机器学习梯度下降的理论基础物理建模小扰动分析工程控制局部线性化系统14. 函数单调性与极值14.1 单调性如果函数递增。如果函数递减。14.2 极值极大值局部最高点。极小值局部最低点。极值候选点通常满足但注意只是可能有极值不一定有。例如在 (x0) 处但它不是极值点。14.3 本质作用极值问题本质上是优化问题在所有可能选择中找到最好或最坏的结果。比如问题极值意义利润最大最大值成本最小最小值损失函数最小机器学习训练材料强度最大工程设计路径最短优化问题15. 中值定理中值定理是导数理论的核心。15.1 罗尔定理直观理解如果你从同一高度出发又回到同一高度中间某一刻速度一定为 0。15.2 拉格朗日中值定理15.3 柯西中值定理它是拉格朗日中值定理的推广用于两个函数之间的变化率比较。15.4 本质作用中值定理连接了局部变化率和整体变化量。这对证明不等式、判断函数性质、推导洛必达法则都很重要。16. 洛必达法则16.1 用来解决什么洛必达法则用于处理极限中的未定式或16.2 公式如果16.3 例子16.4 本质作用洛必达法则的本质是当两个函数都趋近 0 或都趋近无穷时比较它们的变化速度。谁变化得更快谁占主导。第三部分积分17. 不定积分求导的逆运算17.1 什么是不定积分如果那么这里 F(x) 叫 f(x) 的原函数。17.2 本质作用不定积分回答的问题是已知变化率反推原来的函数。比如已知速度想求位置17.3 为什么有 (C)因为把常数消掉。所以积分恢复原函数时需要加上任意常数 (C)。17.4 常见积分公式18. 定积分累积总量18.1 什么是定积分表示函数 f(x) 在区间 [a,b]上的累积量。如果 (f(x)\geq 0)它可以表示曲线下面积。18.2 定积分的本质定积分的本质是把连续变化的量切成无数个小块再全部加起来。也就是18.3 直观理解如果速度是 v(t)那么位移是因为速度不断变化时就切成很多小时间段再全部加起来。18.4 本质作用定积分解决的是知道局部密度或局部变化率求整体总量。比如已知积分求什么速度位移加速度速度变化概率密度概率力功电流电荷量面密度质量损失曲线总误差19. 微积分基本定理19.1 核心公式19.2 本质意义微积分基本定理说明求变化率的导数和求累积量的积分是互逆关系。导数研究“局部变化”积分研究“整体累积”。它们之间的关系是例如位置变化等于速度在时间上的累积。20. 积分方法20.1 换元积分法适合处理复合函数。比如令则所以本质把复杂变量换成简单变量。20.2 分部积分法公式适合处理两个函数相乘。比如本质积分版的乘法求导法则。21. 定积分应用21.1 求面积如果是两条曲线之间的面积21.2 求体积旋转体体积21.3 求弧长21.4 求功因为功是力在位移上的累积。21.5 本质作用积分应用的统一思想是把复杂对象切成小块每小块近似简单再累加。第二天多元微积分、微分方程、级数第四部分多元函数微分学22. 多元函数22.1 什么是多元函数一元函数多元函数或者意思是一个结果由多个变量共同决定。比如22.2 本质作用多元函数描述的是多因素共同影响一个结果。这比一元函数更接近真实世界。23. 偏导数23.1 什么是偏导数对于对 (x) 求偏导意思是固定 (y)只看 (x) 变化时(z) 怎么变。对 (y) 求偏导意思是固定 (x)只看 (y) 变化时(z) 怎么变。23.2 例子对 (x) 求偏导因为 (y) 当常数。对 (y) 求偏导因为 (x) 当常数。23.3 本质作用偏导数回答某一个因素单独变化时对结果有多大影响。机器学习里表示第 (i) 个参数对损失函数的影响。24. 全微分24.1 什么是全微分对于有意思是输出的总变化等于每个变量变化造成的影响之和。24.2 本质作用全微分是多变量情况下的局部线性近似。它的思想是多因素小变化时总影响可以分解成各因素影响之和。25. 梯度25.1 什么是梯度对于多元函数梯度是对于更多变量25.2 梯度的本质意义梯度指向函数增长最快的方向。负梯度方向指向函数下降最快的方向。25.3 为什么机器学习要学梯度神经网络训练就是最小化损失函数梯度下降更新其中本质是朝着损失下降最快的方向走一小步。所以梯度是优化算法的核心。26. 方向导数26.1 什么是方向导数偏导数只看坐标轴方向。方向导数看任意方向。其中 u 是单位方向向量。26.2 本质作用方向导数回答沿某个方向走函数变化得有多快梯度方向变化最快和梯度垂直的方向变化为 0。27. 多元函数极值27.1 极值点条件如果函数在某点有极值通常满足也就是27.2 Hessian 矩阵二阶偏导数组成的矩阵叫 Hessian它描述函数的弯曲程度。27.3 本质作用多元极值就是高维优化问题。比如机器学习中就是一个超高维函数。训练模型就是寻找第五部分重积分28. 二重积分28.1 什么是二重积分表示函数 (f(x,y)) 在区域 (D) 上的累积。如果 (f(x,y)) 是高度那么二重积分表示体积。28.2 本质作用二重积分是二维区域上的累积。比如(f(x,y)) 表示二重积分表示高度体积面密度质量概率密度概率温度热量总和图像灰度区域亮度总和28.3 计算方法一般转化为累次积分本质是先沿一个方向累积再沿另一个方向累积。29. 三重积分29.1 什么是三重积分表示三维空间区域Ω上的累积。29.2 本质作用三重积分是空间中的累积。比如(f(x,y,z)) 表示三重积分表示体密度质量电荷密度总电荷温度分布总热量概率密度空间概率30. 坐标变换30.1 极坐标当区域有圆形特征时用极坐标面积微元注意多了一个 r。30.2 为什么多一个 r因为极坐标下小区域面积不是简单的 (drd\theta)而是离原点越远同样角度扫过的弧越长。30.3 本质作用坐标变换的目的换一个更适合问题形状的坐标系让积分更简单。比如圆形区域用极坐标球形区域用球坐标。第六部分曲线积分与曲面积分这部分很多理工科高数会学但两天速通只需要理解本质。31. 曲线积分31.1 第一类曲线积分沿曲线累积标量。比如(f) 表示积分表示线密度曲线质量温度沿路径总热量灰度边缘强度累积本质沿一条弯曲路径把某个量累加起来。31.2 第二类曲线积分常用于计算力场做功。如果力场是那么功是本质沿路径方向累积向量场对运动的贡献。32. 曲面积分32.1 第一类曲面积分沿曲面积累标量。比如曲面质量。32.2 第二类曲面积分表示通量。本质有多少向量场穿过这个曲面。比如场景通量意义流体穿过曲面的流量电场穿过曲面的电通量磁场穿过曲面的磁通量热传导穿过边界的热流33. 格林公式、高斯公式、斯托克斯公式这三个公式不用一开始死磕证明要先明白它们在干什么。33.1 格林公式把平面区域边界上的曲线积分转化为区域内部的二重积分。本质边界上的总效应等于内部旋转或变化的累积。33.2 高斯公式把封闭曲面的通量转化为体积分。本质穿出边界的总量等于内部源头产生的总量。比如一个水池里有很多喷泉边界流出去多少水取决于内部总共生成多少水。33.3 斯托克斯公式把空间曲线积分和曲面积分联系起来。本质边界上的环流等于曲面内部旋转的累积。33.4 统一理解这三个公式本质上都是边界上的整体效应 内部局部变化的累积。这是现代数学和物理的核心思想之一。第七部分微分方程34. 什么是微分方程含有未知函数及其导数的方程叫微分方程。比如这里未知的不是一个数而是一个函数 y(x)。本质作用微分方程描述的是一个系统的变化规律。你不是直接知道结果而是知道它如何变化。35. 为什么微分方程重要现实世界很多规律不是直接告诉你结果而是告诉你变化规则。比如现实系统微分方程思想人口增长增长速度与当前人口有关传染病传播感染速度与接触人数有关物体运动加速度由力决定电路系统电流、电压随时间变化神经网络训练参数随梯度变化药物代谢浓度按比例衰减经典例子指数增长意思是增长速度正比于当前数量。解是这就是指数增长。指数衰减解是用于描述放射性衰变、药物代谢、冷却过程等。36. 一阶微分方程36.1 可分离变量方程形式可以整理成然后两边积分。36.2 本质可分离变量法就是把 x 和y分开各自积分。37. 二阶微分方程典型形式常用于振动、电路、控制系统。本质作用二阶微分方程描述一个系统的加速度、速度、位置之间的关系。比如弹簧振子表示力和位移成正比方向相反。第八部分无穷级数38. 数列数列是按顺序排列的一串数本质离散版本的函数。函数是连续输入数列是整数输入。39. 数项级数39.1 什么是级数就是无限多个数相加。39.2 收敛与发散如果前 (n) 项和当 n→∞ 时趋向一个有限值叫收敛。否则叫发散。39.3 本质作用级数回答无限多个越来越小的东西加起来最终是否有限比如虽然有无限项但总和有限。40. 常见级数40.1 等比级数40.2 调和级数40.3 p 级数41. 幂级数41.1 什么是幂级数它像一个无限次多项式。41.2 本质作用幂级数的作用是用无限多项式表示复杂函数。比如这非常重要。因为多项式最容易计算而很多复杂函数可以用多项式逼近。42. 泰勒公式42.1 什么是泰勒公式泰勒公式就是用多项式近似函数。在 x0 附近42.2 本质作用泰勒公式的本质是用函数在某一点的信息预测附近的函数值。它用到函数值一阶导数二阶导数更高阶导数。42.3 为什么重要因为现实中很多函数很复杂但局部可以用多项式近似。比如这就是前面等价无穷小的来源。42.4 机器学习里的意义深度学习优化中经常用一阶近似牛顿法使用二阶近似所以泰勒公式是优化理论的底层工具。两天学习安排第一天上午函数、极限、连续重点掌握函数是什么定义域和值域极限的本质左右极限无穷小等价无穷小连续性。你要形成这个认识极限是高数地基导数和积分都靠极限定义。第一天下午导数、微分、极值重点掌握导数定义导数几何意义导数物理意义常见求导公式链式法则高阶导数微分极值与最值中值定理洛必达法则。你要形成这个认识导数研究变化率微分研究局部近似极值研究优化。第一天晚上积分重点掌握不定积分定积分微积分基本定理换元积分分部积分面积体积功累积思想。你要形成这个认识积分研究累积定积分是连续加法。第二天上午多元函数微积分重点掌握多元函数偏导数全微分梯度方向导数多元极值Hessian 矩阵。你要形成这个认识多元微积分就是在多因素系统里研究变化和优化。第二天下午重积分、曲线曲面积分重点掌握二重积分三重积分极坐标曲线积分曲面积分通量格林公式高斯公式斯托克斯公式。你要形成这个认识高维积分就是在区域、空间、路径、曲面上做累积。第二天晚上微分方程、级数、泰勒公式重点掌握微分方程是什么一阶微分方程二阶微分方程数项级数收敛与发散幂级数泰勒公式。你要形成这个认识微分方程描述动态系统级数和泰勒公式用于逼近复杂函数。高数所有核心概念一句话总结名词一句话本质函数输入和输出的关系定义域输入允许取值范围值域输出可能结果范围极限无限接近时的趋势连续输入小变输出小变无穷小趋近于 0 的量无穷大趋向无限大的量等价无穷小局部可互相替代的简单近似导数瞬时变化率微分局部线性近似高阶导数变化率的变化率单调性函数上升或下降极值局部最好或最坏中值定理局部变化率和整体变化率的桥梁洛必达法则比较两个函数谁变化得更快不定积分求导的逆运算定积分连续累积微积分基本定理导数和积分互逆偏导数单个变量对结果的影响全微分多个变量小变化造成的总影响梯度函数上升最快方向方向导数沿某方向的变化率Hessian二阶弯曲信息二重积分平面区域上的累积三重积分空间区域上的累积曲线积分沿路径累积曲面积分沿曲面累积通量穿过曲面的总量微分方程描述系统变化规律的方程级数无限项求和收敛无限累加后仍有限发散无限累加后无限或无稳定值幂级数用无限多项式表示函数泰勒公式用多项式近似复杂函数理工科真正要抓住的高数主线你不要把高数看成一堆公式而要看成一条逻辑链第一层函数现实关系抽象成函数第二层极限用无限逼近处理精确概念第三层导数用极限定义瞬时变化率第四层积分用极限定义连续累积第五层多元微积分把一元变化推广到多因素系统第六层微分方程用导数描述系统演化第七层级数与泰勒用简单多项式逼近复杂函数这就是高数的骨架。对你来说最重要的学习优先级你是软件工程背景准备保研/夏令营/机试/AI 项目高数里最重要的是第一优先级必须真正理解极限导数微分链式法则偏导数梯度泰勒公式积分的累积思想。这些和机器学习、优化、深度学习直接相关。第二优先级需要会用洛必达常见积分多元函数极值二重积分微分方程基本形式级数收敛判断。第三优先级有时间再深入曲线积分曲面积分格林公式高斯公式斯托克斯公式严格 (\epsilon-\delta) 证明。最后的本质总结高等数学不是一门“算题课”而是一门“理解变化的语言”。你学函数是为了描述关系。你学极限是为了处理无限逼近。你学导数是为了理解瞬时变化。你学积分是为了理解连续累积。你学偏导和梯度是为了理解多因素优化。你学微分方程是为了理解系统演化。你学泰勒公式是为了用简单模型逼近复杂世界。所以高数最核心的一句话是用极限建立精确概念用导数刻画变化用积分刻画累积用泰勒公式刻画近似用微分方程刻画演化。
高等数学一轮复习
复习目标学会所有核心名词、意义、本质作用总纲高等数学本质上研究三件事变化、累积、逼近。也就是核心问题数学工具本质作用一个量如何变化导数、微分描述瞬时变化率一个量累计了多少积分描述总量、面积、体积、功一个复杂对象如何近似极限、级数、泰勒公式用简单东西逼近复杂东西理工科高数不是为了算题而存在的它是为了描述世界物体运动、信号变化、神经网络优化、图像处理、概率密度、热传导、电路、机器学习损失函数本质都离不开高数。第 0 部分高数的整体地图高等数学主要包括函数极限连续导数微分中值定理不定积分定积分微分方程多元函数微分学重积分曲线积分与曲面积分无穷级数不是每个证明都掌握而是先建立“数学世界观”。第一天一元函数微积分1. 函数变量之间的关系1.1 什么是函数函数就是一种对应关系意思是给一个输入 (x)按照某种规则得到一个输出 (y)。比如输入 2输出 4输入 3输出 9。1.2 函数存在的意义现实世界中大量问题都是“一个量影响另一个量”。比如所以函数的本质是把现实中的因果关系、依赖关系抽象成数学关系。2. 定义域、值域、对应法则定义域函数允许输入的 x 的范围。比如要求所以定义域是值域函数输出 (y) 可能取到的范围。比如值域是对应法则输入和输出之间的规则。比如对应法则就是“平方再加 1”。本质作用定义域告诉你这个数学模型在哪些输入下有意义。值域告诉你这个模型可能产生哪些结果。对应法则告诉你输入如何变成输出。3. 基本初等函数高数最常见的函数有指数函数为什么重要它的特点是也就是它的变化率等于它自己。所以它天然适合描述场景原因人口增长越多增长越快细菌繁殖当前数量决定增长速度复利本金越多增长越快神经网络激活常用于非线性建模概率分布高斯分布、指数分布中大量出现对数函数为什么重要对数是指数的反函数。它可以把乘法变成加法所以在计算机、信息论、机器学习中非常重要。比如交叉熵损失意思是如果模型给正确答案的概率越小惩罚越大。4. 极限无限接近的思想4.1 什么是极限极限研究的是当 (x) 趋近某个值时函数 (f(x)) 趋近什么。写作意思是当 (x) 越来越靠近 (a)(f(x)) 越来越靠近 (A)。4.2 极限存在的意义极限是高数的地基。因为很多东西不能直接算只能通过“无限逼近”定义。比如概念为什么需要极限瞬时速度不能直接用平均速度只能令时间间隔趋近 0切线斜率不能直接用割线只能让两点无限接近面积曲边图形不能直接算只能切成无限多个小矩形无穷级数无限项求和需要极限连续性左右无限靠近时函数值是否一致4.3 一个经典例子瞬时速度平均速度如果 (\Delta t) 越来越小这就是导数。所以导数的本质是极限下的变化率。5. 左极限、右极限左极限意思是 (x) 从左边靠近 (a)。右极限意思是 (x) 从右边靠近 (a)。极限存在的条件存在当且仅当本质作用左右极限用来判断一个函数在某个点附近是否稳定地趋向同一个值。比如分段函数、跳跃函数、信号突变都要看左右极限。6. 无穷小与无穷大无穷小如果那么 (f(x)) 是无穷小。本质越来越接近 0 的量。比如时(x)、(x^2)、(\sin x) 都是无穷小。无穷大如果那么 (f(x)) 是无穷大。本质越来越大无法被有限数限制。比如本质作用无穷小用来描述局部误差。无穷大用来描述爆炸增长、发散行为。7. 等价无穷小7.1 什么是等价无穷小如果那么意思是当 (x) 很小时(f(x)) 和 (g(x)) 几乎一样。7.2 常见等价无穷小7.3 本质作用等价无穷小的作用是把复杂函数在局部变成简单函数。比如因为所以这就是高数里的“局部近似思想”。8. 连续没有断裂的函数8.1 什么是连续函数 (f(x)) 在 (xa) 处连续需要满足也就是极限值等于函数值。8.2 连续的直观理解连续函数就是图像不断、不跳、不炸。比如是连续的。但这个函数在 (x0) 不连续因为左边趋向 1右边趋向 2。8.3 本质作用连续意味着输入发生微小变化输出也只发生微小变化。这对理工科非常重要。比如场景连续的意义机械系统小扰动不会导致系统崩溃图像处理像素变化应有平滑响应优化算法参数微调时损失函数变化可控物理建模真实世界大多数宏观量连续变化第二部分导数与微分9. 导数瞬时变化率9.1 导数的定义它来自平均变化率当 Δx→0时就变成瞬时变化率。9.2 导数的几何意义导数是曲线在某一点的切线斜率。如果函数在上升。如果函数在下降。如果可能是极值点。9.3 导数的物理意义如果表示位置那么表示速度。表示加速度。所以数学概念物理意义函数位置一阶导数速度二阶导数加速度9.4 导数的本质作用导数回答的问题是某个量现在变化得有多快这是优化、控制、建模的核心。比如机器学习中表示损失函数 (L) 对参数 (w) 的变化率。如果这个导数很大说明参数稍微变一下损失会变化很多。10. 常见导数公式必须熟练掌握这些公式不是死背它们代表不同类型函数的变化规律。11. 求导法则11.1 加减法则意思是总变化率等于各部分变化率之和。11.2 乘法法则为什么不是简单的 (fg)因为两个量都在变。比如矩形面积如果长和宽都变化面积变化来自两部分长变化带来的面积变化宽变化带来的面积变化。11.3 除法法则用于处理比值关系。11.4 链式法则这是最重要的求导法则。本质是外层变化率 × 内层变化率。比如外层是内层是所以11.5 链式法则的理工科意义神经网络反向传播就是链式法则。模型可能是损失对某个参数的影响需要一层层传回去所以你学链式法则就是在学深度学习的数学根基。12. 高阶导数12.1 二阶导数是一阶导数的导数。如果一阶导数表示变化率那么二阶导数表示变化率的变化率。12.2 几何意义如果函数图像向上凸像碗。如果函数图像向下凸像山。12.3 物理意义位置的一阶导数是速度速度的一阶导数是加速度所以12.4 本质作用二阶导数告诉你函数弯曲程度、趋势是否加速变化。在优化中13. 微分局部线性近似13.1 什么是微分如果这叫微分。其中13.2 微分的本质微分的本质是在一个很小的范围内用直线近似曲线。比如这就是局部线性近似。13.3 为什么重要复杂函数很难直接算但在局部可以近似成直线。这在理工科里极其重要场景微分的作用误差估计输入误差导致输出误差数值计算用近似代替精确机器学习梯度下降的理论基础物理建模小扰动分析工程控制局部线性化系统14. 函数单调性与极值14.1 单调性如果函数递增。如果函数递减。14.2 极值极大值局部最高点。极小值局部最低点。极值候选点通常满足但注意只是可能有极值不一定有。例如在 (x0) 处但它不是极值点。14.3 本质作用极值问题本质上是优化问题在所有可能选择中找到最好或最坏的结果。比如问题极值意义利润最大最大值成本最小最小值损失函数最小机器学习训练材料强度最大工程设计路径最短优化问题15. 中值定理中值定理是导数理论的核心。15.1 罗尔定理直观理解如果你从同一高度出发又回到同一高度中间某一刻速度一定为 0。15.2 拉格朗日中值定理15.3 柯西中值定理它是拉格朗日中值定理的推广用于两个函数之间的变化率比较。15.4 本质作用中值定理连接了局部变化率和整体变化量。这对证明不等式、判断函数性质、推导洛必达法则都很重要。16. 洛必达法则16.1 用来解决什么洛必达法则用于处理极限中的未定式或16.2 公式如果16.3 例子16.4 本质作用洛必达法则的本质是当两个函数都趋近 0 或都趋近无穷时比较它们的变化速度。谁变化得更快谁占主导。第三部分积分17. 不定积分求导的逆运算17.1 什么是不定积分如果那么这里 F(x) 叫 f(x) 的原函数。17.2 本质作用不定积分回答的问题是已知变化率反推原来的函数。比如已知速度想求位置17.3 为什么有 (C)因为把常数消掉。所以积分恢复原函数时需要加上任意常数 (C)。17.4 常见积分公式18. 定积分累积总量18.1 什么是定积分表示函数 f(x) 在区间 [a,b]上的累积量。如果 (f(x)\geq 0)它可以表示曲线下面积。18.2 定积分的本质定积分的本质是把连续变化的量切成无数个小块再全部加起来。也就是18.3 直观理解如果速度是 v(t)那么位移是因为速度不断变化时就切成很多小时间段再全部加起来。18.4 本质作用定积分解决的是知道局部密度或局部变化率求整体总量。比如已知积分求什么速度位移加速度速度变化概率密度概率力功电流电荷量面密度质量损失曲线总误差19. 微积分基本定理19.1 核心公式19.2 本质意义微积分基本定理说明求变化率的导数和求累积量的积分是互逆关系。导数研究“局部变化”积分研究“整体累积”。它们之间的关系是例如位置变化等于速度在时间上的累积。20. 积分方法20.1 换元积分法适合处理复合函数。比如令则所以本质把复杂变量换成简单变量。20.2 分部积分法公式适合处理两个函数相乘。比如本质积分版的乘法求导法则。21. 定积分应用21.1 求面积如果是两条曲线之间的面积21.2 求体积旋转体体积21.3 求弧长21.4 求功因为功是力在位移上的累积。21.5 本质作用积分应用的统一思想是把复杂对象切成小块每小块近似简单再累加。第二天多元微积分、微分方程、级数第四部分多元函数微分学22. 多元函数22.1 什么是多元函数一元函数多元函数或者意思是一个结果由多个变量共同决定。比如22.2 本质作用多元函数描述的是多因素共同影响一个结果。这比一元函数更接近真实世界。23. 偏导数23.1 什么是偏导数对于对 (x) 求偏导意思是固定 (y)只看 (x) 变化时(z) 怎么变。对 (y) 求偏导意思是固定 (x)只看 (y) 变化时(z) 怎么变。23.2 例子对 (x) 求偏导因为 (y) 当常数。对 (y) 求偏导因为 (x) 当常数。23.3 本质作用偏导数回答某一个因素单独变化时对结果有多大影响。机器学习里表示第 (i) 个参数对损失函数的影响。24. 全微分24.1 什么是全微分对于有意思是输出的总变化等于每个变量变化造成的影响之和。24.2 本质作用全微分是多变量情况下的局部线性近似。它的思想是多因素小变化时总影响可以分解成各因素影响之和。25. 梯度25.1 什么是梯度对于多元函数梯度是对于更多变量25.2 梯度的本质意义梯度指向函数增长最快的方向。负梯度方向指向函数下降最快的方向。25.3 为什么机器学习要学梯度神经网络训练就是最小化损失函数梯度下降更新其中本质是朝着损失下降最快的方向走一小步。所以梯度是优化算法的核心。26. 方向导数26.1 什么是方向导数偏导数只看坐标轴方向。方向导数看任意方向。其中 u 是单位方向向量。26.2 本质作用方向导数回答沿某个方向走函数变化得有多快梯度方向变化最快和梯度垂直的方向变化为 0。27. 多元函数极值27.1 极值点条件如果函数在某点有极值通常满足也就是27.2 Hessian 矩阵二阶偏导数组成的矩阵叫 Hessian它描述函数的弯曲程度。27.3 本质作用多元极值就是高维优化问题。比如机器学习中就是一个超高维函数。训练模型就是寻找第五部分重积分28. 二重积分28.1 什么是二重积分表示函数 (f(x,y)) 在区域 (D) 上的累积。如果 (f(x,y)) 是高度那么二重积分表示体积。28.2 本质作用二重积分是二维区域上的累积。比如(f(x,y)) 表示二重积分表示高度体积面密度质量概率密度概率温度热量总和图像灰度区域亮度总和28.3 计算方法一般转化为累次积分本质是先沿一个方向累积再沿另一个方向累积。29. 三重积分29.1 什么是三重积分表示三维空间区域Ω上的累积。29.2 本质作用三重积分是空间中的累积。比如(f(x,y,z)) 表示三重积分表示体密度质量电荷密度总电荷温度分布总热量概率密度空间概率30. 坐标变换30.1 极坐标当区域有圆形特征时用极坐标面积微元注意多了一个 r。30.2 为什么多一个 r因为极坐标下小区域面积不是简单的 (drd\theta)而是离原点越远同样角度扫过的弧越长。30.3 本质作用坐标变换的目的换一个更适合问题形状的坐标系让积分更简单。比如圆形区域用极坐标球形区域用球坐标。第六部分曲线积分与曲面积分这部分很多理工科高数会学但两天速通只需要理解本质。31. 曲线积分31.1 第一类曲线积分沿曲线累积标量。比如(f) 表示积分表示线密度曲线质量温度沿路径总热量灰度边缘强度累积本质沿一条弯曲路径把某个量累加起来。31.2 第二类曲线积分常用于计算力场做功。如果力场是那么功是本质沿路径方向累积向量场对运动的贡献。32. 曲面积分32.1 第一类曲面积分沿曲面积累标量。比如曲面质量。32.2 第二类曲面积分表示通量。本质有多少向量场穿过这个曲面。比如场景通量意义流体穿过曲面的流量电场穿过曲面的电通量磁场穿过曲面的磁通量热传导穿过边界的热流33. 格林公式、高斯公式、斯托克斯公式这三个公式不用一开始死磕证明要先明白它们在干什么。33.1 格林公式把平面区域边界上的曲线积分转化为区域内部的二重积分。本质边界上的总效应等于内部旋转或变化的累积。33.2 高斯公式把封闭曲面的通量转化为体积分。本质穿出边界的总量等于内部源头产生的总量。比如一个水池里有很多喷泉边界流出去多少水取决于内部总共生成多少水。33.3 斯托克斯公式把空间曲线积分和曲面积分联系起来。本质边界上的环流等于曲面内部旋转的累积。33.4 统一理解这三个公式本质上都是边界上的整体效应 内部局部变化的累积。这是现代数学和物理的核心思想之一。第七部分微分方程34. 什么是微分方程含有未知函数及其导数的方程叫微分方程。比如这里未知的不是一个数而是一个函数 y(x)。本质作用微分方程描述的是一个系统的变化规律。你不是直接知道结果而是知道它如何变化。35. 为什么微分方程重要现实世界很多规律不是直接告诉你结果而是告诉你变化规则。比如现实系统微分方程思想人口增长增长速度与当前人口有关传染病传播感染速度与接触人数有关物体运动加速度由力决定电路系统电流、电压随时间变化神经网络训练参数随梯度变化药物代谢浓度按比例衰减经典例子指数增长意思是增长速度正比于当前数量。解是这就是指数增长。指数衰减解是用于描述放射性衰变、药物代谢、冷却过程等。36. 一阶微分方程36.1 可分离变量方程形式可以整理成然后两边积分。36.2 本质可分离变量法就是把 x 和y分开各自积分。37. 二阶微分方程典型形式常用于振动、电路、控制系统。本质作用二阶微分方程描述一个系统的加速度、速度、位置之间的关系。比如弹簧振子表示力和位移成正比方向相反。第八部分无穷级数38. 数列数列是按顺序排列的一串数本质离散版本的函数。函数是连续输入数列是整数输入。39. 数项级数39.1 什么是级数就是无限多个数相加。39.2 收敛与发散如果前 (n) 项和当 n→∞ 时趋向一个有限值叫收敛。否则叫发散。39.3 本质作用级数回答无限多个越来越小的东西加起来最终是否有限比如虽然有无限项但总和有限。40. 常见级数40.1 等比级数40.2 调和级数40.3 p 级数41. 幂级数41.1 什么是幂级数它像一个无限次多项式。41.2 本质作用幂级数的作用是用无限多项式表示复杂函数。比如这非常重要。因为多项式最容易计算而很多复杂函数可以用多项式逼近。42. 泰勒公式42.1 什么是泰勒公式泰勒公式就是用多项式近似函数。在 x0 附近42.2 本质作用泰勒公式的本质是用函数在某一点的信息预测附近的函数值。它用到函数值一阶导数二阶导数更高阶导数。42.3 为什么重要因为现实中很多函数很复杂但局部可以用多项式近似。比如这就是前面等价无穷小的来源。42.4 机器学习里的意义深度学习优化中经常用一阶近似牛顿法使用二阶近似所以泰勒公式是优化理论的底层工具。两天学习安排第一天上午函数、极限、连续重点掌握函数是什么定义域和值域极限的本质左右极限无穷小等价无穷小连续性。你要形成这个认识极限是高数地基导数和积分都靠极限定义。第一天下午导数、微分、极值重点掌握导数定义导数几何意义导数物理意义常见求导公式链式法则高阶导数微分极值与最值中值定理洛必达法则。你要形成这个认识导数研究变化率微分研究局部近似极值研究优化。第一天晚上积分重点掌握不定积分定积分微积分基本定理换元积分分部积分面积体积功累积思想。你要形成这个认识积分研究累积定积分是连续加法。第二天上午多元函数微积分重点掌握多元函数偏导数全微分梯度方向导数多元极值Hessian 矩阵。你要形成这个认识多元微积分就是在多因素系统里研究变化和优化。第二天下午重积分、曲线曲面积分重点掌握二重积分三重积分极坐标曲线积分曲面积分通量格林公式高斯公式斯托克斯公式。你要形成这个认识高维积分就是在区域、空间、路径、曲面上做累积。第二天晚上微分方程、级数、泰勒公式重点掌握微分方程是什么一阶微分方程二阶微分方程数项级数收敛与发散幂级数泰勒公式。你要形成这个认识微分方程描述动态系统级数和泰勒公式用于逼近复杂函数。高数所有核心概念一句话总结名词一句话本质函数输入和输出的关系定义域输入允许取值范围值域输出可能结果范围极限无限接近时的趋势连续输入小变输出小变无穷小趋近于 0 的量无穷大趋向无限大的量等价无穷小局部可互相替代的简单近似导数瞬时变化率微分局部线性近似高阶导数变化率的变化率单调性函数上升或下降极值局部最好或最坏中值定理局部变化率和整体变化率的桥梁洛必达法则比较两个函数谁变化得更快不定积分求导的逆运算定积分连续累积微积分基本定理导数和积分互逆偏导数单个变量对结果的影响全微分多个变量小变化造成的总影响梯度函数上升最快方向方向导数沿某方向的变化率Hessian二阶弯曲信息二重积分平面区域上的累积三重积分空间区域上的累积曲线积分沿路径累积曲面积分沿曲面累积通量穿过曲面的总量微分方程描述系统变化规律的方程级数无限项求和收敛无限累加后仍有限发散无限累加后无限或无稳定值幂级数用无限多项式表示函数泰勒公式用多项式近似复杂函数理工科真正要抓住的高数主线你不要把高数看成一堆公式而要看成一条逻辑链第一层函数现实关系抽象成函数第二层极限用无限逼近处理精确概念第三层导数用极限定义瞬时变化率第四层积分用极限定义连续累积第五层多元微积分把一元变化推广到多因素系统第六层微分方程用导数描述系统演化第七层级数与泰勒用简单多项式逼近复杂函数这就是高数的骨架。对你来说最重要的学习优先级你是软件工程背景准备保研/夏令营/机试/AI 项目高数里最重要的是第一优先级必须真正理解极限导数微分链式法则偏导数梯度泰勒公式积分的累积思想。这些和机器学习、优化、深度学习直接相关。第二优先级需要会用洛必达常见积分多元函数极值二重积分微分方程基本形式级数收敛判断。第三优先级有时间再深入曲线积分曲面积分格林公式高斯公式斯托克斯公式严格 (\epsilon-\delta) 证明。最后的本质总结高等数学不是一门“算题课”而是一门“理解变化的语言”。你学函数是为了描述关系。你学极限是为了处理无限逼近。你学导数是为了理解瞬时变化。你学积分是为了理解连续累积。你学偏导和梯度是为了理解多因素优化。你学微分方程是为了理解系统演化。你学泰勒公式是为了用简单模型逼近复杂世界。所以高数最核心的一句话是用极限建立精确概念用导数刻画变化用积分刻画累积用泰勒公式刻画近似用微分方程刻画演化。