2026-05-28 2.1 数据科学复习--第二章重点

第二章 数学基础·计算题必考点(非基础、套模板直接做)

只整理课程课件例题+作业原题+数据科学核心计算,避开基础加减乘,全是考试高频计算题,直接背公式+步骤就能拿分

一、线性代数 核心计算题(2道必考)

题型1:矩阵的秩计算(课件例题,非基础)

核心步骤:初等行变换→化为行阶梯形→数非零行的行数=秩
模板

  1. 对矩阵做初等行变换(只做行变换,不换列)
  2. 化为行阶梯矩阵(左下角全为0)
  3. 非零行的数量 = 矩阵的秩

题型2:矩阵奇异值计算(课件例题,SVD核心,必考)

核心公式:奇异值$$\sigma_i = \sqrt{\lambda_i}$$($\lambda_i$是$A^TA$的特征值)
解题步骤

  1. 计算$B = A^TA$
  2. 求特征方程$$|\lambda E - B| = 0$$,得特征值$\lambda_1≥\lambda_2≥…≥\lambda_n$
  3. 特征值开平方 = 奇异值$\sigma$

二、概率统计 核心计算题(3道必考,含作业原题)

题型1:条件概率+全概率+贝叶斯综合(课件例题)

必背公式

  1. 条件概率:$$P(B|A) = \frac{P(AB)}{P(A)}$$
  2. 全概率:$$P(B) = \sum P(A_i)P(B|A_i)$$
  3. 贝叶斯:$$P(A_j|B) = \frac{P(A_j)P(B|A_j)}{\sum P(A_i)P(B|A_i)}$$
    解题步骤:先划分完备事件组→算全概率→代贝叶斯公式

题型2:信息熵计算(数据科学核心,简答/计算都考)

公式:$$H(X) = -\sum_{x} p(x) \log p(x)$$
步骤:算每个事件概率→代入公式求和→加负号

题型3:朴素贝叶斯文本分类(作业原题,100%考计算

核心规则:拉普拉斯平滑(词频+1,避免概率为0)
公式
$$P(类别|句子) = \frac{P(类别) \times \prod P(词|类别)}{P(句子)}$$
$$P(词|类别) = \frac{该词在类别中出现次数+1}{类别总词数+词典大小}$$
解题步骤

  1. 统计侮辱/非侮辱句的总词数、词典大小
  2. 拉普拉斯平滑算每个词的条件概率
  3. 代入贝叶斯公式算两类概率,概率大的为分类结果

三、优化理论 核心计算题(1道必考)

题型:凸函数判定(课件softmax例题,非基础)

核心判定:二阶可微函数→Hessian矩阵半正定→凸函数
步骤

  1. 求一阶偏导$\nabla f(x)$
  2. 求二阶偏导得Hessian矩阵$\nabla^2 f(x)$
  3. 验证矩阵半正定→判定为凸函数

四、图论基础 核心计算题(2道必考)

题型1:无向图顶点度/总节点数计算(课件例题)

核心公式:无向图总度数 = 2 × 边数
步骤:总度数减去已知顶点度数→剩余度数÷单顶点度→求节点数

题型2:拉普拉斯矩阵计算(课件例题,谱聚类核心)

公式:$$\boldsymbol{L = D - A}$$

  • $D$:度矩阵(对角矩阵,对角线为各顶点度)
  • $A$:邻接矩阵
    步骤:画邻接矩阵A→算度矩阵D→D-A直接得拉普拉斯矩阵L

终极计算题速记(30秒背完)

  1. 秩:行变换→数非零行
  2. 奇异值:$A^TA$特征值开平方
  3. 贝叶斯文本:拉普拉斯平滑+连乘概率
  4. 熵:负的概率乘对数求和
  5. 拉普拉斯矩阵:度矩阵-邻接矩阵
  6. 无向图总度=2×边数

转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 kipleyarch@gmail.com
Archive PDF预览 PPTX Obsidian