【概率论与数理统计公式总结】在学习概率论与数理统计的过程中,掌握各类基本概念和核心公式是理解后续内容的关键。本文将对概率论与数理统计中常用的基本公式进行系统性整理,帮助读者快速回顾和应用。
一、概率论基础公式
概念 | 公式 | 说明 | |||
事件的概率 | $ P(A) = \frac{\text{有利结果数}}{\text{总结果数}} $ | 当所有结果等可能时 | |||
加法公式 | $ P(A \cup B) = P(A) + P(B) - P(A \cap B) $ | 用于计算两个事件至少一个发生的概率 | |||
条件概率 | $ P(A | B) = \frac{P(A \cap B)}{P(B)} $ | 在已知B发生的条件下A发生的概率 | ||
乘法公式 | $ P(A \cap B) = P(A) \cdot P(B | A) $ | 用于计算多个事件同时发生的概率 | ||
全概率公式 | $ P(A) = \sum_{i=1}^{n} P(B_i) \cdot P(A | B_i) $ | 当事件A由多个互斥事件B₁, B₂,..., Bₙ引起时 | ||
贝叶斯公式 | $ P(B_i | A) = \frac{P(B_i) \cdot P(A | B_i)}{\sum_{j=1}^{n} P(B_j) \cdot P(A | B_j)} $ | 用于根据结果反推原因的概率 |
二、随机变量及其分布
类型 | 分布名称 | 概率质量函数(PMF)或概率密度函数(PDF) | 数学期望 | 方差 |
离散型 | 伯努利分布 | $ P(X = k) = p^k (1-p)^{1-k} $, $ k=0,1 $ | $ p $ | $ p(1-p) $ |
离散型 | 二项分布 | $ P(X = k) = C_n^k p^k (1-p)^{n-k} $ | $ np $ | $ np(1-p) $ |
离散型 | 泊松分布 | $ P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} $ | $ \lambda $ | $ \lambda $ |
连续型 | 均匀分布 | $ f(x) = \frac{1}{b-a} $, $ a \leq x \leq b $ | $ \frac{a+b}{2} $ | $ \frac{(b-a)^2}{12} $ |
连续型 | 正态分布 | $ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $ | $ \mu $ | $ \sigma^2 $ |
连续型 | 指数分布 | $ f(x) = \lambda e^{-\lambda x} $, $ x \geq 0 $ | $ \frac{1}{\lambda} $ | $ \frac{1}{\lambda^2} $ |
三、期望与方差
概念 | 公式 | 说明 |
数学期望(期望) | $ E(X) = \sum_{i=1}^{n} x_i P(X = x_i) $ 或 $ \int_{-\infty}^{\infty} x f(x) dx $ | 随机变量的平均值 |
方差 | $ \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 $ | 衡量数据偏离均值的程度 |
协方差 | $ \text{Cov}(X, Y) = E[(X - E(X))(Y - E(Y))] $ | 衡量两个变量之间的线性关系 |
相关系数 | $ \rho_{XY} = \frac{\text{Cov}(X,Y)}{\sqrt{\text{Var}(X)\text{Var}(Y)}} $ | 取值范围[-1, 1],表示相关性强弱 |
四、统计推断基础公式
概念 | 公式 | 说明 |
样本均值 | $ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i $ | 描述样本集中趋势的指标 |
样本方差 | $ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 $ | 描述样本离散程度的指标 |
置信区间(正态总体) | $ \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} $ | 估计总体均值的区间 |
假设检验 | $ Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}} $ | 用于判断是否拒绝原假设 |
t检验统计量 | $ t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} $ | 当σ未知时使用t分布 |
五、常见统计分布的临界值(简要)
分布 | 显著性水平α | 临界值(双尾) |
正态分布 | 0.05 | ±1.96 |
正态分布 | 0.01 | ±2.58 |
t分布(自由度=10) | 0.05 | ±2.228 |
t分布(自由度=30) | 0.05 | ±2.042 |
结语
概率论与数理统计是数据分析、机器学习、工程建模等众多领域的基础工具。通过掌握上述公式和概念,可以更深入地理解和应用统计方法。建议结合实际问题进行练习,以提高分析能力和逻辑思维能力。