Skip to content

数据特征进阶

Part of note taken on ZJU Probability Theory (H), 2021 Fall & Winter

(moment)

\(k\) 阶原点矩 (origin moment, or raw moment)

\[ m_k=E\xi^k \]

数学期望就是一阶原点矩,另外在方差公式 \(Var\xi=E\xi^2-(E\xi)^2\) 中,我们经常用到的 \(E\xi^2\) 就是二阶原点矩。

原点矩简称为矩,可以对比力学中计算力矩时参考点选在原点时的情况,不过力学的力矩仅是一阶原点矩,二阶原点矩或许要用能量进行类比。但我们这里并不尝试直接阐明其应用(因为我目前也还不知道,仅先讲清楚这些抽象概念。

相对应地,参考点可以不选在原点,这样参考点和原点就会有偏移。此时就需要定义 \(k\) 阶中心距

\(k\) 阶中心矩 (central moment)

\[ c_k=E(\xi-E\xi)^k \]

从定义可以知道,一阶中心距总是 0,二阶中心矩就是方差。其他常用的中心距有三阶中心距和四阶中心距,可以用来表示随机变量分布函数的形状。

偏态系数 (Coefficient of Skewness)

\[ Cs=\dfrac{c_3}{c_2^{1.5}} \]

偏态系数 \(Cs\) 衡量了随机变量分布的对称性。大于 0 表示正偏态,小于 0 表示负偏态。

峰态系数 (Coefficient of Kurtosis)

\[ Ck=\dfrac{c_4}{c_2^2}-3 \]

峰态系数衡量了均值处峰值高低,若大于 0 表明比正态分布更尖峭。

对于正态分布 \(\xi\sim N(\mu, \sigma^2)\),其偏态系数和峰态系数都是 0。其 \(k\) 阶中心矩都存在。

考虑到正态分布 \(\xi\sim N(\mu, \sigma^2)\) \(k\) 阶中心距其实就是 \(\eta\sim N(0, \sigma^2)\) \(k\) 阶原点矩,因此有

\[ \begin{aligned} &E(\xi-\mu)^{2k}=E\eta^{2k}=(2k-1)!!\sigma^2,\\ &E(\xi-\mu)^{2k+1}==E\eta^{2k+1}=0 \end{aligned} \]

常见特征函数

退化分布

\(P(\xi=c)=1\)

\[ \varphi(t)=e^{ict} \]

二项分布

\(\xi\sim B(n,p)\)

\[ \varphi(t)=(pe^{it}+q)^n \]
Proof
\[ \begin{aligned} \varphi(t)&=\sum_{k=0}^n\begin{pmatrix} n\\k \end{pmatrix}p^kq^{n-k}e^{itk}\\ &=\sum_{k=0}^n\begin{pmatrix} n\\k \end{pmatrix}\left(pe^{it}\right)^kq^{n-k}\\ &=(pe^{it}+q)^n \end{aligned} \]

第二行到第三行使用了二项式定理。

泊松分布

\(\xi\sim \mathcal{P}(\lambda)\)

\[ \varphi(t)=e^{\lambda(e^{it}-1)} \]
Proof
\[ \begin{aligned} \varphi(t)&=\sum_{k=0}^\infty e^{itk}\frac{\lambda^k}{k!}e^{-\lambda}\\ &=\sum_{k=0}^\infty \frac{\left(\lambda e^{it}\right)^k}{k!}e^{-\lambda}\\ &=e^{\lambda e^{it}}\cdot e^{-\lambda}=e^{\lambda(e^{it}-1)} \end{aligned} \]

均匀分布

\(\xi\sim U(a,b)\)

\[ \varphi(t)= \frac{e^{ibt}-e^{iat}}{i(b-a)t} \]
Proof
\[ \begin{aligned} \varphi(t)&=\int_a^be^{itx}\frac{1}{b-a}\mathrm{d}x\\ &=\frac{1}{i(b-a)t}e^{itx}\bigg|_a^b\\ &=\frac{e^{ibt}-e^{iat}}{i(b-a)t} \end{aligned} \]

正态分布

\(\xi\sim N(\mu, \sigma^2)\)

\[ \varphi(t)=e^{it\mu-\frac{\sigma^2t^2}{2}} \]
Proof
\[ \begin{aligned} \varphi(t)&=\int_{-\infty}^{+\infty}e^{itx} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\mathrm{d}x\\ &\xlongequal{y=\frac{x-\mu}{\sigma}} \sigma e^{it\mu}\int_{-\infty}^{+\infty}e^{i(\sigma t)y} e^{-\frac{y^2}{2}}\mathrm{d}y \end{aligned} \]

考虑标准正态分布需要的积分

\[ \begin{aligned} \int_{-\infty}^{+\infty}e^{itx} e^{-\frac{x^2}{2}}\mathrm{d}x &=\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\cos tx\mathrm{d}x +i\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\sin tx\mathrm{d}x\\ &=\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\cos tx\mathrm{d}x (\text{第二个积分因奇函数为}0) \end{aligned} \]

\(g(t)=\displaystyle\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\cos tx\mathrm{d}x\),考虑求导

\[ \begin{aligned} g'(t)&= \frac{\mathrm{d}}{\mathrm{d}t}\left( \int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\cos tx\mathrm{d}x \right)\\ &=-\int_{-\infty}^{+\infty}xe^{-\frac{x^2}{2}}\sin tx\mathrm{d}x\\ &=\int_{-\infty}^{+\infty}\sin tx\mathrm{d}e^{-\frac{x^2}{2}}\\ &=e^{-\frac{x^2}{2}}\sin tx\bigg|_{-\infty}^{+\infty}- t\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\cos tx\mathrm{d}x=-tg(t) \end{aligned} \]

解微分方程

\[ \begin{gathered} g'(t)=-tg(t)\\ \frac{\mathrm{d}g}{g}=-t\mathrm{d}t\\ g=Ae^{-\frac{t^2}{2}} \end{gathered} \]

\(g(0)=\displaystyle\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}\mathrm{d}x=1\),定得 \(A=1\)。因此有

\[ \int_{-\infty}^{+\infty}e^{itx} e^{-\frac{x^2}{2}}\mathrm{d}x=e^{-\frac{t^2}{2}} \]

则原 \(\varphi(t)\)

\[ \varphi(t)=e^{it\mu}\cdot e^{-\frac{\sigma^2t^2}{2}} =e^{it\mu-\frac{\sigma^2t^2}{2}} \]

特征函数可微性

预备知识

\[ F(t)=\int_Rf(x,t)p(x)dx \]

假定其存在,然后以下的 \(g\geqslant 0\) 需满足要求

\[ \int_Rg(x)p(x)dx<\infty \]

(1) \(\exists g,s.t.\forall x,t\)

\[ |f(x,t)|<g(x) \]

对某个 \(x\),

\[ \lim_{t\to t_0}f(x,t)=f(x,t_0) \]

\[ \lim_{t\to t_0}F(t)=F(t_0) \]

\(f\) 连续 \(\Rightarrow F\) 关于 \(t\) 连续

(2)\(\exists g,s.t.\forall x,t\)

\[ \bigg|\frac{\partial f(x,t)} {\partial t}\bigg|<g(x) \]

\[ F'(t)=\int_R\frac{\partial f(x,t)} {\partial t}p(x)dx \]

可微性

现在令 \(g(x)=|x|\),由于预设 \(X\) 期望存在,则

\[ \int_{-\infty}^{+\infty}g(x)dF(x)=\int_{-\infty}^{+\infty}|x|dF(x)<\infty \]

对于特征函数

\[ \varphi(t)=Ee^{itX}=\int_{-\infty}^{+\infty}e^{itx}dF(x) \]

\(f(x,t)=e^{itx}\),则

\[ \bigg|\frac{\partial f(x,t)} {\partial t}\bigg|= \bigg|ixe^{itx}\bigg|\leqslant|x|=g(x) \]

那么就有

\[ \varphi'(t)=\int_{-\infty}^{+\infty}\frac{\partial f(x,t)} {\partial t}dF(x)=i\int_{-\infty}^{+\infty}xe^{itx}dF(x) \]

特别地,有

\[ \varphi'(0)=i\int_{-\infty}^{+\infty}xdF(x)=i\mu \]

同理,考虑 \(k\) ( 原点 ) 矩,则若 \(E|X|^k<\infty\),则

\[ \varphi^{(k)}(t)=i^k\int_{-\infty}^{+\infty}x^ke^{itx}dF(x) \]

那么原点处 \(\varphi(x)\) 可做 \(k\) Taylor 展开

\[ \begin{aligned} \varphi(x)&=\varphi(0)+\varphi'(0)x+\frac{\varphi''(0)}{2!}x^2+\cdots+\frac{\varphi^{(k)}(0)}{k!}x^n+o(t^k)\\ &=1+iEXt-\frac{1}{2}EX^2t^2+\cdots+i^k\frac{EX^k}{k!}t^k+o(t^k) \end{aligned} \]