1.2 HM 开始 2

 
  1. 对每一个调查对象都进行调查的方法, 称为全面调查。从总体中抽取一部分个体进行调查, 并以此为依据对总体的 情况作出估计和推断的调查方法, 称为抽样调查
  2. 本章研究的抽样调查方法有:简单随机抽样分层随机抽样
  3. 简单随机抽样包含:放回简单随机抽样不放回简单随机抽样
  4. 两种简单随机抽样的方法:抽签法随机数法
  5. 总体平均数与样本平均数

    • 总体平均数:
    \[\overline{Y}=\frac{Y_1+Y_2+\cdots+Y_N}{N}=\frac{1}{N} \sum_{i=1}^N Y_i=\frac{1}{N} \sum_{i=1}^k f_i Y_i\]
    • 样本平均数:
    \[\bar{y}=\frac{y_1+y_2+\cdots+y_n}{n}=\frac{1}{n} \sum_{i=1}^n y_i\]
    • 在简单随机抽样中, 常用样本平均数 $\bar{y}$ 去估计总体平均数 $\overline{Y}$ 。
  6. 为避免简单随机抽样中极端样本的出现,我们可采用分层随机抽样的方式进行抽样,其定义为:一般地, 按一个或多个变量把总体划分成若干个子总体, 每个个体属于且仅属于一个子总体, 在每个子总体中独立 地进行简单随机抽样, 再把所有子总体中抽取的样本合在一起作为总样本, 这样的抽样方法称为分层随机抽样, 每 一个子总体称为。在分层随机抽样中, 如果每层样本量都与层的大小成比例, 那么称这种样本量的分配方式为比例分配,称这样的分层抽样为按比例分配的分层随机抽样

  7. 在按比例分配的分层随机抽样中,每个个体被抽到的概率相等: \(N \begin{dcases} N_1 \\ N_2 \\ \vdots \\ N_k \end{dcases},\quad n \begin{dcases} n_1 \\ n_2 \\ \vdots \\ n_k \end{dcases},\quad \begin{dcases} n_1 = \frac{n}{N} \times N_1 \\ n_2 = \frac{n}{N} \times N_2 \\ \vdots \\ n_k = \frac{n}{N} \times N_k \end{dcases} \implies \begin{dcases} p_1 = \frac{n_1}{N_1} = \frac{n}{N} \\ p_2 = \frac{n_2}{N_2} = \frac{n}{N} \\ \vdots \\ p_k = \frac{n_k}{N_k} = \frac{n}{N} \end{dcases}\)

  8. 在按比例分配的分层随机抽样中,假设有 $k$ 层。设 $X_{ki}$ 表示总体中第 $k$ 层第 $i$ 个个体的变量值; $x_{ki}$ 表示样本中第 $k$ 层第 $i$ 个个体的变量值;$\overline{X}_k$ 表示总体中第 $k$ 层的变量均值;$\overline{x}_k$ 表示样本中第 $k$ 层的变量均值;$\overline{W}$ 表示总体均值;$\overline{w}$ 表示样本均值,则有: \(\begin{align} \overline{W} &= \frac{\sum_{i=1}^{N_1} X_{1i} + \sum_{i=1}^{N_2} X_{2i} + \cdots + \sum_{i=1}^{N_k} X_{ki}}{N} = \frac{N_1 \overline{X}_1 + N_2 \overline{X}_2 + \cdots + N_k \overline{X}_k}{N} \label{W} \\ \overline{w} &= \frac{\sum_{i=1}^{n_1} x_{1i} + \sum_{i=1}^{n_2} x_{2i} + \cdots + \sum_{i=1}^{n_k} x_{ki}}{n} = \frac{n_1 \overline{x}_1 + n_2 \overline{x}_2 + \cdots + n_k \overline{x}_k}{n} \label{w} \end{align}\) 其中 \(\begin{align*} N &= N_1 + N_2 + \cdots + N_k \\ n &= n_1 + n_2 + \cdots + n_k \end{align*}\) 如果该分层随机抽样是按比例分配的,则有 \(\begin{dcases} \frac{n_1}{N_1} = \frac{n_2}{N_2} = \cdots = \frac{n_k}{N_k} = \frac{n}{k} \\ n_1:n_2:\cdots :n_k: n = N_1:N_2:\cdots :N_k: N \end{dcases}\) 在前面的条件下,如果我们先用每一层的样本均值去估计该层的总体均值,然后再将其带回 $\eqref{W}$ 式,可得 $\overline{W}$ 的估计值 $\widehat{\overline{W}}$ 与 $\overline{w}$ 一致: \(\widehat{\overline{W}} = \frac{N_1 \overline{x}_1 + N_2 \overline{x}_2 + \cdots + N_k \overline{x}_k}{N} = \frac{n_1 \overline{x}_1 + n_2 \overline{x}_2 + \cdots + n_k \overline{x}_k}{n} = \overline{w}\)