如何衡量万事万物 (8) 观察少数

建立直觉

题目

小实验:请问一粒果冻豆的平均重量是多少公克?请回答你的 90% CI。

Untitled

请写下你的范围,并运用相等赌局做测试。再想一想这个范围为什麽是合理的,包括正反双方的意见,然後对上、下限都做定锚测试。

开始抽样

1

接下来我们抽出第一颗果冻豆,重点是 1.4 公克。

这会改变你的 90% CI 吗?更新後的 CI 是什麽?

2

再下一个样本是 1.5 公克。你会重新更新你的 CI 吗?

3

接下来我们一口气抽出三个随机样本:1.4 公克、1.6 公克、1.1 公克

请更新 CI。

4

最後再抽三个:1.5 公克、0.9 公克、1.7 公克。

至此有 8 个样本。请决定最後的 CI。

讨论

就算第一次写了极宽的范围,每次获得新资料以後,范围通常都会缩小一次。

作者的实测中,最初范围最窄的是 1~3 公克,而最宽的是 0.5~50 公克。

提出 0.5~50 公克的受测者,在「第一个样本」出现後,将范围变成 0.5~6 公克。

最後,这袋果冻豆的实际平均约为 1.45 公克。

作者建议大家可以常常进行类似的练习,在不依赖「正规统计学」的情况下,进行主观的估计,培养估算的直觉。

教科书作法

接着针对同一个问题,在教科书里有一个数学式的作法,可以针对「样本数很少」的情况,来进行小样本的统计。

接下来我们选出果冻豆的前 5 个样本:1.4, 1.4, 1.5, 1.6, 1.1 来进行。

此方法称为 t 统计量 (t-statistic),在样本数少於 30 的情况下,分配的形状会比常态分配平坦、宽长,而样本数超过 30 以後,t 统计的形状和常态分配一样。

以下是一个计算母体平均 90% CI 的固定程序:

  1. 计算样本的「变异数」。也就是对於每个样本的变异程度予以数量化
    1. 计算样本的平均 (1.4 + 1.4 + 1.5 + 1.6 + 1.1) / 5 = 1.4
    2. 每个样本减去这个平均,每个结果作平方
      • (1.4 - 1.4)^2 = 0
      • (1.5 - 1.4)^2 = 00.1
      • (1.6 - 1.4)^2 = 00.4
      • (1.1 - 1.4)^2 = 00.9
    3. 将所有的平方加总後,除以样本数减 1
      (0 + 0 + 0.01 + 0.04 + 0.09) / (5 - 1) = 0.035
  2. 将样本变异数除以样本数,再将结果开平方根 SQRT(0.035 / 5) ⇒ 0.0837
  3. 从 t 分配模型中找到样本数 5 的分数 → 2.13
  4. 将 t 分配量乘以步骤 2 的答案 2.13 x 0.0837 = 0.178,这是样本误差
  5. 将平均加上样本误差,就得到 90% CI 上限,减去误差则得到下限 1.222~ 1.578

如此一来只需要 5 个样本,就获得一个 1.22~ 1.58 的范围。

讨论:主观方法 v.s. 客观方法

在最初的果冻豆实验中,作者邀请受测者用主观的方法直觉估算,这些受测者都受过校准估计,

  • 最保守的估计者得到的范围是:0.5~2.4
  • 最有信心的人的范围是:1~1.7
  • 而 t 分配的范围是:1.22~1.58

教科书的作法虽然较为客观,但在此想讨论的是,主观方法也颇有效。多做一些数学,只是比靠校准估计进一步降低误差。

总结

  • 当你有很大的不确定性时,少量的样本就能大幅降低不确定性,尤其是当母体是相对同质性时
  • 在某些案例中,校准的估计者即使只靠一个样本,也能降低不确定性
  • 校准估计者虽然比较保守,但却是合理的。多做一些数学能更进一步降低不确定性

203/393

今天押线交啦~~


<<:  Day 27 : Github Actions实作自动化推上Azure

>>:  用 Line LIFF APP 实现信箱验证绑定功能(5) - 前後端认证功能

不容小觑的数据分析工具 - Excel:基础函数介绍

作为一个初阶的数据分析师,Excel绝对是你的好朋友没有之一。(Excel的强大真的是深不可测啊) ...

Day29 -- Video Speed Controller

目标 今天要来做的是播放速度控制器,可以透过游标移动控制播放速度 Step1 const speed...

【Day 21】Google Apps Script - API Blueprint 篇 - API Blueprint 介绍

API Blueprint(蓝图)。一种用於 Web API 的强大的高级 API 描述语言。AP...

Microsoft MO-300 转储 - 让 MO-300 考试成为无压力考试

Microsoft Office 专家 - MO-300 考试对您的职业生涯来说是一个非常显着的提升...

007-小工具

今天分享一些实用的网站,应该大部分都知道,但一样是做个纪录。 1.https://www.nngro...