如何衡量万事万物 (8) 观察少数

建立直觉

题目

小实验：请问一粒果冻豆的平均重量是多少公克？请回答你的 90% CI。

Untitled

请写下你的范围，并运用相等赌局做测试。再想一想这个范围为什麽是合理的，包括正反双方的意见，然後对上、下限都做定锚测试。

开始抽样

1

接下来我们抽出第一颗果冻豆，重点是 1.4 公克。

这会改变你的 90% CI 吗？更新後的 CI 是什麽？

2

再下一个样本是 1.5 公克。你会重新更新你的 CI 吗？

3

接下来我们一口气抽出三个随机样本：1.4 公克、1.6 公克、1.1 公克

请更新 CI。

4

最後再抽三个：1.5 公克、0.9 公克、1.7 公克。

至此有 8 个样本。请决定最後的 CI。

讨论

就算第一次写了极宽的范围，每次获得新资料以後，范围通常都会缩小一次。

作者的实测中，最初范围最窄的是 1~3 公克，而最宽的是 0.5~50 公克。

提出 0.5~50 公克的受测者，在「第一个样本」出现後，将范围变成 0.5~6 公克。

最後，这袋果冻豆的实际平均约为 1.45 公克。

作者建议大家可以常常进行类似的练习，在不依赖「正规统计学」的情况下，进行主观的估计，培养估算的直觉。

教科书作法

接着针对同一个问题，在教科书里有一个数学式的作法，可以针对「样本数很少」的情况，来进行小样本的统计。

接下来我们选出果冻豆的前 5 个样本：1.4, 1.4, 1.5, 1.6, 1.1 来进行。

此方法称为 t 统计量 (t-statistic)，在样本数少於 30 的情况下，分配的形状会比常态分配平坦、宽长，而样本数超过 30 以後，t 统计的形状和常态分配一样。

以下是一个计算母体平均 90% CI 的固定程序：

计算样本的「变异数」。也就是对於每个样本的变异程度予以数量化
1. 计算样本的平均 (1.4 + 1.4 + 1.5 + 1.6 + 1.1) / 5 = 1.4
2. 每个样本减去这个平均，每个结果作平方
  - (1.4 - 1.4)^2 = 0
  - (1.5 - 1.4)^2 = 00.1
  - (1.6 - 1.4)^2 = 00.4
  - (1.1 - 1.4)^2 = 00.9
3. 将所有的平方加总後，除以样本数减 1
  (0 + 0 + 0.01 + 0.04 + 0.09) / (5 - 1) = 0.035
将样本变异数除以样本数，再将结果开平方根 SQRT(0.035 / 5) ⇒ 0.0837
从 t 分配模型中找到样本数 5 的分数 → 2.13
将 t 分配量乘以步骤 2 的答案 2.13 x 0.0837 = 0.178，这是样本误差
将平均加上样本误差，就得到 90% CI 上限，减去误差则得到下限 1.222~ 1.578

如此一来只需要 5 个样本，就获得一个 1.22~ 1.58 的范围。

讨论：主观方法 v.s. 客观方法

在最初的果冻豆实验中，作者邀请受测者用主观的方法直觉估算，这些受测者都受过校准估计，

最保守的估计者得到的范围是：0.5~2.4
最有信心的人的范围是：1～1.7
而 t 分配的范围是：1.22~1.58

教科书的作法虽然较为客观，但在此想讨论的是，主观方法也颇有效。多做一些数学，只是比靠校准估计进一步降低误差。

总结

当你有很大的不确定性时，少量的样本就能大幅降低不确定性，尤其是当母体是相对同质性时
在某些案例中，校准的估计者即使只靠一个样本，也能降低不确定性
校准估计者虽然比较保守，但却是合理的。多做一些数学能更进一步降低不确定性

203/393

今天押线交啦～～

<<: Day 27 : Github Actions实作自动化推上Azure

>>: 用 Line LIFF APP 实现信箱验证绑定功能(5) - 前後端认证功能

Day_11 : 让 Vite 来开启你的 Vue 之 Config 常见配置 (Vite 最终篇 XD)

杂谈

[Day26] Telegram Bot 对话

杂谈

Day 1 序言及基本运算元件

杂谈

[DAY1]前言

杂谈

【DAY 2 】Microsoft 365 Developer Program - Microsoft 365 开发人员计画

杂谈

不容小觑的数据分析工具 - Excel：基础函数介绍

作为一个初阶的数据分析师，Excel绝对是你的好朋友没有之一。（Excel的强大真的是深不可测啊） ...

Day29 -- Video Speed Controller

目标今天要来做的是播放速度控制器，可以透过游标移动控制播放速度 Step1 const speed...

【Day 21】Google Apps Script - API Blueprint 篇 - API Blueprint 介绍

API Blueprint(蓝图)。一种用於 Web API 的强大的高级 API 描述语言。AP...

Microsoft MO-300 转储 - 让 MO-300 考试成为无压力考试

Microsoft Office 专家 - MO-300 考试对您的职业生涯来说是一个非常显着的提升...

007-小工具

今天分享一些实用的网站，应该大部分都知道，但一样是做个纪录。 1.https://www.nngro...