如何衡量万事万物 (7) 误差

如果你要量体重，在以下两个情况中，你会选择何者：

一个「已校准过」的体重计，也就是能反映真实的体重，但是放在移动中的露营车上，每次测量时，会因为汽车的颠簸而受到干扰。
一个「没有被校准过」的体重计，但放在良好的环境中，每次测量时不会受到干扰

和误差有关的名词

这个段落在讨论「如何看待『误差』」，在讨论前，作者先厘清了相关的名词。

误差有两大类型

系统性误差 / 偏误 (systemic error/ bias)
- 衡量本身有一个倾向，会偏向某个特定结果
- 这个偏向是有一致性的
随机误差 (random error)
- 无法透过个别观察来预测误差
- 不具一致性，和已知的变数无关
- 但这类误差在大群体中，会遵守机率法则

例如，销售员在估算下一季营收时，会例行性高估 50%，这是系统性误差；而若非每次都是高估 50%，就是随机误差。

误差的特质

想要表达「误差的特质」时，要厘清以下两个词：

正确性 (accuracy)
- 衡量结果「有多接近真实」
- 系统性误差愈小，正确性愈高
准确性 (precision)
- 多次衡量是否能达到一致的结果，也就是衡量的可复制性 (reporducibility) & conformity
- 随机性误差愈小，准确性愈高

回到体重计的举例，

如果放在浴室里的体重计被固定调高 2 公斤 → 它是准确的，但不是正确的
- 此时，precise 的意思是，每次你上去量体重，都会得到一致的答案，但这个答案不等於你的真实体重
- 若你知道体重计「被固定调高 2 公斤」的资讯，才能获得真实体重
放在露营车上、校准过的体重计 → 正确性好，但准确性低
- 你在一分钟内量了两次，会得到不同的答案
- 但多次测量後，平均答案会接近真正的体重

任何降低两种误差的方法都称为「对照控制」。

为什麽要选择准确性高的衡量？

回到一开始的问题：

一个「已校准过」的体重计，也就是能反映真实的体重，但是放在移动中的露营车上，每次测量时，会因为汽车的颠簸而受到干扰。
一个「没有被校准过」的体重计，但放在良好的环境中，每次测量时不会受到干扰

在此例中，作者认为，比较好的选择是 1，因为 1 可以透过多次测量的平均来获得一个可信赖的范围，而 2 的误差是未知的。除非你知道体重计被调高或调低的资讯，否则永远无法获得真实体重。

然而，作者表示，在真实情境中，绝大多数人会倾向采用模式 2。

例如，企业想要知道「销售员花多少时间与客户开会，又花多少时间在其他行政事务上」。

实务上常常看到的作法是 → 检视工作时间记录卡
而「工作时间记录卡」是有误差的，因为人们常常在下班时匆匆忙忙地填表，有些人习惯高估、而另一些人习惯低估
全面检视工作时间记录卡以後，假设有 5000 份纪录卡、100 名销售员、50 个星期，会得知销售员有 34% 时间花在与顾客沟通上
我们获得了一个确切的数值，但是不知道这个数值和真实状况的距离为例

另一种作法

在随机选取的时间，随机选择一名销售员，看看他是否正在开会
随机抽样 100 次之後，发现有 13 件正在开会中
此时，若具备对抽样统计的知识，可以获得 90% CI 的范围是 → 销售员有 7.5%~18.5% 时间花在与顾客沟通上

在这两种结论中，你认为哪个较可信？

观察偏误 (bias) 的种类

预期性偏误
- 只看到你想要的，也就是自我欺骗
- 在新药临床试验中，医师和病人都不可以知道谁服用了安慰剂
选择性偏误
- 在抽样调查时，虽然知道要随机，但发生了「没有注意到的非随机性」
- 例如，在金融特区的街道上随机问路人，他们要投票给哪一位候选人
观察者偏误
- 在观察的过程中，因为「观察」这个动作，导致人们改变行为
- 在某次研究计划中，想要调查环境照明 & 湿度对生产力的影响，结果发现，无论做了什麽变动，生产力都会进步，最後的假设是 → 管理阶层对劳工有兴趣这件事，导致劳工有正面反应
- 解决之道是：不要让被观察者知道他们正在被观察

目前进度：193/393

昨天整理的是 CH8 的开头，今天整理的是 CH8 的结尾。中间省略的是对「分解」和「间接研究」的介绍，这两个 keyword 比较是实践的问题，作者做了一些举例来告诉大家「没有你们想像得那麽麻烦」，总之我跳过了。

本来想直接进 CH9，但 CH9 要讲抽样，会和「误差」的概念有衔接，回头补上这一段。

每次读到一些⋯天书段落时 (我在摘要时有选择性跳过天书段 XD)，我常有种「我到底为什麽还要看下去，其实不太会真的用到，不是吗」的纠结，但每次遇到这种纠结时，我就试着回想「开卷计划」的初衷，单纯地想找回阅读的乐趣，不要预期让自己变得更厉害，不要预期某件手边任务能立刻变顺利，不带预期地保持动作，寻求动作本身的乐趣，而不是寻求有好处的结果。

大概就是每天要做类似的心理建设，才能继续进行下去。总之，很高兴又过了一天。

<<: Day 13 - 那个被我忘记的 ref / useRef / createRef 下

>>: Day13. 对面的女孩看过来，我们的镜头看过来 - Bounds

如何衡量万事万物 (7) 误差

和误差有关的名词

误差有两大类型

误差的特质

为什麽要选择准确性高的衡量？

观察偏误 (bias) 的种类

[2021铁人赛 Day07] General Skills 04

【在厨房想30天的演算法】Day 01 演算法好吃吗～

第三天：Gradle 的 5 个重要观念

SQL与NoSQL的连结(一)

Day23 DB-NodeJS中的MySQL

D-20 非同步 ? async ? await

Day28. Rails 搭配 DataTable 写出完美的列表页

【D7】试用厨具：历史资料（Historical Market Data）

Open API 概念

Ruby on Rails layout