如何衡量万事万物 (7) 误差

如果你要量体重,在以下两个情况中,你会选择何者:

  1. 一个「已校准过」的体重计,也就是能反映真实的体重,但是放在移动中的露营车上,每次测量时,会因为汽车的颠簸而受到干扰。
  2. 一个「没有被校准过」的体重计,但放在良好的环境中,每次测量时不会受到干扰

和误差有关的名词

这个段落在讨论「如何看待『误差』」,在讨论前,作者先厘清了相关的名词。

误差有两大类型

  • 系统性误差 / 偏误 (systemic error/ bias)
    • 衡量本身有一个倾向,会偏向某个特定结果
    • 这个偏向是有一致性的
  • 随机误差 (random error)
    • 无法透过个别观察来预测误差
    • 不具一致性,和已知的变数无关
    • 但这类误差在大群体中,会遵守机率法则

例如,销售员在估算下一季营收时,会例行性高估 50%,这是系统性误差;而若非每次都是高估 50%,就是随机误差。

误差的特质

想要表达「误差的特质」时,要厘清以下两个词:

  • 正确性 (accuracy)
    • 衡量结果「有多接近真实」
    • 系统性误差愈小,正确性愈高
  • 准确性 (precision)
    • 多次衡量是否能达到一致的结果,也就是衡量的可复制性 (reporducibility) & conformity
    • 随机性误差愈小,准确性愈高

回到体重计的举例,

  • 如果放在浴室里的体重计被固定调高 2 公斤 → 它是准确的,但不是正确的
    • 此时,precise 的意思是,每次你上去量体重,都会得到一致的答案,但这个答案不等於你的真实体重
    • 若你知道体重计「被固定调高 2 公斤」的资讯,才能获得真实体重
  • 放在露营车上、校准过的体重计 → 正确性好,但准确性低
    • 你在一分钟内量了两次,会得到不同的答案
    • 但多次测量後,平均答案会接近真正的体重

任何降低两种误差的方法都称为「对照控制」。

为什麽要选择准确性高的衡量?

回到一开始的问题:

  1. 一个「已校准过」的体重计,也就是能反映真实的体重,但是放在移动中的露营车上,每次测量时,会因为汽车的颠簸而受到干扰。
  2. 一个「没有被校准过」的体重计,但放在良好的环境中,每次测量时不会受到干扰

在此例中,作者认为,比较好的选择是 1,因为 1 可以透过多次测量的平均来获得一个可信赖的范围,而 2 的误差是未知的。除非你知道体重计被调高或调低的资讯,否则永远无法获得真实体重。

然而,作者表示,在真实情境中,绝大多数人会倾向采用模式 2。

例如,企业想要知道「销售员花多少时间与客户开会,又花多少时间在其他行政事务上」。

  • 实务上常常看到的作法是 → 检视工作时间记录卡
  • 而「工作时间记录卡」是有误差的,因为人们常常在下班时匆匆忙忙地填表,有些人习惯高估、而另一些人习惯低估
  • 全面检视工作时间记录卡以後,假设有 5000 份纪录卡、100 名销售员、50 个星期,会得知销售员有 34% 时间花在与顾客沟通上
  • 我们获得了一个确切的数值,但是不知道这个数值和真实状况的距离为例

另一种作法

  • 在随机选取的时间,随机选择一名销售员,看看他是否正在开会
  • 随机抽样 100 次之後,发现有 13 件正在开会中
  • 此时,若具备对抽样统计的知识,可以获得 90% CI 的范围是 → 销售员有 7.5%~18.5% 时间花在与顾客沟通上

在这两种结论中,你认为哪个较可信?

观察偏误 (bias) 的种类

  • 预期性偏误
    • 只看到你想要的,也就是自我欺骗
    • 在新药临床试验中,医师和病人都不可以知道谁服用了安慰剂
  • 选择性偏误
    • 在抽样调查时,虽然知道要随机,但发生了「没有注意到的非随机性」
    • 例如,在金融特区的街道上随机问路人,他们要投票给哪一位候选人
  • 观察者偏误
    • 在观察的过程中,因为「观察」这个动作,导致人们改变行为
    • 在某次研究计划中,想要调查环境照明 & 湿度对生产力的影响,结果发现,无论做了什麽变动,生产力都会进步,最後的假设是 → 管理阶层对劳工有兴趣这件事,导致劳工有正面反应
    • 解决之道是:不要让被观察者知道他们正在被观察

目前进度:193/393

昨天整理的是 CH8 的开头,今天整理的是 CH8 的结尾。中间省略的是对「分解」和「间接研究」的介绍,这两个 keyword 比较是实践的问题,作者做了一些举例来告诉大家「没有你们想像得那麽麻烦」,总之我跳过了。

本来想直接进 CH9,但 CH9 要讲抽样,会和「误差」的概念有衔接,回头补上这一段。

每次读到一些⋯天书段落时 (我在摘要时有选择性跳过天书段 XD),我常有种「我到底为什麽还要看下去,其实不太会真的用到,不是吗」的纠结,但每次遇到这种纠结时,我就试着回想「开卷计划」的初衷,单纯地想找回阅读的乐趣,不要预期让自己变得更厉害,不要预期某件手边任务能立刻变顺利,不带预期地保持动作,寻求动作本身的乐趣,而不是寻求有好处的结果。

大概就是每天要做类似的心理建设,才能继续进行下去。总之,很高兴又过了一天。


<<:  Day 13 - 那个被我忘记的 ref / useRef / createRef 下

>>:  Day13. 对面的女孩看过来,我们的镜头看过来 - Bounds

D-20 非同步 ? async ? await

如何同时进行 昨天的日子中小光学到了如何使用delegate跟Linq,这让小光在资料处理中的程序开...

Day28. Rails 搭配 DataTable 写出完美的列表页

今天要讲Stimulus & Datatable 的用法,不过不会Stimulus的读者们不...

【D7】试用厨具:历史资料(Historical Market Data)

前言 当我们要使用交易,或是做策略的时候,历史资料是不可或缺的,这边就使用Shioaji的历史资料功...

Open API 概念

为什麽想写这个? 一样是在某次开会听到这个名词,脑中开始想说这跟api有什麽不一样,为什麽要特别加...

Ruby on Rails layout

只能⼀个版型吗? 如果你喜欢,可以有多种款式的版型,预设的版型是 app/views/layouts...