在algorithmia的 2021 年报告显示,大多数组织在机器学习方面面临一定程度的监管负担,67% 的组织必须遵守多项法规。这些法规包含ISO, OCC, HIPAA, SOC, ...和其他。这意味着管理机器学习的专案应该要是大多数企业的首要关注点,尤其是金融等受到高度监管的行业。
*图片引用, Machine learning in finance
金融服务行业有各种合规和监管义务。最好的方式,应该与公司的的法律顾问、合规人员和其他参与 ML 流程的利益相关者一起讨论、审查和理解这些责任跟义务。举例来说,若有一个使用者的银行贷款申请被拒绝,贷款发放的一方须解释,这个决策的依据,即会牵涉到模型的可解释性。
一般来说,ML 模型的可解释性或可解释性是指让人们理解和解释模型用於达到其预测的过程的能力。ML 的到来并不是要完全取代人类做决策,而是帮助在众多讯息当中提取相关度高的资讯。每一个人的时间与精力都是有限度的,若是善用模型提供的资讯,则可以提升这些决策者做决定的时间以及准确度。
下列几项是使用机器学习时,所应该要做的专案监管:
(1) 可追溯性和可审计性
(2) 可解释性
(3) 即时模型监控
(4) 再现性
在金融业的可审计性是相当重要。在ML专案还没有被广泛使用的时候,金融业本身就会需要有各式的模型审查,针对公司在使用的相关金融模型,审查该单位的动机、模型存在以及预期的结果。这些审查可以分为两大类:(1)高级审查:执行以让客户对模型有额外的信心(2)正式的模型审计:为客户和利益相关者提供明确的保证。
在这两个审计下面展延出相关的检查事项,其中的审查内容包含:
(1)模型逻辑的回顾
(2)审查模型与财务和合同文件的一致性
(3)审查模型与相关会计和税务要求的一致性
(4)敏感性审查
这些审查模型运用在该公司预计要承担任何财务风险的时候会使用到的:估值模型、运营模型、再融资模型、投资组合模型、并购模型等等。
模型可追溯性是关於能够准确地跟踪模型的过去曾经在哪里,在做什麽,无论是在时间上还是在它可能经过的各种环境中。这可能意味着创建、预生产或生产环境。也可视为模型的“历史记录”或“审计追踪”。
这些纪录主要用於了解模型发生了哪些变化,对於长时间运行的专案或经常更新的模型特别有价值。模型可追溯性对於法律和合规性原因以及安全和所有权的相关问题也能够提供相对应的数据作参考。
除了在前一篇提到的:透过CloudTrail和CloudWatch 去监测开发过程的身份授权与相关活动纪录。这个是属於一般的软件专案也可以采用的部分。
另一方面,将ML的预测用在可追溯与审计的情境时,还需在以下的步骤里面思考可以如何追踪:
以Amazon SageMaker Experiments为例,可以将这个过程当中透过Git储存相关程序码,保存当时的实验状态快照,以确保与後面实验的相容性。并且可以浏览过去跟现在的实验,针对设定的指标比较模型表现。让这些纪录也可以有所留存。
在评估机器模型的时候也应有三部分评估需加入考量:
这几项评估,都应该有相对应的指标,并且标注模型调整的原因,以便於在日後追溯之前的实验过程,有相关资料可记录。
在这边提供来自Auditing Algorithms的审计清单:
相关人员清单
责任 | 示例角色名称 |
---|---|
领域知识 | 产品负责人、专家 |
AI系统用户 | 处理官员,个案工作者 |
用户支持 | 流程热线、服务台 |
开发者 | 资讯长(CTO/CIO) |
专案管理 | 专案负责人 |
原始资料质量和理解 | 资料工程师 |
机器学习模型 | 资料科学家 |
内部审计 | 审计人员 |
信息安全 | IT安全员 |
数据保护 | 数据保护和隐私专员 |
预算 | 预算持有人,预算专员 |
审计细节所需文件清单
关於在金融业的审查细节,若是在金融业的从业人员,务必以该行业、该市场的状况为基准。希望今天的文章可以带给大家一个概略的知识:知道大概有哪些审查,在执行ML专案上,需要在乎哪些跟软件开发有关、与ML本身专案特性有关的事情,最後附上相关的利益者清单,以及可审计的ML专案所需的文件清单。
今天先写到这边,其他的就明天说罗。
Reference
[1].Model Assessment and Model Traceability
[2].Model Audit - Wiki
[3].Model Audit
[4].Model Auditing: the why and the how
在上一篇文章提到对话系统的管理,今天我们要来说明主画面设定及场景资料转换。 需要注意的是,介面的素材...
CPU Scheduling Algorithm tags: IT铁人 作用 因为同时处理很多的pr...
结果我真的两篇就快讲完了(惊恐)。 既然是说要讲切版的话,还是多少交代一些比较基础的东西好了。 F...
专案前置准备 新建好资料库以及资料表 create table NewsType ( NewsTyp...
今天弄布林通道策略的部分,一般看到的布林通道会先弄出一条均线,然後在上下2个标准差的地方各画一条线,...