MLOps在金融产业:看懂金融审计如何导入ML专案(附所需文件清单)

在algorithmia的 2021 年报告显示,大多数组织在机器学习方面面临一定程度的监管负担,67% 的组织必须遵守多项法规。这些法规包含ISO, OCC, HIPAA, SOC, ...和其他。这意味着管理机器学习的专案应该要是大多数企业的首要关注点,尤其是金融等受到高度监管的行业。

*图片引用, Machine learning in finance

金融服务行业有各种合规和监管义务。最好的方式,应该与公司的的法律顾问、合规人员和其他参与 ML 流程的利益相关者一起讨论、审查和理解这些责任跟义务。举例来说,若有一个使用者的银行贷款申请被拒绝,贷款发放的一方须解释,这个决策的依据,即会牵涉到模型的可解释性。

一般来说,ML 模型的可解释性或可解释性是指让人们理解和解释模型用於达到其预测的过程的能力。ML 的到来并不是要完全取代人类做决策,而是帮助在众多讯息当中提取相关度高的资讯。每一个人的时间与精力都是有限度的,若是善用模型提供的资讯,则可以提升这些决策者做决定的时间以及准确度。

下列几项是使用机器学习时,所应该要做的专案监管:
(1) 可追溯性和可审计性
(2) 可解释性
(3) 即时模型监控
(4) 再现性

可追溯性和可审计性

金融业的审查

在金融业的可审计性是相当重要。在ML专案还没有被广泛使用的时候,金融业本身就会需要有各式的模型审查,针对公司在使用的相关金融模型,审查该单位的动机、模型存在以及预期的结果。这些审查可以分为两大类:(1)高级审查:执行以让客户对模型有额外的信心(2)正式的模型审计:为客户和利益相关者提供明确的保证。

在这两个审计下面展延出相关的检查事项,其中的审查内容包含:
(1)模型逻辑的回顾
(2)审查模型与财务和合同文件的一致性
(3)审查模型与相关会计和税务要求的一致性
(4)敏感性审查

这些审查模型运用在该公司预计要承担任何财务风险的时候会使用到的:估值模型、运营模型、再融资模型、投资组合模型、并购模型等等。

导入专案

模型可追溯性是关於能够准确地跟踪模型的过去曾经在哪里,在做什麽,无论是在时间上还是在它可能经过的各种环境中。这可能意味着创建、预生产或生产环境。也可视为模型的“历史记录”或“审计追踪”。

这些纪录主要用於了解模型发生了哪些变化,对於长时间运行的专案或经常更新的模型特别有价值。模型可追溯性对於法律和合规性原因以及安全和所有权的相关问题也能够提供相对应的数据作参考。

除了在前一篇提到的:透过CloudTrail和CloudWatch 去监测开发过程的身份授权与相关活动纪录。这个是属於一般的软件专案也可以采用的部分。

另一方面,将ML的预测用在可追溯与审计的情境时,还需在以下的步骤里面思考可以如何追踪:

  • (1)详细了解建模过程中使用的数据
    • (a)采样与资料代表性
    • (b)分层抽样、过度抽样或抽样不足
  • (2)资料转换、特徵工程
    • (a)识别和处理丢失、重复或不一致的数据点
    • (b)新特徵的创建、规范化和标准化
  • (3)构建了什麽类型的模型
  • (4)超参数
  • (5)後处理
    • (a)批次处理作业当中的资料处理
    • (b)即时处理的模型效能追踪

Amazon SageMaker Experiments为例,可以将这个过程当中透过Git储存相关程序码,保存当时的实验状态快照,以确保与後面实验的相容性。并且可以浏览过去跟现在的实验,针对设定的指标比较模型表现。让这些纪录也可以有所留存。

在评估机器模型的时候也应有三部分评估需加入考量:

  • (1)模型性能,也就是数学指标。像是 ROC曲线、accuracy、混淆矩阵等等。
  • (2)商业指标,端到端的模型预测,从前处理到预测後处理,与商业端的案例结合之後,所预测出来的结果与商业行为的差异。若是模型本身很简单,这些指标几乎可以直接对应模型指标。但是大部分的情形都相较复杂,可能结合数的模型指标,针对不同的权重组合之後,才会得到的商业指标。
  • (3)模型表现基准,这一项包含像是:延迟和吞吐量、模型使用了多少内存、是否受到数据吞吐量或其他系统的限制等等。如果发现这些基准与预期的不符合,是否可以使用计算资源进行改进。

这几项评估,都应该有相对应的指标,并且标注模型调整的原因,以便於在日後追溯之前的实验过程,有相关资料可记录。

可审计清单:

在这边提供来自Auditing Algorithms的审计清单:

相关人员清单

责任 示例角色名称
领域知识 产品负责人、专家
AI系统用户 处理官员,个案工作者
用户支持 流程热线、服务台
开发者 资讯长(CTO/CIO)
专案管理 专案负责人
原始资料质量和理解 资料工程师
机器学习模型 资料科学家
内部审计 审计人员
信息安全 IT安全员
数据保护 数据保护和隐私专员
预算 预算持有人,预算专员

审计细节所需文件清单

  • 专案管理者
    • 角色和职责(定义和传达)
    • 背景评估:相关法律法规(包括所需的透明度)
    • 风险评估(包括副作用)和缓解策略
    • 成功的目标和衡量标准
    • 交付品质
    • 维护、发展战略
    • 与利益相关者(“客户”,如部门、用户、资料提供)的沟通
    • 人机交互政策
    • 自治和问责
  • 资料管理
    • 资料获取方式
    • 群体代表性和潜在偏见(原始数据)
    • 资料品质(原始数据)
    • 资料库结构
    • 使用的变量/特徵列表
    • 个人资料隐私与保护
  • 模型开发
    • 软件与硬体规格
    • 特徵选择
    • 性能指标的选择
    • 优化流程
    • 对看不见的数据的期望
    • ML 算法类型的选择(包括黑盒与白盒)
    • 程序码品质
    • 维修计划
    • 模型品质
    • 成本效益分析
  • 生产中的模型
    • 资料更新和监控
    • 模型再训练
    • 自动化、系统架构、与其他系统接口
    • 长期模型品质维护
    • 产品环境的性能控制
  • 评估
    • 评价方法
    • 不同方法的比较
    • 透明度和可解释性方法
    • 偏见和公平性测试
    • 安全风险和缓解策略

结语

关於在金融业的审查细节,若是在金融业的从业人员,务必以该行业、该市场的状况为基准。希望今天的文章可以带给大家一个概略的知识:知道大概有哪些审查,在执行ML专案上,需要在乎哪些跟软件开发有关、与ML本身专案特性有关的事情,最後附上相关的利益者清单,以及可审计的ML专案所需的文件清单。

今天先写到这边,其他的就明天说罗。

Reference
[1].Model Assessment and Model Traceability
[2].Model Audit - Wiki
[3].Model Audit
[4].Model Auditing: the why and the how


<<:  Day 19 ( 中级 ) 阵列点灯 ( 动画 )

>>:  [Day4]专案始动-续(後端篇)

Day 28 | Unity游戏开发 - 介面设置及场景转换

在上一篇文章提到对话系统的管理,今天我们要来说明主画面设定及场景资料转换。 需要注意的是,介面的素材...

Day-23 CPU Scheduling Algorithm

CPU Scheduling Algorithm tags: IT铁人 作用 因为同时处理很多的pr...

[CSS] Flex/Grid Layout Modules, part 3

结果我真的两篇就快讲完了(惊恐)。 既然是说要讲切版的话,还是多少交代一些比较基础的东西好了。 F...

.Net Core Web Api_笔记13_api结合ADO.NET资料库操作part1_专案前置准备到资料新增

专案前置准备 新建好资料库以及资料表 create table NewsType ( NewsTyp...

[Day27] 布林通道策略

今天弄布林通道策略的部分,一般看到的布林通道会先弄出一条均线,然後在上下2个标准差的地方各画一条线,...