本篇文章4707字,读完约12分钟

严重依赖判断和经验的行业,如审慎监管,经常抵制算法可以改善人类专业知识可以完成的任务的想法。这种抵抗是错误的,我们不能再犯了。

资料来源:亚太未来金融研究所

资料来源:加拿大金融机构监管局,2018年6月25日

本文是加拿大金融机构监管当局官员杰里米·鲁丁在加州旧金山举行的第11届亚洲银行和金融研讨会上的讲话

本文由亚太未来金融研究所的研究团队编写

摘要:数据科学将对如何监管金融机构产生重大影响。人们希望监管者会意识到,数据科学对数据科学家来说太重要了,无法处理。作为监管者,我们需要知道数据科学能做什么和不能做什么。如果监管者不理解如何明智地使用数据科学,他们将无法获得这些强大技术的所有好处。

加拿大金管局:数据科学与金融监管的未来

以下是讲话的全文:

下午好,很高兴参加第11届亚洲银行与金融研讨会。我还要感谢旧金山联邦储备银行和新加坡货币管理局的邀请。

在这部分的研讨会中,组织者要求监管者考虑是否要适当改进监管工具,增强监管能力,以适应金融体系的不断发展,跟上变化的原因。

我们都看到了技术变革是如何重塑金融服务业的。在我看来,这些发展中最重要的是收集和分析数据能力的惊人提高。可用的数据集非常大,因此需要新的方法来分析它们。通过更广泛地使用机器学习和人工智能,我们可以利用不断增长的计算能力。

加拿大金管局:数据科学与金融监管的未来

当人们称这个新领域为“数据科学”时,它不仅仅意味着营销:应用于大规模数据集的分析技术,这代表了传统统计学和计量经济学的重大突破。

众所周知,金融服务业已经接受了数据科学,并正在进一步投资于这一领域。金融机构在保险承保、信用判断、反洗钱和许多其他领域使用数据科学和技术。

加拿大金管局:数据科学与金融监管的未来

对于监管者来说,这是一个非常重要的话题,但这不是我今天的话题。我不会讨论数据科学将如何改变金融机构的行为,但会讨论数据科学将如何改变监管者的行为。

加拿大金管局:数据科学与金融监管的未来

数据科学及其对监管的影响

在我看来,数据科学将对监管机构监管金融机构的方式产生巨大影响。

我向其他监管者发出了一个信息:数据科学对数据科学家来说太重要了。作为监管者,我们需要知道数据科学能帮助我们什么,不能帮助我们什么。如果你不知道如何明智地使用数据科学,你将无法获得这些强大技术带来的所有好处。此外,我们可以转移我们对一些重要风险的注意力;这是一个我只能责怪自己的错误。

加拿大金管局:数据科学与金融监管的未来

让每个人都相信数据科学太重要了,不能让数据科学家独享。我将考虑它如何适用于两个不同的监管机构。第一监督者从事行为监督——调查和起诉非法内幕交易。我会叫这个主管“她”。第二位监管者从事大型复杂银行的审慎监管。我会称这个主管为“我”。

加拿大金管局:数据科学与金融监管的未来

数据科学与行为监管:监控内幕交易

请允许我的行为监督同事先介绍一下工作。

作为一名行为监督员,她有很多目标。包括防止,如果不是防止,非法内幕交易。她的工作还要求她发现过去的非法内部交易案例,这样她就可以起诉。

加拿大金管局:数据科学与金融监管的未来

她持有大量数据;各种金融工具市场交易的高频数据,包括可追溯到几年前的数据。她有理由相信她的数据集中有非法内幕交易的迹象,只要她知道在哪里可以找到这些数据。

加拿大金管局:数据科学与金融监管的未来

她求助于数据科学。她能做什么?

假设她在职业生涯中发现并起诉了一些内幕交易案件。她用这些信息来标记她数据集中已知的内幕交易。然后,她编写了一个机器学习算法来查看整个数据集,以便找到最符合这些标准的内幕交易案例的交易模式。然后,算法可以在数据的其他地方寻找这些模式。

加拿大金管局:数据科学与金融监管的未来

她得到的是一份最有可能的交易清单,用来调查潜在的非法内幕交易,如算法所示。当她调查这些案件时,她会发现什么?

如果她一开始就有一些被证实的内幕交易,她可能会发现算法的预测并不完全可靠。具有讽刺意味的是,与确认的内幕交易数量相比,有太多的数据,这是一个真正的问题。该算法可以查看具有不同特征的列表:交易的利润有多高;有多少人做过类似的交易;交易速度有多快;同一组交易员在相关衍生品领域做了什么;等等。在这个很长的列表中,任何交易都可能有一些共同的特征,即使它只是偶然的。机器学习算法将找到许多(如果不是全部的话)共同的指标。其中一些是内幕交易的可靠指标,而另一些只是巧合。

加拿大金管局:数据科学与金融监管的未来

这个问题被称为“过度拟合”,这在计量经济学中非常普遍。这在机器学习练习中非常常见,当我们试图检测的事件数量相对较少时,“过度拟合”的问题就变得更加突出。

加拿大金管局:数据科学与金融监管的未来

过度交配是个问题,但对她来说并不是致命的。她没有用数据科学来推断某项交易是内幕交易。她正在利用数据科学来识别可疑交易,以便进一步调查。一旦她有了适当的清单,她就可以收集其他证据,并决定哪些由算法确定的可疑交易可以被起诉。事实上,她有义务收集自己的证据。仅凭数据科学,她无法制裁那些进行内幕交易的人。

加拿大金管局:数据科学与金融监管的未来

数据科学与审慎监管:可能的好处

现在轮到我了。

作为一名谨慎的监管者,我的工作是将中国大型复杂银行倒闭的可能性降低到可以接受的低水平。我该怎么办?

审慎监管有许多方面。银行的审慎监管者通常会审查或检查银行的风险管理实践,找出不足之处,并要求采取补救措施来克服这些不足之处。我们还设定了超过最低监管要求的资本和流动性要求。

加拿大金管局:数据科学与金融监管的未来

为了支持审慎监管,监管者寻找指向风险过高的银行的指标,或者指出银行中风险过高的具体活动。然后,可以采取措施将风险降低到可接受的低水平。

加拿大金管局:数据科学与金融监管的未来

我和我的同事做了大量的数据分析。通过将计算能力与更精确的数据相结合,我们可以提高现有数据分析的速度、准确性和细节。这是向前迈出的一小步;也许这将是向前迈出的一大步。

加拿大金管局:数据科学与金融监管的未来

但这不是我要找的。我必须相信,在这些数据中可以找到更有力、更深刻和更有用的指标。我将尝试使用数据科学来找到这些指标。

我使用的数据集来自一个国家的信息,因此它涉及到有限数量的大型复杂银行。然而,回到前几年,数据集有许多关于这些银行的细节。

如果我像许多谨慎的监管者一样,我的数据集中只会出现一些大而复杂的银行破产。为什么?因为没有那么多大型复杂的银行,它们也不经常倒闭。和我的行为监督同事一样,我的结果很容易被夸大。

加拿大金管局:数据科学与金融监管的未来

然而,我不能用同样的方法来缓解她所使用的过度合身的问题。我不指望发现过去发生了什么;我期待预测未实现的未来。我没有其他证据来最终证实或反驳该算法做出的识别。

加拿大金管局:数据科学与金融监管的未来

对我来说,要求确凿的证据是一个过分的要求。我可以决定对算法选择的银行做一个特别的审查。这是可行的,但我只有一些大型和复杂的银行,我已经密切关注这些银行,但这不是很有帮助。

加拿大金管局:数据科学与金融监管的未来

如果我能用算法的预测告诉我在哪里可以看得更近,那会更有用。这里我有两个问题,我的行为监管同事不会有。

第一个问题是不可能对算法的预测有一个清晰或直观的解释。该算法将使用一系列分散在多家银行的指标,找出风险最大的银行,并在不同时间关闭。它不会告诉我去哪里找什么。这是我应该期待的。机器学习算法通常不被用来解释他们为什么预测他们所预测的。

加拿大金管局:数据科学与金融监管的未来

第二,由于我是一个谨慎的监管者,我不从事预测,但我从事预防工作。该算法能够真正找到预测未来故障的最佳因素。我需要知道的是未来失败最可能的原因。这可能是两件不同的事情。如果某件事不会导致逆转,那么采取监管行动来改变预测的银行破产是没有意义的。简而言之,不让公鸡啼叫并不能阻止太阳升起。

加拿大金管局:数据科学与金融监管的未来

我的主管同事没有这个问题。一旦她发现可疑交易,她可以确认是否可以起诉。任何可能引导她进行调查的交易都隐藏在她数据集中的数百万笔交易中,这些交易对她都很有用。对她来说,是机器发现了火还是只有烟并不重要。

加拿大金管局:数据科学与金融监管的未来

我们的实践如何影响数据

然而,我们有另一个共同的问题。我们都必须面对这样一个事实,即监管方式将影响所使用的数据。

用一个审慎监管的例子来说明这一点。假设数据显示,从事特定业务的银行在未来很容易倒闭。由于审慎监管从事的是预防性业务,因此可以决定禁止特定业务,除非银行采取一些经批准的措施来抵消破产风险。让我们假设这可以防止由这种冒险行为导致的失败。这种新的监测方法将反馈到数据中。

加拿大金管局:数据科学与金融监管的未来

在新系统下收集数据时,观察银行的具体风险将不再能够预测银行未来是否会倒闭。监管实践将使数据掩盖潜在的风险。

此外,在我们的监管实践中,可能还有另一种更有害的方式来掩盖真正的风险。假设我们错误地禁止了并不真正危险的做法。数据永远不会揭示这个错误,因为我们不会允许这种做法出现在数据中,从而证明它是无害的。

加拿大金管局:数据科学与金融监管的未来

我的主管同事也面临着同样的问题。潜在的内幕交易者可能理解她用来识别内幕交易的指标。这些罪犯然后可以学习如何在不触发这些指标的情况下进行内幕交易。重要的是,如果她算法标记的病例数量下降,她不应自满。这种下降可能表明她在发现内幕交易方面做得越来越好,而且改进后的发现具有威慑作用;或者这可能意味着这些罪犯可以更好地避免被发现。

加拿大金管局:数据科学与金融监管的未来

利用无监督机器学习的力量

到目前为止,在我的例子中,我一直称谨慎的主管为“我”,但这并不完全准确。目前,我无法尝试上述方法,因为我的数据集中没有任何大型复杂银行的失败。

加拿大金管局:数据科学与金融监管的未来

数据科学能为我做什么?确实有。当我们不能在数据集中标记感兴趣的案例时,我们可以使用无监督的机器学习方法。在无监督学习中,该算法寻找数据中的异常。算法不知道这些情况有什么问题;算法只知道它们在某种程度上不同于其他算法。换句话说,这些情况可能是进一步研究的候选者。

加拿大金管局:数据科学与金融监管的未来

例如,如果我的行为监管同事没有确认存在内幕交易的情况,她可以使用无监督的机器学习来确定异常情况,以便进一步调查。

我如何处理异常情况?当然,我可以进一步研究它们,看看它们是否指向具有过度风险的活动。与我的主管同事不同,我无法证明发现的异常情况过于危险;毕竟,在我的数据集中没有问题。相反,作为一名谨慎的监管者,我将运用我的判断和经验来判断哪些异常(如果有的话)表明过度冒险。当我这样做的时候,我必须意识到两个可能的陷阱。

加拿大金管局:数据科学与金融监管的未来

首先,在投入时间和精力寻找异常之后,我会倾向于寻找理由相信所发现的异常确实是过度风险的指标。偏见形成后,认为你已经找到了你想找到的东西的倾向在未来很难改变。

加拿大金管局:数据科学与金融监管的未来

如果我们现在屈服于这种偏见,我们将无法在未来纠正它。通过防止银行做任何导致异常的事情,我们将确保此类异常指标不会再次出现在数据中。正如我们之前讨论过的,它将没有机会证明自己的清白。

加拿大金管局:数据科学与金融监管的未来

其次,当我逐渐消除数据中的异常时,我将使其大型和复杂的银行彼此更加相似。如果我禁止过度危险的活动,这可能是好的。这就是所寻求的相似之处。然而,如果它降低了银行之间的权力下放程度,使所有银行都容易受到同样的影响,问题就会出现。

加拿大金管局:数据科学与金融监管的未来

有一种不那么雄心勃勃但可能更可靠的方法,我可以在没有银行倒闭的情况下,在数据集上使用无监督的机器学习。我可以对银行提交的监管文件进行无监督的机器学习,然后调查算法发现的异常是否指向提交的不正确或欺诈性监管文件。这是我可以独立验证的东西,虽然经过一些努力,它肯定是有用的。不正确、更糟糕和欺诈性的监管报告肯定会引起相关银行的警惕。

加拿大金管局:数据科学与金融监管的未来

结论

在短短几分钟内,我们只触及了问题的表面。可以考虑其他情况,并通过数据科学提供更多技术。我想在每个人的耐心达到极限和他们的知识达到极限之前完成我的演讲。

加拿大金管局:数据科学与金融监管的未来

让我用这个想法来结束这次演讲。严重依赖判断和经验的行业,如审慎监管,经常抵制算法可以改善人类专业知识可以完成的任务的想法。这种抵抗是错误的,我们不能再犯了。

加拿大金管局:数据科学与金融监管的未来

数据科学在金融监管中发挥着重要作用。它如此重要,以至于不应该只留给数据科学家。

本文由平台/作者授权的金融网站发布。请不要擅自转载。如果你对干货有意见或文章,你愿意为投资者提供最权威和专业的参考意见。无论你是权威专家、金融评论家还是智囊团,我们都欢迎你积极投稿,进入金融网站的著名栏目。
电子邮件地址:mingjia @ jrj,电话号码:010-83363000-3477。期待您的加入!

标题:加拿大金管局:数据科学与金融监管的未来

地址:http://www.9u2j.com/wnylyw/3856.html