不变的只有变化本身:风险管理中的时序分析
内容摘要
风控需要时序观:无论是客户、行为、事件、资金、集群还是风险,在时间维度上都有一个演化和传播的过程,忽略了这个过程,可能就忽略了客体产生、发展、消亡的具体细节。
声明
本文中的所有信息和数据都是虚拟的,仅为说明数据化审计的思路和过程,不代表真实的业务情况。
引子
世界是物质的,物质是运动的,运动是有规律的,规律是可以认识的,认识是发展变化的。
风控需要时序观
在日常风险管理工作中,我们看到的数据很多时候就是一张报表、一份报告,截止某年某月每日,指标XXXXXX,较去年XXX…… 内容往往都是集中对一个时点的切片(time slice)进行分析。
但我们身处的不是一维空间,数据是在三维空间中产生的,除了纸上可见的数据这一维度外,至少还有空间维度、时间维度。
我们关注的客体,无论是客户、行为、事件、资金、集群还是风险,在时间维度上都有一个演化和传播的过程,忽略了这个过程,可能就忽略了客体产生、发展、消亡的具体细节。
如,一个内部舞弊案件中,作案人在每个对账的节点日都会巧妙地通过过渡账户掩盖挪用的事实。只是从时点看,账实相符,没有问题。但如引入时间维度,观察账户在时间轴上的交易行为,就会发现很多异常。
又如,一家机构的资产质量情况,从年底报表的数据看,控制在一个良好的数字之下,是否说明这个机构的风险控制能力在不断提升呢?如引入时间维度,考虑到客户建立时间、放款时间,会发现很多风险状况是被时点的数据均值化了。
再如,风控发现一个洗钱网络很庞大,有很多中心节点。在发现问题的这个时间节点上,这些中心节点很凸显也很重要。但如引入时间维度,观察该网络在时间轴上的发展变化,就会发现很多看似边缘化的节点、单一关系(边),在网络壮大过程中发挥了关键的作用。
时序分析的方法
时间序列分析方法有很多种,每种方法都有很多类似或者不同的中文翻译,不同的方法也可能是同一个中文翻译。下文的介绍中,为便于区分,方法名称用英文。
1. Time Series Analysis
简单地说就是常见的趋势分析,一般是基于一个变量在连续一段时间内的一系列观察值进行分析,研究其中隐含趋势,一般可以用图表展现出来。
原理很简单,现实很骨感。趋势远不是一个简单的线性拟合就可以描绘出来的,尤其当时间轴不是平滑的时候,预测的结果往往大相径庭。
这也意味着,消除时间轴的不平滑影响,如季节性因素、周期性因素、节假日、变更点等,在 Time Series Analysis 中至关重要。
Facebook 开源了一个 Time Series Analysis 分析利器 Prophet 。Prophet 可以适配任何时间尺度,还能很好的处理异常值和缺失数据,对趋势变化非常敏感,可以预测整整一年的时间。此外,Prophet 还考虑到了假期等特殊时间的影响,可以自定义变更点。
下图为 Prophet 官网例子,是对来自维基百科上面对美国橄榄球运动员佩顿·曼宁(Peyton Williams Manning)的日访问量的分析。
黑点为实际值,蓝点为预测值,浅蓝色阴影区域表示预测可能区间。
(图源:Prophet 官网 , 非商业用途 , 侵删)
2. Cohort Analysis
Cohort Analysis 也叫 Vintage Analysis ,中文名称有留存分析、 世代分析、 同行分析、同期群分析等。
简单地说,Cohort Analysis 就是将某一个时期内的分析客体(如用户、贷款)等划分为一个 cohort,并将多个 cohort 在时间轴上的某个属性(如留存率、不良率)进行分析比较的一种分析方法。
比如,对投放的贷款按照贷款投放的月份划分 cohort, 在贷款期限中结合放款的时间分析 M4 以上的逾期情况。
下图可见,2018 年 5 月相对于 2018 年 1~4 月的逾期率大幅度下降,说明该阶段风控策略提升明显。
(图源:zhihu , 非商业用途 , 侵删)
再如,需要分析一个新产品推广投入财务资源的效益性,仅仅从时点报表看,客户数很多,总收益也不错。但基于 Cohort Analysis 就会发现,客户带来的收益在时间轴上衰减很快,财务资源的投入产出还有优化空间。
(图源:网络 , 非商业用途 , 侵删)
3.Temporal Analysis
Temporal Analysis 也是一种基于时间维度的分析方法,一般用于社交网络分析、时空地理信息分析。
对于关联交易网络、洗钱网络、担保网络、围标网络等等,在任何时点上看到的都是当前网络的情况。对比这些时间切片上的网络可以看到,网络是逐步形成,发展变化的。
(图源:A.H. Dekker , 非商业用途 , 侵删)
但在风险管理过程中,不仅仅要看网络的静态状态,还需要了解网络产生、发展、爆发的过程,总结网络在时间轴上的动态特征,从而决定在哪些关键的时点采取更有效的风险控制措施。
比如,对如下的交易关系数据,可以通过 Temporal Analysis 动态看到网络的形成,哪些节点在时间的维度上成为关键节点。
点击以下链接查阅往期文章
一如既往,期待您的真知灼见!