Invisible Primes:具有替代数据的金融科技贷款
本文发现利用一家金融科技平台提供的匿名管理数据来调查使用替代数据评估借款人的信用是否会导致更广泛的信贷访问。将金融科技平台模型的实际结果与用于监管报告目的的"传统模式"的反事实结果进行比较,发现后者将导致被拒绝的概率增加60%,且批准的利率更高。受影响最大的借款人是" Invisible Primes " ——信用评分低、信用历史短,但违约倾向低的借款人。本文表明,向这些借款人提供融资贷款会为借款人带来更好的经济成果,并为金融科技平台带来更高的回报。
简介
由于在线中介和金融技术(fintech)公司的兴起,信贷市场经历了重大突破。金融科技公司的一个关键特征是用算法和替代数据替代贷方和借方之间的面对面互动。他们的在线业务使这些新公司能够削减成本并在借贷产品中获得可观的市场份额。例如,在线贷方 Quicken Loans 是美国最大的抵押贷款发起机构,金融科技贷方占个人信贷市场的四分之一。尽管它们日益突出,但仍缺乏对这些新中介如何影响信贷可用性和家庭财务健康的清晰理解。传统上,具有高信用评分的消费者已经获得了多种低利率信贷选择的好处,虽然同样值得信赖,但如果强调,个人面临的选择有限且昂贵(如果有的话),金融科技贷方的出现有可能改变这种情况。
这种新型中介机构的出现引发了许多与政策相关的问题。一个关键问题是围绕着采用替代数据和算法承保的信用模型对信用可用性的影响。替代数据源和更自动化的承销方法可以降低贷款发起成本,这可能会转化为借款人的较低利率。替代承保模型也可能能够识别目前被信用评分等标准衡量标准忽视的个人。前消费者金融保护局局长 Richard Cordray 观察到:“将这种替代数据添加到组合中,有望为数百万额外的消费者开放信贷。”主要依靠信用评分有可能将很大一部分美国人完全排除在信用市场之外。据领先的信用评分提供商 Fair Isaac Corporation 称,2800 万美国人的档案数据不足以生成信用评分,2500 万美国人根本没有信用档案。消费者金融保护局 (CFPB) 的回应是鼓励贷方开发创新手段,增加公平、公正、非歧视性获得信贷的机会,特别是对于信用不可见者和那些受信用记录限制或缺乏信用记录的人。
模型
本文使用来自在个人贷款领域运营的主要金融科技平台的去识别化管理数据集,其中包括有关批准和拒绝的申请人的信息、用于评估借款人信誉的信用模型以及随后的两组申请人的信用报告。
Upstart 成立于 2012 年,是少数公共网络借贷平台之一,为美国各地的借款人提供个人贷款,也是少数公共网络借贷平台之一。Upstart 的承销模式与传统贷方使用的模式不同,其定价算法包含来自非常规来源的替代数据。2017年,Upstart向CFPB申请并获得了No-Action Letter,为防止与现有法规发生冲突。CFPB分析了Upstart的自动化无担保承销模式及其特点,并将其结果(即批准率和利率)与这些结果进行了比较。由不使用替代数据的反事实模型生成。CFPB 发现其审查并不保证对 Upstart 采取任何监督或执法行动。2020 年底,Upstart 根据 NAL 计划获得了额外三年的批准。
本文数据集从2014 年开始,到2021 年第一季度结束。它包括有关发起时的借款人特征和由 Upstart 发起的900,000笔贷款的每月贷款表现的信息。本文分析样本仅限于提供传统信用评分的 770,523 笔贷款。近年来,Upstart 在贷款数量和贷款总额方面均出现了显着增长。从 2017 年的约 75,000 笔增加到 2020 年的近 300,000 笔;从 2014 年的不到 1 亿美元增加到 2020 年的近 35 亿美元。虽然借款人可以直接在网站上完成申请,而且 Upstart 也邮寄营销报价,但大多数融资贷款,是通过像 Credit Karma 这样的贷款聚合器生成的——使借款人能够搜索的平台选择最适合他们需求的贷款产品。Credit Karma 从贷方处获取多个报价,从而显著降低完成申请的借款人的搜索成本。大多数贷款都是为信用卡再融资提供担保的。尽管 Upstart 在所有州开展业务,但特定县的贷款发放量较高,尤其是华盛顿、加利福尼亚、内华达和科罗拉多州的县。其他金融科技贷方也观察到类似的模式。爱荷华州和西弗吉尼亚州的低发行量是由于 Upstart 的主要银行合作伙伴 Cross River Bank 在这些州不活跃。我们的规范按年份固定效应控制邮政编码,这考虑了跨地区的差异以及与原始活动相关的时间差异。
平均而言,Upstart 的贷款约为 11,700 美元。10,000 美元的标准差表明借款人之间存在显着的异质性,有些人的借款金额明显更大。平均合同的特点是年利率为 22%,期限为四年。借款人在发起时的平均信用评分往往为 653。即使是前四分位数的得分也略高于 680,这表明 Upstart 的重点不是传统上被认为最值得信赖的个人。大多数借款人的年龄在 28 至 46 岁之间,平均年龄为 37 岁。本文还观察了有关借款人的经核实的收入信息。平均年收入为 67,000 美元(标准差为 173,000 美元),债务收入比约为 18%。大约 44% 的借款人拥有大学学位,平均工作五年。作为进入信贷市场的指标,借款人平均拥有 18 个存档账户。
本文数据的一个主要优势是它包括资助和未资助申请人的所有申请信息。平均而言,资助申请人的信用评分比非资助申请人高 70 分,年收入高 14,000 美元。获得资助(118,000 美元)的总负债和贷方余额也高于未获得资助(65,000 美元)的申请人。受资助的借款人也更有可能受过大学教育,不太可能是小时工,更有可能使用电脑并将贷款用于债务合并。
这些数据还允许访问申请人在最初和随后几个月的信用报告数据。Upstart 定期为当前的借款人提供信用报告,并为错过付款的借款人提供每月信用报告。Upstart 有权从申请之日起12个月内为不合格的申请人提取信用报告,并且通常在此期间多次提取信用报告,最后提取大约12个月。本文样本中的信用报告都来自同一个信用局 (TransUnion)
为了提供外部有效性的证据,本文使用来自 Moody’s Analytics 和 Freddie Mac 的抵押贷款绩效数据以及根据《家庭抵押贷款披露法案》(HMDA) 提供的抵押贷款申请数据来补充我们的分析。穆迪分析数据为非机构住宅抵押贷款支持证券的抵押贷款提供初始贷款水平数据和月度绩效数据。本文将样本限制为 30 年期固定利率抵押贷款,样本期间为 2000 年后。
本文首先探讨目前信用评分如何反映借款人的信用,信用评分基于未偿债务、付款历史、信用历史的长度和当前使用的信贷类型,分数越高意味着风险越小。本文接下来检查 Upstart 贷款样本的信用评分的预测能力。具体来说,使用Upstart的贷款绩效数据来估计方程,其中两种违约措施——冲销和拖欠——作为结果变量。冲销记录贷款未清偿余额作为损失冲销的情况;拖欠被定义为 90 天或更长时间未付款。结果显示信用评分对于金融科技的违约预测不如传统贷方,尤其是对于低信用评分的个人。本文使用 38 个传统和非传统变量对 Upstart 发起的 3 年期贷款执行 RFE-RF 程序。教育水平仍然是 Upstart 违约概率的主要预测因素之一。结果显示,Upstart 违约概率对信用评分构成显着改善,并且这种改善不能完全由信用报告中的可用信息来解释。使用替代数据实际上至关重要。在分析的这一部分中,本文重点关注样本中的 98,671 笔融资贷款,这些贷款可获得传统模型结果。检查了被传统模型拒绝的融资贷款的比例,并比较了两种模型提出的利率差异。模型之间的差异会影响粗放边际和集约边际。
结论
金融科技贷方在无抵押贷款市场上的日益突出,增加了解他们的方法及其参与的影响的重要性。由于缺乏有关金融科技贷方运营的详细管理数据,对这种理解的追求受到了阻碍。本文利用来自一家主要金融科技贷方的独特数据来阐明这一领域。本文表明,Upstart 使用的替代数据在违约可能性方面表现出比信用评分更高的预测能力,信用评分是传统上用于判断借款人信誉的标准指标。本文进一步表明,预测违约率的卓越能力转化为更广泛的信贷渠道,特别是对于信用评分较低的借款人。这些影响在广义边际(即个人是否能够获得信贷)和贷款定价(即贷方愿意为贷款提供资金的利率)中检测到。金融科技承销模式的受益人是低信用评分借款人,否则他们很可能在传统承销模式下被拒绝信贷或面临高利率。向这些人提供信贷会转化为 Upstart 更高的回报,这表明可能存在采用新信贷模式的私人动机。能够获得信贷的低信用评分个人也表现出对其他债务(例如信用卡)的违约可能性要低得多,并且通常能够随后提高他们的信用评分,从而提供更多来自传统贷款来源的信贷。
本文结论通过提供在贷款批准筛选过程中产生积极影响的证据,为关于使用替代数据的辩论提供了信息。虽然他们没有解决围绕隐私和统计歧视的潜在问题的争论,但本文的结果确实表明替代数据模型为借款人和贷款人提供了可量化的好处。
微信扫描关注公众号,及时掌握新动向
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场
2.本文版权归属原作所有,仅代表作者本人观点,不代表比特范的观点或立场