评分模型的演进:阶段2-数据检查和项目参数(1)

选自《credit risk scorecards》第四章,翻译:林晶

评分模型的开发过程中这一阶段可能是耗时最长且最幸苦的阶段。它的作用有二:一是判定评分模型的可行性,二是设置高标准的项目参数。参数包括除外条款,目标释义,取样窗及行为窗。

数据的可获得性及质量

阶段2首先需明确数据的可获得性,包括数据的质量和数量。评分模型的开发需要可靠的数据,最低限度要包括“好”与“坏”的数据。当拥有数据库技术时,这一过程将变得简单且有效。……

数据收集

为了界定评分模型项目的项目参数,数据必须以数据库的格式收集。项目参数主要包括:基于行为和取样窗中的“好”和“坏”数据的界定,以及在样本或正式模型开发过程中的数据使用条款的界定。……

项目参数的界定 

1.除外条款

特定类型的账户需要在样本开发过程中予以排除。一般而言,开发过程中所使用的账户包括以下几个:日常信贷操作过程中评分的账户和将成为你预期客户的账户。账户有不良行为的(例如带有欺诈行为的)和没有依据标准评分的账户都不应该包含在样本中。这些账户通常是指定的账户,如内部职员账户,VIP账户,国外账户,预先批准的账户,遗失的信用卡账户,已销户的账户,缺失的账户,以及在自愿注销的账户。……

2.样本及行为窗口和“坏”的界定

模型的开发是建立在“过去的行为将影响未来的行为”这一假设前提下。基于这样的假设,为了预测将来账户的行为,起初设立账户的行为被当成分析的工具。为了进行分析,我们需要收集特定时间段内所开立账户的数据信息,然后再另一时间段监控他们的行为,以此来判定他们属于“好”的还是“坏”的账户。所收集的数据信息(变量)按好/坏分类(目标)构成开发过程中的样本量。

“行为窗口”可视为时间窗口,即监测在特定时间段内设立的账户的行为(如样本窗),然后对账户进行分类(目的)。“样本窗口”指的是将选择好/坏的数据进行样本开发的这一段时间。在某些情况下,如欺诈或破产,这种行为分类已被定性为“坏”。……

3.季节性因素

申请与批准比率随着时间的变化而变化,这种季节性因素也应考虑进模型中。这是为了确保开发样本(从样本窗中选取的)没有包含异常时期的数据,故开发样本应与正常的商业周期相一致,表现出典型的正常时期的数量。如此处理的目的是为了确保“过去反映将来”的假设能够成立,以便样本能够代表将来潜在的申请者(如通常意义上的客户)。进行实操后,这样处理也有助于产生精确的通过率/失败率,并且更重要的是,能够在测试期间使得评分模型更加稳定。实际上,为了捕捉大量的行为,这样的测试被大量的进行;因为建立一个标准的正常的模型是非常困难的。……

4.“坏”的定义

这里将账户行为分为3个主要部分:好,坏,中立。破产、索赔或欺诈,属于坏的定义是非常简单明了。尽管如此,关于合同违约性质的行为,有不同层次的解释。正如先前所提到的,关于“坏”的不同定义将产生各不相同的样本量。综合以下所列的因素,一个较为合理的定义将浮现在大家面前。……

5.“坏”的确认

在起初的分析阶段一旦对“坏”有了初始的定义,需对其进一步确认,以确保该定义符合要求。在拥有资源和数据的情况下,确认的方法可以采取专业判断、分析或两者并用。需注意这些方法可以在初始阶段是一个不错的工具,但这并不是精确的确认工具。

(1)一致法

(2)分析法

6.“好”与“中立”的定义

一旦定义了“坏”,同样的分析也可用于定义“好”。而且,这同样必须同信贷机构的目标相一致。“好”账户通常显而易见,不需仔细分析。中立账户常常是那些没有足够的用以归类的行为记录或有难以判断的较低的滚动违约率的账户。……

(注:如若想浏览全文,请联系普惠资信林先生,电话:0769-22653333,邮箱:weichaolin3721@puhuiratings.com。 )

欢迎您发表评论:

产品与服务

评级体系

刊物

关于我们








target="_blank">