书城管理中国金融论丛(2009)
6158700000041

第41章 中小企业信用评价模型研究

庄传礼

中小企业在国民经济中起着越来越重要的作用,但是由于对中小企业的信用评价不当,造成中小企业融资困难,严重地影响着中小企业的发展。本文在合理选择信用评价指标的基础上,建立基于支持向量机算法的中小企业信用评价模型。通过实证数据进行验证,并与BP神经网络进行比较,结果表明,该方法能够较为准确地进行中小企业信用评价,比BP神经网络方法准确。可以为金融机构的中小企业信用管理提供一些实践性和理论性参考。

一、引言

信用是市场经济的重要基础,是企业进入市场的通行证,拥有良好信用的企业在社会交往和商品交换中处于有利地位。信用评价是对各类企业所负各种债务能否如约还本付息的能力和可信任程度的评估。客观权威的信用状况的评价,可以为其申请发债、贷款、发行股票以及商业往来提供资信证明,因此,准确客观的信用风险评价对一个企业的发展至关重要。

改革开放以来,我国中小企业得到迅猛的发展,促进了国民经济的健康、持续、稳定发展,在创造就业机会、推动技术创新、加快市场化进程等方面都发挥着日趋重要的作用。然而,国内外汗牛充栋的关于中小企业信用问题的理论研究几乎步调一致地认为,中小企业普遍由于资本规模小,管理不规范,技术水平低等原因而导致其信用水平低。实际上,信用担保公司已保和在保的中小企业违约现象却很少发生。由于对中小企业的信用评价不当,造成中小企业融资困难,严重地影响着中小企业的发展。

造成中小企业信用评价低的原因,一方面在于目前执行的信用评价指标体系,从评级方法、评价指标的选择以及指标的权重来看,都是基于国有大型企业的特点制定的,没有专为中小企业制定专门的信用评价体系。另一方面大部分中小企业经营历史不长,经营状况变动幅度大、财务数据不完备等,传统的统计分析方法不能进行有效分析等原因。

近几年,随着计算机技术的发展,一些非参数统计方法以及人工智能模型逐渐被引进信用评价模型中,如神经网络、模糊分类、遗传算法等,这些算法在一定程度上克服传统方法综合分析能力差、缺乏整体概括能力的缺点,弥补了评价结果的一些不足。但还存在样本需求量大,人为干预多的缺点。

基于小样本理论的支持向量机(Support Vector Machines 简称SVM)方法基本上不涉及概率测度的定义及大数定律等,因此不同于现有的统计方法,是一种具有严密理论基础的计算机学习的新方法。为解决基于数据的非线性建模问题提供了一个新思路。建立SVM模型所需要的先验干预也较少,它已经成为机器学习、模式识别、计算智能、预测预报等领域的热点技术,受到国内外的广泛关注。

二、支持向量机

支持向量机基于统计学习理论和结构风险最小化原则,其基本思想是把输入空间的样本通过非线性变换映射到高维特征空间,然后在特征空间中求取把样本线性分开的最优分类面。算法使用分类间隔控制线性学习机器的容量,从而使结构风险最小,也使其在有限样本下具有了较强的泛化能力。不同的核函数即变换到不同的特征空间,使用核函数也避免了在高维的特征空间中直接计算。

1.支持向量机的分类算法

支持向量机是从线性可分情况下的最优分类面发展而来的,所谓最优分类面就是要求分类面不但能将两类正确分开,而且使分类间隔最大。

三、中小企业信用评价指标的选取

中小企业是企业群体的组成部分,因而其信用评价体系可以从企业评价体系演绎得到,但与大型企业相比,中小企业自身又具有成长性、创新性等特点,因此,在设计中小企业信用评价体系时,不仅要高度重视资产负债率、流动比率等财务指标,也要充分考虑企业的成长性,创新性适应性等非财务分析指标。研究中还发现,由于中小企业尤其是一些小型企业,法人对企业信用的影响起着重要的作用,因此法人的信用水平也是中小企业的信用评价的一个重要方面,基于以上考虑,本文主要选取以下主要指标。

四、模型设计及结果分析

1.模型设计

信用评价本质上是模式识别中的一类分类问题,将企业划分到二个或者几个类中(如:能够按期还本付息的“好”客户,可能会违约的“坏”客户等)。具体做法主要是根据历史上每个类别的若干样本,从已知的数据中找出各类别的特征,从而总结出分类规则,建立数学模型,用于测量借贷企业的违约风险。

本文结合模式识别的一般方法和SVM的特点,信用评价模型流程设计如图2,首先收集数据并将收集到的数据经过清洗及处理后输入模型中进行学习,达到初始的误差设定标准后,再用测试数据进行测试,满足准确率的要求后,则可以进行应用,否则调整相关参数,再进行学习和测试,直至满足条件。

2.数据处理

本文根据收集到的46家中小企业一次融资过程进行调查分析和财务报表计算得出以上指标的相关数据,为了对基于支持向量机的信用评价方法进行比较分析,我们首先对其进行归一化处理,然后随机选择其中30家数据作为训练样本,其余16家企业的样本数据作为测试集。利用S。Canu、Y。Grandvalet、V。Guigue、A。Rakot等人开发的基于MATLAB的支持向量机工具箱进行验证。

3.测试结果

根据SVM-KM工具箱,我们适当调整参数,设置lambda1e-7C1000kernel'gaussian'运行后分类结果的混淆矩阵(Confusion Matrices)如下:

不仅从混淆矩阵可以进行比较,我们还可以利用ROC曲线可以直观地发现。ROC曲线(Receive Operating Characteristic Curve),是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、特异性为横坐标绘制成曲线,曲线下面积越大,分类准确性越高。两种分类法对应有ROC曲线可以看出,SVM的ROC曲线下方的面积大于BP的ROC曲线下方的面积,说明SVM模型方法优于ANN方法。

五、结论

本文的工作表明,支持向量机作为一种新的机器学习方法,构建中小企业信用评价模型较为准确实用,具有较强的泛化能力,从测试结果来看,其分类的准确性也优于人工神经网络方法,它克服了人工神经网络现有缺陷,如学习过程中收敛速度慢,网络性能差,可能存在局部极小值等问题。该方法有利于机器逐步学习,便于编制智能评价系统。适当选择核函数和设置参数、对中小企业信用评价的影响因素进一步分析和整理,更多地收集中小企业相关的数据进行训练,都将有助于提高其分类精度。如何调整支持向量机分类器的参数,使得在限定一类错误率的前提下使另一类的错误率达到最小也是我们下一步的工作。

原文载于《中国城市经济》2008年第4期