金融視線 |
Financial View
基于BP神經(jīng)網(wǎng)絡(luò)的P2P網(wǎng)貸信用風(fēng)險(xiǎn)甄別研究
——以拍拍貸為實(shí)例
張?chǎng)?曹帥
上海師范大學(xué) 上海 200234
摘要
:本文基于“拍拍貸”網(wǎng)貸平臺(tái)公布的貸款人違約數(shù)據(jù),運(yùn)用了BP神經(jīng)網(wǎng)絡(luò)模型來預(yù)測(cè)P2P網(wǎng)貸平臺(tái)貸款
人違約率。其模型預(yù)測(cè)精度達(dá)到了99.8%。并且模型得出影響P2P平臺(tái)借款人是否違約的前十大指標(biāo),按照其重要
程度分別為:當(dāng)前到期期數(shù)、上次還款本金、當(dāng)前還款期數(shù)、標(biāo)當(dāng)前逾期天數(shù)、待還本金、我的投資金額、總待
還本金、歷史成功借款次數(shù)、已還利息。同時(shí),通過建立BP神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)貸平臺(tái)可以實(shí)現(xiàn)對(duì)貸款人信用的評(píng)級(jí)
和違約預(yù)測(cè)。
關(guān)鍵詞
:P2P網(wǎng)貸平臺(tái);BP神經(jīng)網(wǎng)絡(luò);違約預(yù)測(cè)
中圖分類號(hào)文獻(xiàn)識(shí)別碼文章編號(hào)
:F832.4;F724.6 :A :1673-5889(2020)11-0105-02
一、研究目的及意義
P2P貸款違約風(fēng)險(xiǎn)預(yù)警已成為一個(gè)需要解決的關(guān)鍵問題。很
多學(xué)者運(yùn)用了Logistic回歸和其他方法預(yù)測(cè)貸款人是否違約,但是
Logistic要求解釋變量應(yīng)是數(shù)值型變量,并且其仍屬于線性模型,所
以只能解決一些違約貸款的非線性問題。所以,本文利用機(jī)器學(xué)習(xí)
算法——BP神經(jīng)網(wǎng)絡(luò)很好地解決了缺失值的問題,并且對(duì)非線性問
題的預(yù)測(cè)更為準(zhǔn)確,在預(yù)測(cè)P2P網(wǎng)貸違約率方面,能有效補(bǔ)充現(xiàn)有的神經(jīng)網(wǎng)絡(luò)由三個(gè)要素組成,分別是輸入層、輸出層和隱藏層,處
風(fēng)險(xiǎn)預(yù)警模型。理信息先進(jìn)行向前傳播,后進(jìn)行向后傳播。首先輸入信息從輸入層經(jīng)
AAA到E信用評(píng)級(jí)。借款類型分為應(yīng)收安全標(biāo),電商,App閃電,普通
和其他,分別用數(shù)字1到4代替。認(rèn)證成功和失敗分別是1和0,學(xué)歷認(rèn)
證成功則表示有大專及以上學(xué)歷,征信認(rèn)證成功則表示有人行征信報(bào)
告,淘寶認(rèn)證成功則表示為淘寶店主。在2015、2016、2017期間分別
用1、2、3表示。
(三)BP神經(jīng)網(wǎng)絡(luò)算法
過隱單元層處理后傳遞給輸出層,每一層神經(jīng)元的狀態(tài)只影響下一
層的神經(jīng)元狀態(tài)。在輸出層如果得不到符合標(biāo)準(zhǔn)的輸出,則將反向傳
播,將誤差信號(hào)通過原來的路徑傳回。在返回的過程中,逐步的修改
連接著各層神經(jīng)元的權(quán)值,這種算法叫做“誤差反向傳播算法”,即
BP算法。上述過程不斷重復(fù),直至誤差達(dá)標(biāo)。
二、BP神經(jīng)網(wǎng)絡(luò)的理論模型
(一)數(shù)據(jù)選取與處理
1.數(shù)據(jù)選取。本文基于“拍拍貸”的實(shí)際交易數(shù)據(jù)。在借款成
功的數(shù)據(jù)中,總標(biāo)的數(shù)量共有270287條,其中違約標(biāo)的占8653條,不
違約標(biāo)的為262634條,違約率為3.2%。考慮到本文違約與未違約標(biāo)
的為不平衡數(shù)據(jù),所以采用欠采樣來平衡數(shù)據(jù)集。具體操作為:從全
部樣本中提取8653條全部違約標(biāo)的,隨機(jī)抽取未違約標(biāo)的8653條,樣
本數(shù)據(jù)共計(jì)17306條。
2.數(shù)據(jù)處理。首先,對(duì)連續(xù)變量進(jìn)行歸一化處理,確保指標(biāo)的
統(tǒng)一性和可分析性。其次,本文通過隨機(jī)抽樣方法,確保樣本隨機(jī)
性。訓(xùn)練集和測(cè)試集的劃分比例分別為70%、30%。最后,隨機(jī)對(duì)
樣本進(jìn)行分類和預(yù)測(cè),實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型對(duì)P2P網(wǎng)絡(luò)借貸違約風(fēng)
險(xiǎn)的預(yù)警。
此數(shù)據(jù)處理可以利用SPSS進(jìn)行實(shí)現(xiàn)。
三、BP神經(jīng)網(wǎng)絡(luò)的模型建立與實(shí)證分析
(一)實(shí)證分析
表1 案例處理匯總
Case Processing Summary
Percent
SampleTraining1214970.2%
Holdout515729.8%
Valid17306100.0%
Excluded0
Total17306
樣本有5157,沒有無效樣本。
BP神經(jīng)網(wǎng)絡(luò)模型建立的參數(shù)如下:
(二)指標(biāo)體系的構(gòu)建
本文通過拍拍貸披露的指標(biāo)為基礎(chǔ),運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型,得到
變量的重要程度,由此來確定影響P2P網(wǎng)貸的指標(biāo)。
并且本文采用拍拍貸個(gè)人信用評(píng)價(jià)的借款金額、借款期限、
借款成功日期、初始評(píng)級(jí)、借款類型等共32個(gè)指標(biāo)賦值為1和0,1表
示當(dāng)前未違約,0表示當(dāng)前違約。初始評(píng)級(jí)分為8類,從1到8分別代表
據(jù)案例處理匯總,分配給訓(xùn)練集的樣本有12149,分配給測(cè)試集的
1.輸入層和輸出層神經(jīng)元個(gè)數(shù)。BP網(wǎng)絡(luò)輸入層的神經(jīng)元個(gè)數(shù)為
66個(gè),對(duì)應(yīng)66個(gè)個(gè)人財(cái)務(wù)指標(biāo);輸出層有兩個(gè)神經(jīng)元,其中0表示貸款
違約,1表示貸款不違約。
MODER BUSIESS
現(xiàn)代商業(yè)
105
本文發(fā)布于:2023-05-23 17:48:53,感謝您對(duì)本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/falv/fa/78/101380.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請(qǐng)勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
| 留言與評(píng)論(共有 0 條評(píng)論) |