(電子商務(wù)研究中心訊) 業(yè)內(nèi)在講到互聯(lián)網(wǎng)金融,尤其是P2P的時(shí)候,特別喜歡提到大數(shù)據(jù),大數(shù)據(jù)可以幫助投資人降低風(fēng)險(xiǎn),果真如此嗎?來(lái)自P2P Lending Advice的一篇文章認(rèn)為,迷信大數(shù)據(jù)是一個(gè)誤區(qū),因?yàn)镻2P借貸中的很多問(wèn)題大數(shù)據(jù)可能無(wú)法解決。
以下是這篇文章全文,由網(wǎng)貸之家翻譯。
大數(shù)據(jù)并非無(wú)所不能,你需要了解下面四個(gè)關(guān)于P2P借貸中大數(shù)據(jù)的重要因素。
要素1:大數(shù)據(jù)只能代表過(guò)去的表現(xiàn)
任何一個(gè)曾經(jīng)通過(guò)中間商出售過(guò)(或嘗試出售)共有基金,股票,債券或其他投資的人都聽(tīng)到或看到過(guò)這樣一個(gè)主題“過(guò)去的表現(xiàn)不能代表將來(lái)的結(jié)果”,確實(shí)如此。我們從歷史記錄中獲得的借款人的重要信息,比如支付記錄,F(xiàn)ICO信用分和負(fù)面信息,只能代表他們過(guò)去的表現(xiàn)如何。如果他們?cè)?jīng)按時(shí)償還了貸款,并不意味著他們也會(huì)按時(shí)將錢還給我們。但是這增加了償還的可能性,特別是如果沒(méi)有重大變故(如失業(yè)或生了重病等)的情況下。沒(méi)有人知道未來(lái)會(huì)發(fā)生什么,這些信息并不具有預(yù)見(jiàn)性,它們只能反映過(guò)去。
要素2:貸款資金池可利用數(shù)據(jù)少且有時(shí)間局限
拿Lending Club來(lái)說(shuō),從2006年一開(kāi)始到2012年11月,他們發(fā)布的貸款總量第一次達(dá)到10億美元。僅6個(gè)月后,在2013年5月,他們的貸款總量上升到了20億美元。而在2013年11月,在他們首次達(dá)到10億美元貸款總量的一年以后,他們發(fā)布的貸款總量又攀升至30億美元。(相關(guān)文章)這意味著,在不到一年的時(shí)間里,他們完成了現(xiàn)在貸款總量的2/3。有些人會(huì)說(shuō),從這些歷史記錄中,我們并不能獲取有意義的信息,但更多人會(huì)認(rèn)為我們獲取到的最有意義的信息是早期支付違約的可能性。貸款資金池的長(zhǎng)期數(shù)據(jù)中我們真正能用得著的很少。
我們的貸款投資組合最大的敵人是早期支付違約(在支付期前6個(gè)月內(nèi)出現(xiàn)的違約)。我們現(xiàn)在有價(jià)值20億美元的貸款在至少6個(gè)月后才能看出誰(shuí)支付晚了,誰(shuí)早期支付違約了。另外,由于被發(fā)布的貸款時(shí)間限制,很難從中獲取所謂的有意義的數(shù)據(jù)。
要素3:大數(shù)據(jù)各個(gè)孤立的因素是相互支撐的
數(shù)據(jù)的應(yīng)用性很大,以至于你可以搜索星期四一天,加拿大地區(qū),借款人的信用分有750,用于債務(wù)合并的貸款。大數(shù)據(jù)的一個(gè)所謂的好處是你可以利用它研究任何有意義或可能有意義的變量。這些變量中,我們?cè)谶@里討論的包括FICO信用分,負(fù)面評(píng)價(jià),公開(kāi)呈報(bào),所在的州,擁有的住房,工作的時(shí)間等等。這些信息是好還是壞呢?好處顯而易見(jiàn),我們可以研究那些我們覺(jué)得重要并且能夠降低我們風(fēng)險(xiǎn)的因素。
存在的問(wèn)題
大數(shù)據(jù)處理的問(wèn)題是這些變量都是分開(kāi)的,如果把這些變量放在一起,我們能獲得很多有意的信息,一旦分開(kāi),這些變量就貶值了。
比如說(shuō),信用分依賴于我們之前討論過(guò)的許多因素,包括償還記錄,負(fù)面評(píng)價(jià),公開(kāi)呈報(bào),資信調(diào)查,有效的信貸循環(huán)以及債務(wù)與收入比。當(dāng)我們篩選信用分時(shí),我們已經(jīng)綜合考慮了這些因素,如果進(jìn)一步考慮孤立的變量,實(shí)際上是多余的,甚至有害于篩選條件的質(zhì)量。因此,如果我們選擇的條件包括信用分較高且沒(méi)有負(fù)面評(píng)價(jià)兩項(xiàng),盡管我們已經(jīng)知道沒(méi)有負(fù)面評(píng)價(jià)會(huì)提升信用分,但我們依然重復(fù)計(jì)算這些因素而不是考慮其他信貸因素,這其實(shí)是多余的。
要素4:相互關(guān)系并非因果關(guān)系
科學(xué)家和研究員對(duì)這個(gè)短語(yǔ)比較精通。意思是,如果2件事物是有關(guān)聯(lián)的,這并不意味著他們之間一件事情發(fā)生就會(huì)導(dǎo)致另一件事情也同時(shí)發(fā)生。這里討論的一個(gè)很好地例子是,我關(guān)于以州來(lái)篩選貸款的帖子。我們之前討論了加拿大地區(qū)違約率最高,同時(shí)它還擁有迄今為止最高的貸款成交量。如果你僅憑違約率最高,就將它從你的投資策略中篩除,那么就意味著加拿大地區(qū)所有好的貸款都被你拒絕了。這就好比倒洗澡水把嬰兒也倒掉了。
信用分也是一個(gè)很好的例子。我們會(huì)很自然地認(rèn)為公開(kāi)呈報(bào)會(huì)減少借款人的信用分,也確實(shí)如此。然而,影響的大小取決于何時(shí)何事。5年前的個(gè)人評(píng)估不能作為對(duì)借款人6個(gè)月前情況的判斷依據(jù)。6個(gè)月內(nèi)的公開(kāi)呈報(bào)對(duì)借款人信用分的影響比較明顯,其他方面的對(duì)借款人信用分和我們對(duì)其支付能力的看法影響較小。
總結(jié)
你不僅不需要一名優(yōu)秀操盤手的數(shù)據(jù)資料,并且如果你沒(méi)有那更好。因?yàn)楫?dāng)我們面對(duì)所有可用的大數(shù)據(jù)時(shí),我們很容易陷入一些我們都可能陷入的誤區(qū)。如果我們能銘記以上所有要素,當(dāng)我們分析數(shù)據(jù)時(shí),我們將會(huì)比P2P借貸領(lǐng)域里的其他投資者更勝一籌,同時(shí)能更清楚地意識(shí)到我們貸款組合中存在的風(fēng)險(xiǎn)。(來(lái)源:搜狐IT 文/張睿 編選:網(wǎng)經(jīng)社)