機器學習大展身手,讓風控也變得智慧

語言: CN / TW / HK

一直以來,入門機器學習最常問的問題有兩個,第一個問題自然是機器學習究竟是什麼;第二個問題也不難猜,就是機器學習究竟能幹什麼。我們學一門技術,當然想知道它的用處,不過,這個問題不好回答。我總是分享一個觀點,說機器學習,或者再廣一點,說現在作為新基建之一的人工智慧,與其說是一種新的技術,不如說是一種新的能源,能夠給許許多多不同的行業帶來新的動能。有一種觀點認為,人工智慧是一種“低智慧”,所以知識水平要求低的行業容易被人工智慧替代。我是不認可這種觀點的,舉一個金融領域的例子,今天我們就來講講 機器學習在金融領域的應用

金融很重要,有人說金融是經濟發展的潤滑劑,其中有一項很重要的功能,就是 信用貸款 ,銀行方面習慣叫信貸業務。信貸業務涉及很多個環節,其中一個必不可少的環節叫 風險控制 (Risk Control),簡稱“ 風控 ”。機器學習正是在風控環節大顯身手,大家給二者的結合起了個非常有科技感的名字,叫智慧風控。這就是本篇的主角。

前面吟唱了一串名詞,大家也許也都聽過,不過應該也僅限於聽過。機器學習和任何一門新的技術一樣,它所能創造的價值取決於它要解決的問題。所以,要介紹清楚什麼是智慧風控,我們首先簡單串一下信貸業務的背景知識。

貸款我們都不陌生,簡單來說就是借錢。但借錢不簡單,誰都不願意人財兩失,所以怎麼借是很講究的。總得來說有兩種借法,一種叫 抵押貸款 ,就是你問我借錢,可是我怕你不還錢怎辦?抵押貸款的辦法很簡單,先抵押,你得先拿個什麼值錢的東西押我這,我才把錢給你,等你還了錢,我再把東西還你。你要是欠錢不還,用行話講就是“逾期”,那不好意思,我就把你抵押的東西賣了填補。

抵押貸款的原理直白好懂,歷史也悠久,電視劇上的當鋪說好聽點就是抵押貸款,不過限制也很明顯,所以後來又出現了一種新的借法, 信用貸款 。有些人說信用貸款是“無中生有”,這種解釋容易誤導,其實信用貸款也是要抵押,不過抵押的是“信用”。解釋起來有點複雜,不過過程挺簡單,大體類似於跑到銀行櫃檯大力一拍,喝一聲“你看我這張臉值幾個錢”。“信用”這個詞有點抽象,對我們來說,改用“名聲”“面子”“口碑”之類更煙火氣的詞,可能更好理解,日常生活中和朋友同事開口借錢,就是一種最簡單的信用貸款。

貸款背後牽涉的金融知識還有很多,甚至還有一些比較複雜的體系,感興趣的可以另找專著深入瞭解。不過讀完上面這些內容,我們就可以往下介紹了。上面介紹了信用貸款,把信用作為貸款的抵押物,這就帶來信貸的第一個問題: 如何度量信用

我們說,熟人之間相互借錢就是一種最簡單的信用貸款,但就在這個最簡單的過程中,其實也包含了信用度量。我之所以借錢給你,是因為我信任你,而我之所以信任你,是因為我瞭解你。熟人網路相當依賴於瞭解來運轉,不妨回想一下,平時是不是更願意給自己瞭解的人借錢,而不太願意給自己不瞭解的人借錢。

但對於銀行來說,這就帶來了一個幾乎不可能解決的問題。貸款簡單來說就是借錢,對於銀行負責放貸業務的人員來說,同樣也面臨著借不借和借多少的問題。熟人之間我們能夠憑藉瞭解來回答這個問題,但放貸人員和客戶之間不可能談得上了解,這次貸款很可能是二者之間這輩子第一次也是最後一次接觸。但在信貸業務中,信用度量是個不可能繞過的核心環節,那銀行是怎麼解決這個問題的呢?

首先介紹一個專業名詞,叫“ 不良率 ”,計算方法是當月不良資產數 / 總資產數。什麼意思呢?我們借錢會擔心不還錢,銀行也一樣擔心不還錢,唯一一點不同的是,銀行知道這些借錢的裡面肯定會有不還錢的,那怎麼衡量最近信貸業務做的是好是壞呢?就是通過計算不良率,不良率越低越好。關心巨集觀經濟的朋友一定知道,就在剛剛過去的兩會,政府工作報告明確提出國有大型商業銀行對小微企業的貸款要增長 30% 。都知道疫情對經濟影響很大,小微企業更是很容易發生資金鍊斷裂,今年的政府工作報告反映出國家的關心,也從側面反映出銀行的擔心。即使在平時,小微企業相比大型企業更容易違約,在今年更為特殊的經濟環境下給小微企業增加放貸,銀行可能需要承受更多不良率上升帶來的壓力。

小微貸不良率偏高一直是銀行信貸業務的痛點問題之一,那有沒有辦法降低不良率呢?有,引入智慧風控就是其中一種相當有效的辦法。 《銀行的數字化轉型》 中提到, 2018年採用智慧風控技術的網商銀行披露的小微貸不良率僅為 1.45% ,遠低於全國小微貸不良率 5.9% 的平均水平。應該說,這是運用新的技術解決傳統痛點問題的典型案例,機器學習在金融領域打了下漂亮的一仗。

智慧風控、不良率和前面說到的信用度量,三者又是怎樣一種關係呢?大家可能猜到了,原理非常簡單,只要儘可能避免把貸款放給信用低的客戶,自然就能壓低不良率,那麼核心問題就回到我們上面所說,怎麼度量客戶的信用。這就涉及到銀行的一項重要工作,叫風險控制,簡稱風控。

風控不算新鮮事,歷史估計能和銀行一樣長。我們說銀行也怕不還錢,這是大白話,銀行給不還錢起了個體面的名字,叫“風險”,有風險肯定就要壓低風險,這就是風控。信貸領域的風險主要有兩類,一類叫 信用風險 ,另一類叫 欺詐風險 。這兩類風險的最終結果都是不還錢,那有什麼區別呢?有區別。第一類是本來想還錢,後來因為各種原因,譬如說失業或者破產,一下沒了收入來源,想還錢也沒有辦法,也就是還貸能力和還貸意願發生了變化,這叫信用風險。第二類是本來就不想還錢,貸款一到手就帶著小姨子跑路了,也就是貸款目的不正當,這種叫欺詐風險。

知道了有這兩大類信貸風險,那具體怎麼知道風險有多高呢?這就需要介紹風控領域的一個重要工具, 評分卡 。評分卡起源於20世紀,最開始時專家根據經驗設計,後來逐漸發展完善,現在已經成為一種重要的風險量化工具。評分卡的作用顧名思義,就是評分。沒錯,現在不單學校看重分數,銀行也看重分數。前面我們說,放貸人員不瞭解甚至不認識客戶,那怎麼判斷給不給貸款呢?大原則是信用好的給貸款,信用不好的不給貸款,具體到操作就是看評分卡的得分。

評分卡的使用過程說起來有點複雜,涉及不少專業名詞,好在現在是“寶唄時代”,埋單都愛刷花唄,用來理解評分卡的使用就很方便了。雖然馬爸爸希望我們都去用花唄,但花唄當然也不是想刷多少就能刷多少,有個額度上限,規定你最多就只能刷這麼多錢。不過,這個額度上限是會不斷變化的,可能變高也可能變低,也就是你能從花唄借的錢在不斷調整,那麼,是什麼決定你的額度上限呢,是 芝麻信用 。芝麻信用和上面說的評分卡得分是一回事,就是一個簡單的數字,但這個數字又並不簡單,銀行批不批准你的貸款,看的就是這個數字。

在學校,你是吃板子還是吃板栗,看的是考試分數,而你考試該得多少分,看的是考卷內容。銀行業一樣,放貸人員批不批准貸款,看的是評分卡的得分,但這個得分只是一個結果,你究竟該得多少分,關鍵在於評分卡。也就是說, 如何正確設計一款評分卡,達到客觀地反映風險的目的,是風控是否能取得成功的關鍵。

接下來終於可以介紹智慧風控了。前面我們說,評分卡最早是專家根據自己的經驗設計,這樣出來的評分卡當然帶有很強的主觀性,後來引入統計模型,比之前的純主觀自然有了明顯進步。不過,和統計在其它領域的應用一樣,純人工進行的統計分析只能處理相當有限的資料,這也就變成了統計模型的一個隱性天花板。解決的辦法很簡單,就是引入能夠自動處理資料,適合於海量資料背景的新技術,這就是 機器學習

使用機器學習技術,來分析資料生成評分卡,然後提供給風控環節進行評分,這就是智慧風控。

智慧風控說簡單也簡單,它並沒有顛覆現有成熟的信貸風控框架,而是引入了新的技術,機器學習技術提升了風控的效果,核心就一點,用機器學習來生成評分卡。不過,簡單的原理要真正落地,都必然是要處理現實世界的大量細節問題。首先就是評分卡。

評分卡並不只是簡簡單單的一張表,從適用客群的角度來定義,分為通用 分卡、定製評分卡和子評分卡,而按用途來定義,又可分為申請評分卡、行為評分卡、催收評分卡、流式預警評分模型、營銷評分模型和欺詐評分模型。 這還只是最最主流的評分卡,不同的評分,生成的過程自然也並不相同。

接下來就是 處理資料 。資料決定了機器學習模型的效果上限,智慧風控也不例外,但要在風控領域處理資料,自然首先需要對相關領域的知識和工作流程進行深入瞭解。這涉及到許多的專業背景知識,不但要佔用很長的篇幅介紹,還要求作者同時熟悉信貸風控和智慧演算法,有興趣深入瞭解的朋友,這裡我推薦兩本書, 《智慧風控:原理、演算法與工程實踐》《智慧風控:Python金融風險管理和評分卡建模》 ,都是由資深風控技術專家、 AI 技術專家梅子行老師撰寫,第一本書偏重基礎,適合入門,第二本書偏重評分卡建模的各個細節,是第一本的進階,兩本書都有一個特點,就是內容專業詳實而又不失風趣,而且還請了插畫設計師毛鑫宇老師配上許多幅專業賣萌兼作解說的插畫,讀起來十分酣暢,特別適合入門瞭解智慧風控。

關於作者

莫凡,網名木羊同學。娛樂向機器學習解說選手,《機器學習演算法的數學解析與Python實現》作者,前沿技術發展觀潮者,擅長高冷技術的“白菜化”解說,微信公眾號“睡前機器學習”,個人知乎號“木羊”。

推薦閱讀

點選連結瞭解詳情併購買

點選 閱讀全文 瞭解更多金融科技好書