精品国产av一区二区三区,国产av一区二区三区,丰满少妇大乳高潮在线,9lporm自拍视频区九色

當前位置:首頁 > 最新資訊 > 行業資訊

風控場景全流程模型構建及應用實踐

風控場景全流程模型構建及應用實踐

線上小額信貸常見的風控場景從階段上可以劃分為貸前、貸中和貸后。實際風控實踐中可能還會有流量獲客等場景,本次分享未展開。

貸前風控是比較重要的一環,關注點包括:身份核驗、反欺詐風險評估、信用風險評估、額度和費率的匹配。

貸中管理是指在用戶放款之后,對借款人的信用風險進行跟蹤和管理的過程。具體場景包括復貸準入和存量用戶運營。復貸準入是指用戶已經有借款記錄后再次支用的場景。存量用戶運營是指對已經放款的借款人所做的維護或管理等一系列運營活動,比如對用戶風險的再次評估、信息更新,以及新產品的推廣促活等。

貸后管理是指在用戶貸款到期之后的管理,常見的場景包括還款管理、客訴風險管理、失聯預測。該環節偏向于線下的運營,模型或規則策略更多的是給運營同學提供一些輔助工具,不像貸前或貸中可以直接拿模型或規則來決策。

接下來具體介紹各階段場景下風控模型的搭建。

一、貸前風控

1、貸前風控的一般流程

風控場景全流程模型構建及應用實踐

在線上小額信貸的場景下,一個用戶從進件到最終放款,一般會經歷這樣一些環節:

◆準入策略:用戶在進件之后可能會對其做一些準入策略,比如年齡或身份核驗、反欺詐規則(如黑名單或逾期)。

◆模型前規則:過了準入策略后,用戶會走到模型前的一些規則,這里一般會是一些無成本或低成本的規則。

◆授信模型:接著就會進到授信模型階段,這里授信模型可能包含一組模型。

◆模型后規則:授信模型通過之后的用戶可能會進到模型后規則,這些規則可能是相對較貴的規則,如征信數據。

最后給出用戶評級,如果這里是多模型決策,用戶評級可以通過決策矩陣給出。

這樣設計主要還是基于平衡成本的考慮,配置時大多會是內部數據在前,外部數據在后,形成一個成本漏斗,即已經被前面的規則或模型拒掉的一些用戶,就不會再走后面相對比較貴的規則了。

我們是怎樣部署這樣一套風控策略的?下圖給出了系統交互的過程:

風控場景全流程模型構建及應用實踐

數據接入模塊,包括外部和內部數據的接入和存儲。

◆內部數據一般會直接調用業務系統的數據接口去獲取。這里會有一個成本和穩定性的折中:比如在調用復雜數據時,數據本身可能存在一些耗資源的長尾現象,但這種特征在實際決策中又會用到的話,我們就會在一定的可接受范圍內去做一些操作以平衡成本和穩定性,例如99. 99%的用戶都正常返回,對于另外的極少部分用戶可能做一個置空操作;

◆外部數據會調用三方的服務。這時會遇到的問題是接入三方數據的返回時長是否在業務可接受范圍,大部分三方數據返回都是比較快的,但也有一些數據返回慢一些,在這種情況下我們會在可接受程度內作處理,比說只有0.01%的返回時長很長,那這部分用戶可能就直接做一些額外處理,比如置空等操作。如果業務上對這種缺失的容忍度極低的話,一種可能方案提前去調這個外部數據,這時就會涉及成本的平衡。

特征引擎從數據接入模塊獲取原始數據,特征引擎在貸前環節主要是用于實時特征計算(有些情況下也會有離線計算,比如貸超場景中應用的特征,我們業務中以實時特征為主主要是基于特征覆蓋度的考慮)。特征引擎計算實時特征后,會對模型引擎輸出模型特征,對決策引擎輸出規則特征。

模型引擎主要是用來計算模型分,包括空跑模型和決策模型。二者的部署有一些差異,空跑模型可以部署為異步調用,決策模型因為涉及到成本漏斗(前文已提及),需要同步調用。模型分最終會輸出到決策引擎。

決策引擎里可以配置決策流和規則集。規則集中可以包括單特征規則和模型應用規則,在決策流里可以部署多個規則集。

流程圖中的幾個環節在業務系統中的部署方式:

◆準入策略:一部分是配置在決策引擎里的,還有一部分是在產品環節的,比如像 OCR 這些是耦合在產品流程里的。

◆模型前規則、模型后規則以及決策矩陣:是在決策引擎里部署的。

◆授信模型:在模型引擎里部署,然后把其中的決策模型分給到決策引擎

2、貸前常用的風控數據

貸前常用的風控數據包括內部和外部數據兩類,不同機構用的外部數據可能會各有側重,內部數據這幾類大家通常都會用到:用戶基本信息、ID map數據、用戶行為數據、歷史借款數據、還有一些用戶授權的其他數據。所有內部數據都是經過用戶授權或用戶自填的。其中,其他授權數據包括設備指紋信息、聯系人信息、 GPS位置信息等。聯系人是用戶自填的緊急聯系人,并非通訊錄聯系人。

風控場景全流程模型構建及應用實踐

3、貸前風控常用數據的流轉過程

在貸前怎么應用這些數據?下面是一個簡單的流轉過程,主要涉及模型引擎部分(其實在模型引擎給到決策引擎時也有一些數據流轉,圖中暫未涉及)。首先是在線數據的流轉過程,數據經過線上的特征工廠或特征引擎實時計算,輸出特征給模型引擎用于計算模型分。這份數據也會定期導到線下一份用于離線特征回溯,構建離線的模型,訓練完成之后會定期更新線上模型;離線數據在特征一致性監控中也會使用。

風控場景全流程模型構建及應用實踐

4、貸前授信模型實時決策流程

風控場景全流程模型構建及應用實踐

數據獲取

首先是內部和外部數據的獲取。

內部數據數據獲取是由數據接入模塊來做的,它會調用業務系統提供的各種接口,拿到數據用于實時特征計算并將原始數據存儲下來用于后續離線特征使用。

外部數據也是數據接入模塊獲取的,只是調用的是外部服務接口,這里比較關鍵的是原始數據需要完整落表存儲,并且針對哪些情況下使用緩存、哪些情況下需要重新查詢數據需要有明確的規范。

特征計算

我們在貸前主要是用的實時特征,也就是說實時從接口獲取數據,然后計算特征,特征落庫并提供給模型引擎使用。這里遇到的主要問題是特征耗時,我們采取的優化手段主要特征預計算或者融合計算。

預計算,主要是說提前計算,在業務系統里,有些數據是可以提前獲取到的。比如說用戶一進到授信的頁面可能就已經授權獲取了設備指紋數據,但是實際到授信模型才用到這個數據,中間可能有幾秒的時間我們可以做特征預計算

融合計算,主要是針對比如“歷史所有XX次數”這種特征,數據量可能比較大、在計算耗時比較長的情況下,我們可以先算出來截止昨天24點的特征,然后實際授信中就只需要計算今天截止當前的新數據對應特征,然后融合之后作為最終的特征來使用,不過這種方式實現起來比較復雜。

模型服務

基于特征輸出模型分或評級。跟特征計算相比,這里的耗時其實還好。目前我們系統里決策模型是同步的,陪跑是異步的,這個其實主要也是出于成本的考慮。

以上是貸前授信實時決策的流程,我們現在用的主要是實時特征,但其實在一些場景上也有離線批量衍生特征的情況,即特征離線批量算,但線上實時去取之前離算離線的結果。但這種場景在純新用戶上會完全是空的,所以我們目前應用范圍不多,主要還是實時特征以及數據覆蓋度上的一些考慮;還有一個就是離線回溯系統的部署,我們在離線建模時是需要去離線跑這些特征用于離線建模的,內部特征的回溯也是有穩定性和成本的平衡,比較理想的肯定是搭建一整套的離線回溯系統,業務系統數據定期備份到這里用。但因為考慮到部署成本,實際在離線回溯時,一些數據還是直接去調業務接口,但會進行一些限速,并且做比較嚴格的監控,這塊各家的部署應該會有各家的特點。

5、貸前優化的一些嘗試

風控場景全流程模型構建及應用實踐

針對貸前模型我們做了一些優化嘗試,第一個優化對系統的改動較大,后面兩個優化主要是業務層面做的一些嘗試,系統上的改動并不算大。

優化1:從單模型決策到區分數據源類型組合決策

最初我們是單模型決策的,可用的外部數據較少,后來隨著可用數據的增多,也有一些成本方面的考慮,逐漸區分數據源,搭建一些子模型組合決策。之后在數據合規的背景下,把內部數據源和外部數據源做了拆分,以便更好地去適配內部決策流和依賴外部數據決策流的情況。

為了實現從單模型決策到區分內外部數據源來搭建風控模型,系統上做了許多優化,這里僅列出了主要的幾項,包括決策引擎和模型引擎的改動。

優化2:數據成本優化

數據成本優化主要有兩個方向:一是從業務上拆分子分模型,二是單獨搭建通過率模型。通過率模型是采用內部數據,以通過率為目標搭建的模型,用在授信模型前面,通過率模型拒絕的用戶不再走后面的授信模型。

優化3:通過率優化

主要包括兩個方面的嘗試:一是部署前篩規則或模型。主要從業務角度出發去做的一些嘗試,技術上會需要一些適配。前篩模型是部署在資產方的,我們自己系統的改動并不大,主要集中在回傳數據的一些規范、存儲和監控上有別于我們自己內部的模型打出來的分數的;二是對授信階段拒絕的樣本嘗試做一些召回。召回模型的關鍵點還是在建模時的數據特征、以及樣本的差異,可能會加一些拒絕推斷的樣本,但是加拒絕樣本也是有一定風險的。風控系統上需要做一些適配,但是改動不算太大。

二、貸中管理

區別于貸前,貸中對應的場景是在用戶放款之后,在這個階段用戶的情況、風險情況和貸前相比可能是已經有了一些變化,所以需要持續地觀測、動態評估這個變化,再配合貸中可用的一些工具,對用戶進行一些提額、降額、凍結額度這些操作,以及匹配一些運營的動作,以促進回款,達成業務目標。

1、貸中系統模塊交互--與貸前差異

在可用工具和系統部署上,貸中和貸前的差別比較明顯。下圖是一個貸中系統模塊的交互,可以看出從數據接入到特征到模型引擎都會有一些差異:

數據方面:主要還是會涉及到一些離線批量打分存儲的場景,首先它會增加一個貸中任務調度的模塊,定時批量的去對目標客戶調數據服務,去取貸中數據,調用特征引擎計算特征,調用模型引擎去打分。再就是數據接入需要跟貸前相分離的,包括存儲分離和調用分離。

特征方面:這是變化最大的部分。貸前我們將實時特征給到模型,再給到決策引擎。在貸中是先把這些特征預計算并存儲,使用時直接查詢。會有很多情況導致數據存儲不完整,所以會涉及容錯的問題,一般會取逆序后最新的一條,并加上特征實際計算時間和查詢時間差的監控。

模型方面:包括實時模型分和離線模型分兩部分。貸中也會有一些實時的模型打分給到決策引擎。離線部分會把模型分批量計算后存儲下來,用于決策引擎查詢。

風控場景全流程模型構建及應用實踐

2、貸中管理常用數據

貸中比貸前的可用數據豐富很多,首先貸前內部數據是全部可用的,還增加了一些貸前變化類的數據,以及用戶的貸中行為數據。此外在外部數據上有一些差異,會有專門適配貸中批量查詢的數據源產品。相對地,貸前可以用的產品如果打算在貸中批量地去用,需要考慮產品的收費模式,以及批量查詢的數據成本是否可以承擔。

風控場景全流程模型構建及應用實踐

3、貸中離線模型決策流程

貸中離線模型的決策過程主要還是適配離線批量計算的場景。直觀看是增加了幾個存儲的環節,數據調用、特征計算、模型打分都是計算后先存儲后查詢,以及容錯和監控。

風控場景全流程模型構建及應用實踐

4、貸中模型應用場景

貸中管理應該是一整套的體系,包括策略、模型、運營各個方面,涉及的內容會很多,我們的介紹主要集中在模型工具方面。具體包括在復貸、存量用戶運營場景上都會有一些貸中模型可以使用。下圖右側列出了一些可以使用的模型工具。

風控場景全流程模型構建及應用實踐

復貸準入環節我們可以使用跟貸前類似的實時風險模型,也可以使用貸中用戶行為模型,通常是這兩種模型結合起來用。

存量用戶運營環節使用更多的是離線批量模型,主要包括下面幾類:

貸中行為模型:就是我們通常說的b卡。

提前結清模型:這個模型主要是在貸中盡量去識別用戶的提前結清行為,然后做一些針對性的運營操作,盡量提高用戶的留存,增加收入。

借貸意愿評估模型:主要針對授信通過甚至有過支用的用戶,然后評估其接下來一段時間的借貸意愿。

三、貸后管理

貨后管理的主要目標是提高回款率,降低違約。但這塊介紹會比較簡單,因為和貸前、貸中不一樣,貸后的場景主要還是以運營為主,模型或規則更多的是作為工具提供一些輔助作用。決策引擎輸出的分數或評級,我們會在貸后系統里做展示,但是實際的決策更多地還是由負責貸后的同學來完成的。所以在系統部署方面更復雜的是貸后業務系統的開發或部署。在決策引擎和貸后系統的交互主要是會提供一些分數和評級在系統里做展示,常用的模型工具有回款客訴、失聯等模型。

風控場景全流程模型構建及應用實踐

1、貸后管理常用數據

貸后數據包括外部數據和內部數據,需要注意的點是數據的獲取時間和應用時間是需要匹配的。貸后可用的數據會更豐富一些,跟貸前和貸中相比,貸后模型比較容易做出區分度,但是模型的應用是個挑戰。

風控場景全流程模型構建及應用實踐

2、貸后模型應用場景

風控場景全流程模型構建及應用實踐

貸后模型應用的場景主要是違約、客訴,及失聯。比較典型的應用有回款率預測和客訴風險預測模型:

回款率預測模型

預測已經逾期的用戶在未來一段時間內回款的概率。Y會根據貸后不同階段有所不同,早期回款的可能性會比較大,越到后期回款越難。在做這個模型時可能會有不同顆粒度的樣本,比如用戶維度、訂單維度或賬單維度。

針對賬單或訂單維度的模型,模型評估時需要先剔除掉在訓練樣本中已經出現的用戶,否則看到的可能是虛假的效果。在應用方式上,貸后的不同階段會有差異化的運營策略,以及不同的實驗方案設計。

客訴風險預測模型

主要用于在貸后階段去預測用戶可能發生投訴的風險,以方便貸后的同事采取一些差異化的應對方式。引發客訴的原因是多種多樣的,考慮到樣本量,我們僅選主要因素來建模。Y的選取時需要做一些數據清洗的工作;在數據方面,部分數據源其實還是和風險是有相關性的,比如多頭數目更大,首次借款時間更早的用戶,發生客訴的概率可能也會更大;

模型應用上,還是會區分貸前和貸后,在貸前使用時就需要額外關注跟風險模型的相關性,如果兩種模型相關性很高的話,這個客訴模型應用起來難度會比較大,需要平衡通過率,在模型應用上需要有一些設計。

四、監控搭建

監控方向上主要看準確性、穩定性和有效性,監控形式上會有日常監控和監控預警。這塊的內容主要是技術上的搭建,不同的公司會差距會比較大,因為大家會基于自己的業務系統或大數據環境來設計,技術選型上可能差異比較大,但是報表的內容還是比較通用的。下面列舉了幾個不同維度的監控內容:

業務監控

風控場景全流程模型構建及應用實踐

模型監控

風控場景全流程模型構建及應用實踐

特征與數據監控

風控場景全流程模型構建及應用實踐

下圖是各場景下監控的匯總,包括業務、模型、特征、數據字段以及服務接口,每個下面都會有一些監控的點,也會涉及到一些預警,其提示的機制也是不一樣的。

風控場景全流程模型構建及應用實踐

五、內容匯總

文章首先是結合實際場景,列出了貸前、貸中和貸后可用的風控模型工具,接著介紹了這些工具在風控系統重是如何部署的,以及在貸前、貸中部署上的差異,最后列出監控及預警系統通常涵蓋的內容。

猜你喜歡