一、保險行業關于反欺詐的痛點及常見案例
保險行業欺詐問題日益嚴重,據統計,欺詐滲漏率已達到20%。保險欺詐的特征主要表現為形式多樣、手段專業化和主體團伙化。該行業面臨的痛點包括發現難、確認難和追償難。
下面介紹一下保險行業中高發領域的車險和健康險的含義及其識別方法。
1、車險
車險主要是團伙類風險。車險主要包括內外部勾結、擺放現場、偽造交通事故風險,為了對抗以上風險,我們通常采用圖譜方式進行防范。然而,對于低品質修復套取高品質配件、重復理賠類風險,僅靠保險公司內部數據可能還不足支援,需引入行業大數據做進一步防范。此外,倒簽單、駕駛員酒駕調包、虛報盜搶類可以通過構建風險畫像、評分模型進行識別。
2、健康險
健康險同樣存在團伙類和僥幸個案類的風險。對于團伙類風險,例如醫患勾結、冒名頂替等,我們可以通過圖譜方式進行防范。對于僥幸個案類的風險,如帶病投保、虛假理賠材料等,我們會用評分卡模型對理賠案件進行打分,從而識別這種風險。另外,對于過度醫療、濫用藥物以及夸大損失這類不合理醫療行為的風險,我們會建立不合理醫療識別引擎,通過醫學圖譜結合費用預測模型進行識別。
二、保險反欺詐核心能力建設方案
針對以上風險,太平金科相應地構建了保險反欺詐的核心能力,主要包括以下三個方面:
1、欺詐識別核心引擎
我們積極探索前沿技術,如大數據、機器學習和AI算法,構建保險欺詐識別核心引擎。
2、風險評分、畫像、提示
我們的關注點在于如何讓引擎服務好業務人員,輔助他們發現風險,而不是完全依靠模型來阻斷風險。因此,我們需要將引擎能力轉化為一種評分、畫像和風險提示的形式,以便業務人員能夠發現風險并據此完成審案、核賠、質檢等工作。
3、事中化識別與處置
為了解決事后發現風險涉及追償難的問題,我們需要將引擎能力嵌入各個業務流程中,通過與業務全流程的融合,實現事中化發現風險、對抗風險的作用,從而實現早發現、早確認和早追償。
三、保險反欺詐故事
下面介紹兩個保險反欺詐的案例,一個是車險團伙欺詐,另一個是健康險團伙欺詐。
首先,我們來看車險欺詐案例。我們的前端識別引擎發現了三個風險:第一個是通過圖譜發現胡某駕駛不同車輛多次出險;第二個是通過圖像識別引擎使用以圖搜圖的方式,識別出胡某駕駛兩輛不同車子碰撞了同樣的石墩;第三個是通過評分模型根據案件已觸發的條件計算得到高風險分數預警。進一步地,通過畫像引擎關聯該案件的標記車、駕駛員、被保人以及相關歷史關聯案件,呈現給理賠業務員。從畫像可以看出,該理賠案件已經關聯到了歷史的28個案件,擴展到了17輛車,而且自然語言算法提示案件的出險人員都是姓胡。最后,我們會去調取一些外部數據,比如關聯銀保信的數據,同時將該團伙擴展到其他保險公司的歷史案件。經以上操作發現,該團伙涉及199個案件、9家保險公司。
接下來,我們看一個健康險欺詐案例,是關于代理人聯合醫院資源騙取津貼費的情況。我們可以通過圖譜中代理人與醫院的關聯情況、出險頻率、出險類型(骨折類、呼吸道類、背部疾病)就可以完成風險識別和預警。
四、反欺詐核心能力平臺藍圖
目前,我們正在構建反欺詐核心能力平臺,整體藍圖由數據基礎層、能力層、平臺層和產品層構成。
1、數據基礎
我們將利用整個壽、財、養客戶及業務的數據、集團的數據、外部行業的大數據來構建數據基礎層。
2、能力層
能力層可以分成以下三個方面的能力:
(1)數字化
我們將直接使用底層集成的數據來構建風險畫像標簽體系和知識圖譜,或者通過隱私計算對接各種行業大數據。同時,我們還將收集用戶實時數據,通過可穿戴設備和物聯網設備等手段來構建我們的數字化能力;
(2)模型化
我們將對畫像標簽進行數據分析、大數據建模,構建各種類型的模型來應用于定價、核保、運營、理賠等業務環節,完成模型決策;
(3)智能化
我們將通過構建圖像自動分類、影像數據結構化、影像件重復理賠、圖像PS檢測、語音情緒識別和語音聲紋識別等能力來對抗欺詐風險。
3、平臺層
在技術層面,我們的平臺提供了四個核心模塊:健康險風險識別引擎、車險風險識別引擎、財產險風險識別引擎以及保險智能風控平臺。
(1)健康險風險識別引擎
主要負責賠付預測模型、理賠案件分層模型、圖譜反欺詐模型、不合理醫療行為識別模型和影像件風險識別模型等任務。這些模型能夠幫助我們更好地評估和管理健康險風險。
(2)車險風險識別引擎
構建了一個車險業務領域的風險評分、畫像和提示的全流程體系。這個系統可以有效地評估車險欺詐風險。
(3)財產險風險識別引擎
關注相關企業風險圖譜的構建,同時還開展了物聯網(IoT)的風險監控和AI數字農險的一些預研工作。這些功能有助于我們更好地評估和管理財產險風險。
(4)保險智能風控平臺
面向風險定價環節、智能核保環節、賠付預測、風險預警、賠中防滲漏和賠后風險圖譜等多個方面。這個平臺可以幫助我們更有效地管理保險風險,提高業務效率。
4、產品層面
我們為客戶提供了“核保”智能助手、“物聯”風險管家和“理賠”保險分等服務。這些產品旨在賦能業務,而不是僅僅通過模型來完成阻斷。通過與業務公司的緊密合作,我們希望為客戶提供更優質的服務,共同應對保險行業的挑戰。
五、車險風險識別引擎
基于以上平臺,下面詳細介紹一下車險風險識別引擎的構建方法。
對于案件風險的識別,首先,我們利用大數據機器學習建模能力,建立類似銀行用的評分卡模型對案件進行評分預測。通過分析報案電話、標的車和被保人的維度風險評分,我們可以實現案件的分流,提高客戶服務體驗。
在查勘環節,車險分產品會提供給查勘人員關于當前案件的風險提示以及收集風險信息的操作指引。查勘人員根據這些指引收集完信息后,這些信息可以用到后續的理賠環節,也可以作為風險評分模型的新證據。我們的車險風險識別引擎致力于簡化服務流程和理賠流程,因此,在沒有發現風險的情況下,查勘人員可以快速查勘。但一旦發現預警風險,查勘人員需針對性取證。例如,當發現被保人出現多輛標的車、駕駛員不是被保人等改變運營性質的風險時,我們會讓查勘人員在線下確認標的車的使用性質,并做錄音取證。當發現標的車為8年的老舊車、近期已理賠多次等重復理賠風險時,我們會把標的車的歷史理賠圖像發給查勘人員,并通過車險分工具展示其歷史碰撞部位,讓查勘人員根據風險提示去針對性拍照確認是否為舊痕。如果發現有擺放現場嫌疑風險,我們會讓查勘人員著重拍一些環境照,通過以圖搜圖的方式檢索是否有相似的環境照或碰撞物體。
對于團伙類的風險識別,我們先會構建一個關聯圖譜,該圖譜是基于歷史上的報案手機號、標的車、標的駕駛員、作業人員和修理廠等信息的。然后,在關聯圖譜的基礎上,針對業務風險點構建關聯模式完成風險挖掘。與互聯網行業通過端到端的圖神經網絡和機器學習算法來阻攔理賠案件不同,我們更注重發現風險模式。例如,我們可以通過關聯報案手機號、被保人、駛人員、三者人員以及修理廠等信息,進行后續針對性質檢。
以報案手機號關聯模式為例,我們通過關聯歷史風險案件并應用以圖搜圖、以臉搜臉的技術來發現風險。然而,如果我們在海量案件數據中直接使用以圖搜圖技術,可能會導致誤報率較高。為了解決這個問題,我們引入了圖譜的關聯模式。通過將關聯手機號劃分區域并縮小范圍,我們可以降低誤報率,提高召回率。
在AI算法應用方面,我們使用度量學習方來完成人臉識別和圖像識別。針對我們自己的保險場景、查勘圖片及影像的特點,通過環境比對和特征抽取來提高效率。例如,對于相同環境中可能存在不同車輛的情況,我們通常采用語義分割技術對車輛進行馬賽克或填充,然后再抽取環境的特征。對于石墩、電線桿、樹樁等交通路障,我們會針對性地進行目標檢測,并使用特征抽取算法提取相應的特征。最后,我們將抽取的特征存儲到向量庫中進行檢索。
通過將以圖搜索功能賦能給查勘人員,他們可以核查當前理賠案件是否有歷史上的相似案件。這種方法不僅提高了工作效率,還有助于減少誤判和欺詐行為的發生。
為了進一步提高車險識別的準確性,我們還引入了外部大數據,如銀保信和車聯網的數據。此外,我們設計了一套評分機制,用于將外部大數據納入我們的畫像指標中,以便進行風險預警。最后,我們通過雷達圖的方式展示分數及其作為風險提示的解讀。這種方式使得我們能夠更直觀地了解各項指標的得分情況,并快速識別潛在的風險。
六、健康險反欺詐引擎
基于我們的平臺,下面介紹一下健康反欺詐的構建方式。
為了提高健康險反欺詐的準確性,首先,我們從客戶維度、保單機構維度、本案與過往維度、疾病維度和代理人維度構建了一個健康險反欺詐的畫像指標,健康險個案類反欺詐評分模型更側重于風險標簽的挖掘與構建。事實上,保險領域欺詐案件的標簽很少,更多的是拒付類標簽。因此,我們根據歷史拒付情況和風險標簽畫像體系通過機器學習獲取評分卡模型。
相比于以前只根據醫學背景知識判斷反欺詐風險,我們引入了大數據技術和大數據維度。通過學習拒付案例,讓模型可以學到客群維度、銷售人員維度指標對拒賠的影響,將風險標簽呈現給作業人員。同時,我們將入參因子應用到運營環節去管理客戶和監控銷售人員。
我們通過構建畫像標簽做評分卡模型的目的不是去找欺詐,而是輔助業務人員發現欺詐。我們不光是做核賠核保的風險識別,還希望風險識別的評分項可以作為運營指標輔助業務進行管理和監控。
在構建完圖譜后,我們會去圍繞手機號、醫院代理人、疾病類型、收款賬號去發現風險集或風險模式。
與端到端發現風險模式不同的是,我們是通過模型算法發現某種風險模式后,將其固定化為規則再應用到線上。我們的目標是發現更多的風險模式,而不是通過圖算法直接端到端地預警案件的風險。這是因為保險金融服務行業要求風險的可解釋,我們不能僅根據風險直接阻斷案件,而是要提供有理有據的風險提示給相關作業人員。
我們對復雜的圖譜關系簡單抽象化后,可以將健康反欺詐模式簡單歸類為疾病類和事件類。在疾病類中,節點主要包括業務員、被保人、疾病和醫院。就診行為雷同模式的維度包括同時住院和出院;偽造單據模式的維度包括費用相似和掛床模式的維度包括住院時間的不合理;過度醫療模式的維度包括費用的不合理。
另外,對于時效性事件類,我們可以通過圖譜關聯方式去發現短期出險風險和高頻出險風險。
在健康險領域,我們也嘗試做了AI算法的應用,除了以圖搜圖發現重復理賠的應用場景外,我們還引用了OCR技術識別篡改風險,如票據大小寫不一致、票據模板不一致等。
此外,我們還探索了影像造假PS檢測技術。在這個場景中,我們不追求召回率很高,而是希望查準率很高,提升預警案件的調查成功率,來降低調查成本。由于保險行業的票據大多數過度壓縮,通過AI算法的手段去發現篡改區域是我們目前要突破的一個難點。
七、與業務流程深度融合的事中化風險管理機制
盡管以上所述主要涉及的是技術手段,但我們的實際工作更著重于將這些技術手段嵌入到業務環境中。
以車險為例,在續保時,我們會根據歷史客戶建立的風險指標體系對客戶進行評分,并提供風險提示。出險時,我們通過情緒識別來判斷對方是否酒駕。在電話報案時,根據聲紋識別來判斷對方是否為修理廠人員或黑名單員。在查勘時,我們會使用評分模型。在定損時,我們通過環境照識別、PS檢測和以圖搜圖等手段進行相關風險預警。最后,我們通過知識圖譜的方式進行事后質檢。
總之,我們是面向服務類的,通過風險產品的風險評分和畫像提示來輔助作業人員識別風險,而不是完全提供技術手段直接阻斷風險。我們希望我們的能力體現在我們的產品中,讓業務人員通過我們的產品發現更多維度的畫像,并基于這些畫像輔助他們在現場發現風險。
來源:DataFunTalk