科技改變生活 · 科技引領未來
3月21日-22日,第十二屆中國城市商業銀行信息化發展創新座談會在廈門隆重召開。本次座談會以“融合、創新、共享”為主題,來自人民銀行分支機構、全國性商業銀行,城市商業銀行、民營銀行、部分農信社(農商銀行)、金融科技公司等機構600余名代表齊聚一堂,共同探討金融科技的前沿技術和創新實踐。DataCanvas九章云極受邀出席此次盛會。
中國互聯網金融協會會長李東榮,中國人民銀行科技司司長李偉出席會議并發表主題演講;中國人民銀行廈門市中心支行行長王彥青,廈門國際銀行副總裁兼中國境內總經理黃大慶,城市商業銀行資金清算中心主任陳曉平,中國金融電子化公司總經理、《金融電子化》雜志社社長張永福分別致歡迎辭。DataCanvas九章云極售前副總裁周曉凌受邀在本次座談會上發表題為《新金融時代的數據科學應用價值》的精彩演講。
(DataCanvas九章云極售前副總裁周曉凌)
周曉凌說,在數據分析的發展過程中,以往強調的“洞見藝術”和“挖掘藝術”分別轉變為標準化的科學組件和科學過程,數據科學這門獨立的學科也就應運而生。不管是數據分析從藝術化到標準化的衍變,還是市場上流行的邏輯數據倉庫(LDW),其目的都是通過提高已知數據分析效率,解決現有問題、預測未來結果。
機器學習平臺建模,直擊建模效率痛點
以商業銀行數據工程平臺為例,數據在平臺上需要經過數據源收集、采集整合、加工存儲、分析計算、數據服務、模型服務等環節,其中模型服務環節的落地痛點尤為突出。傳統的建模方式是由數據科學家結合業務知識和數據科學經驗人為建模,甚至被稱為“藝術”。
這種建模方式對建模者的知識要求和依賴性較高,同時由于建模過程中需運用多種數據加工方式、多種特征處理方式以及多種模型選用和模型訓練,巨大的工作量導致建模時間很長,且結果不穩定,模型能力落地也就困難重重。
在DataCanvas數據科學平臺上,通過將寬表加工、特征工程、模型訓練三個階段自動化處理,建模效率實現飛躍提升。寬表加工能夠實現自動數據清洗、自動表關聯、自動類型識別、自動分布檢測和自動相關性檢測;特征工程能夠實現自動特征選擇、數據集特征抽取、自動基礎特征衍生和自動高維特征衍生;模型訓練則能實現自動模型選擇、自動模型組合、自動超參數優化、自動結構搜索和自動模型評估等。
“三位一體”、高可用、可解釋,實現模型資產儲備
除此之外,DataCanvas數據科學平臺還具備“三位一體”建模功能。面向數據科學家的編碼建模,面向IT工程師的拖拽式建模和面向業務人員的自動機器學習建模,三種建模方式在同一平臺都可使用。不同知識背景的用戶不僅可以在平臺上擇需選用建模方式,還可以與團隊成員相互協作、加速建模。
由于DataCanvas數據科學平臺的白盒算法和流程透明的特性,平臺上輸出的數據模型具備極強的可解釋性和高可用性。可解釋性,意為每條決策都能夠被模型自動解釋說明,讓模型更易解讀、更易理解;高可用性則意味著模型能夠實際解決用戶難題,能夠投入到業務中使用。
在提高建模效率、降低建模成本的同時,數據模型也成為了可傳承的模型資產,讓銀行實現模型能力積累。
基于場景的自動機器學習,率先實現決策自動化
盡管寬表加工、特征工程、模型訓練三個階段實現了自動化處理,但將金融行業的龐雜數據全部自動化處理仍然是不可能完成的任務。為了加速模型落地、迅速提升銀行業務市場競爭力,DataCanvas數據科學平臺選擇從業務場景出發,通過對某個場景的深入分析,定向實現此場景所需數據的寬表加工、特征工程和模型開發,直接加速此場景的模型落地。
自動機器學習建模成果,最終以決策形式服務于使用者,如在線產品推薦、客戶流失預警、客戶畫像分析等。目前,DataCanvas已落地精準營銷、信貸風控、流失預警、量化投研、智能運維、客戶畫像、運營優化等業務場景。
2019年,數據科學平臺迎來了從小范圍試點到大規模應用的市場節點。DataCanvas數據科學平臺將發揮既有優勢,繼續深耕金融業務場景,為金融客戶的業務提升帶來更多價值,實力賦能金融企業AI建設,引領新金融時代!
李楠