科技改變生活 · 科技引領(lǐng)未來(lái)
人工智能時(shí)代 , 存在的最大問(wèn)題是是魚(yú)和熊掌不可兼得 , 也就是隱私性和可用性難以兼顧。如果你想要 AI 本身系統(tǒng)發(fā)揮作用 , 就可能要先犧牲隱私 , 但在大量的真實(shí)場(chǎng)景當(dāng)中 , 如果不能同時(shí)兼顧到隱私性和可用性 , 會(huì)導(dǎo)致很多 AI 落地的困境。
比如舉一個(gè)貸款風(fēng)控的例子。如果用戶(hù)想要去銀行做貸款 , 先來(lái)到了銀行 A, 銀行 A 基于一些本地?cái)?shù)據(jù)判斷這個(gè) A 是一個(gè)壞人 , 我們不可以給他貸款 , 這個(gè)人就到了銀行 B, 但是銀行 B 沒(méi)有銀行 A 的這些數(shù)據(jù) , 所以銀行 B 也許會(huì)把這筆貸款發(fā)放給用戶(hù)本人。這些由數(shù)據(jù)不流通所導(dǎo)致的矛盾比比皆是。
為了解決這一問(wèn)題 , 國(guó)內(nèi)外不少科技公司先后推出了解決方案 , 比如谷歌推出的聯(lián)邦學(xué)習(xí)、螞蟻金服提出的共享智能等。
共享智能為什么能夠獲得產(chǎn)學(xué)研各界的廣泛關(guān)注?
近年來(lái) , 隨著隱私保護(hù)越來(lái)越受重視 , 相關(guān)法規(guī)逐漸出臺(tái) , 互聯(lián)網(wǎng)公司難以任意的獲得數(shù)據(jù) ; 但在另一方面 , 基于大數(shù)據(jù)的人工智能需要更多更完善的數(shù)據(jù)才能發(fā)揮更大的作用。就像上面所提到的例子一樣 , 如何在保護(hù)隱私和數(shù)據(jù)安全的前提下 , 聯(lián)合多方數(shù)據(jù)進(jìn)行 AI 訓(xùn)練和分析 , 成為學(xué)術(shù)界和產(chǎn)業(yè)界的研發(fā)熱點(diǎn)。
螞蟻共享智能作為一個(gè)新興的交叉學(xué)科 , 近些年獲得了學(xué)術(shù)界、產(chǎn)業(yè)界以及研究機(jī)構(gòu)的廣泛關(guān)注。數(shù)據(jù)已經(jīng)是一種生產(chǎn)要素 , 重要性不言而喻。數(shù)據(jù)不僅是各類(lèi)大數(shù)據(jù)應(yīng)用的基礎(chǔ) ; 數(shù)據(jù)的質(zhì)量和數(shù)量也已經(jīng)成為影響人工智能模型效果最重要的因素之一。當(dāng)今各種應(yīng)用產(chǎn)生并收集了大量的數(shù)據(jù) , 同時(shí)也是使用數(shù)據(jù)的大戶(hù)。隨著 AI 模型能力和算力的提升 , 各種應(yīng)用場(chǎng)景對(duì)各種異構(gòu)、異源數(shù)據(jù)的使用效率也在飛速提升。
然而 , 數(shù)據(jù)的廣泛使用在提升應(yīng)用效果的同時(shí)也引發(fā)了我們對(duì)于數(shù)據(jù)安全性的擔(dān)憂(yōu)。這主要是歸結(jié)于數(shù)據(jù)自身的兩個(gè)很重要的特性 : 一個(gè)是可復(fù)制性 , 一個(gè)是可復(fù)用性??蓮?fù)制是指 , 數(shù)據(jù)可以被完整的、極低成本的拷貝 ; 可復(fù)用性是指 , 某份數(shù)據(jù)可以被多個(gè)不同領(lǐng)域的場(chǎng)景復(fù)用 , 也可以在相對(duì)長(zhǎng)的一個(gè)時(shí)間軸上被復(fù)用。
所以如果不同應(yīng)用之間直接共享數(shù)據(jù) , 那么可復(fù)制性和可復(fù)用性 , 一定會(huì)導(dǎo)致數(shù)據(jù)泄露的情況 , 也就是被留存二次使用 , 從而侵犯了商業(yè)利益。更為嚴(yán)重的是 , 如果是個(gè)人相關(guān)的數(shù)據(jù) , 很多時(shí)候 , 數(shù)據(jù)的管理者和使用者并不是數(shù)據(jù)的所有者。一旦在數(shù)據(jù)共享的過(guò)程中 , 發(fā)生了數(shù)據(jù)泄露 , 被對(duì)方濫用 , 那數(shù)據(jù)的管理者不僅僅是商業(yè)利益受到侵犯 , 它很可能也沒(méi)有盡到數(shù)據(jù)管理的責(zé)任。從歐盟的 GDPR 開(kāi)始 , 到美國(guó) CCPA, 到中國(guó)的數(shù)據(jù)安全法、網(wǎng)絡(luò)安全法、個(gè)人信息保護(hù)法都對(duì)這種數(shù)據(jù)管理失責(zé) , 和數(shù)據(jù)濫用 , 提出了嚴(yán)格的規(guī)范。所以各大數(shù)據(jù)方 , 出于保護(hù)商業(yè)利益、法律風(fēng)險(xiǎn)、輿論風(fēng)險(xiǎn)各方面考慮 , 都在收緊數(shù)據(jù)共享 , 從而形成了大數(shù)據(jù)孤島。
螞蟻共享智能就是為解決數(shù)據(jù)協(xié)作需求與隱私泄露和數(shù)據(jù)濫用之間矛盾的技術(shù)解決方案 , 不直接共享數(shù)據(jù)的情況下 , 連通大數(shù)據(jù)孤島 , 實(shí)現(xiàn)多方數(shù)據(jù)可用不可得 , 也就是拿不走 , 看不見(jiàn) , 但是用得好。
共享智能憑什么可以成為國(guó)際標(biāo)準(zhǔn)?
早在 2016 年 , 螞蟻就開(kāi)始致力于共享智能的技術(shù)研發(fā) , 并在螞蟻內(nèi)部及合作伙伴方的智能信貸、智能風(fēng)控等業(yè)務(wù)領(lǐng)域中率先應(yīng)用。螞蟻共享智能具有以下特點(diǎn) :
(1)多種安全計(jì)算引擎整合 , 可基于不同業(yè)務(wù)場(chǎng)景來(lái)選擇合適的安全技術(shù)。既有基于 TEE 的集中式解決方案 , 也有基于 MPC 的分布式解決方案 ; 既可滿(mǎn)足數(shù)據(jù)水平切分的場(chǎng)景 , 也能解決數(shù)據(jù)垂直切分的訴求 ; 既可以做模型的訓(xùn)練預(yù)測(cè) , 也可以做數(shù)據(jù)的探查和分析。
(2)支持基于 SQL 語(yǔ)法的數(shù)據(jù)分析、各種數(shù)據(jù)預(yù)處理算子和多種機(jī)器學(xué)習(xí)算法。支持的算法包括但不限于 LR,GBDT,Xgboost,DNN,CNN,RNN,GNN 等。
(3)大規(guī)模集群化。支持大規(guī)模集群化 , 提供金融級(jí)的高效、穩(wěn)定、系統(tǒng)化的支撐。
值得一提的是 , 共享智能有四個(gè)基石性的研究方向 , 分別是多方安全計(jì)算 , 可信執(zhí)行環(huán)境 , 差分隱私 , 以及聯(lián)邦學(xué)習(xí)。
多方安全計(jì)算和可信執(zhí)行環(huán)境側(cè)重解決計(jì)算過(guò)程中的數(shù)據(jù)安全問(wèn)題 , 差分隱私側(cè)重保護(hù)計(jì)算結(jié)果里的隱私泄露 , 而聯(lián)邦學(xué)習(xí)擅長(zhǎng)解決大數(shù)據(jù)孤島帶來(lái)的人工智能算法收斂性及效率問(wèn)題。單獨(dú)的一個(gè)方向并不能解決多方數(shù)據(jù)可用不可得的問(wèn)題 , 共享智能的研究既包括推動(dòng)這四個(gè)基礎(chǔ)方向的進(jìn)步 , 又包括對(duì)這四個(gè)方向的融合創(chuàng)新 , 從而提供滿(mǎn)足不同實(shí)際需求的多種產(chǎn)品與服務(wù)。
這些技術(shù)在實(shí)踐中表現(xiàn)出了獨(dú)特的優(yōu)勢(shì) , 可以應(yīng)用于不同場(chǎng)景。比如基于可信執(zhí)行環(huán)境的方案可以做中心化部署 , 用戶(hù)的接入成本是比較低 ; 而基于多方安全計(jì)算的方案 , 相關(guān)的安全技術(shù)對(duì)用戶(hù)來(lái)說(shuō)是透明的 , 給用戶(hù)的安全體感強(qiáng)。同時(shí) , 多種技術(shù)并不是隔離的 , 在面對(duì)一個(gè)復(fù)雜問(wèn)題的時(shí)候 , 對(duì)技術(shù)的選型不是非此即彼的關(guān)系 , 把不同的技術(shù)融合到一起 , 發(fā)揮各自技術(shù)的優(yōu)勢(shì) , 往往會(huì)達(dá)到一個(gè)更為理想的效果。
不久前 , 螞蟻牽頭的共享智能聯(lián)盟標(biāo)準(zhǔn)就在 AIIA(中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟)正式發(fā)布 , 這也是全國(guó)首個(gè)共享智能的聯(lián)盟標(biāo)準(zhǔn)。事實(shí)上 , 早在 2019 年 , 共享智能就已經(jīng)亮相國(guó)際舞臺(tái)。螞蟻在 IEEE(電氣和電子工程師協(xié)會(huì))、ITU-T(國(guó)際電信聯(lián)盟)中牽頭推進(jìn) “共享學(xué)習(xí)技術(shù)框架和技術(shù)要求”和 “共享學(xué)習(xí)系統(tǒng)技術(shù)框架”國(guó)際標(biāo)準(zhǔn)的制定 , 來(lái)解決行業(yè)痛點(diǎn) , 讓數(shù)據(jù)在安全環(huán)境下進(jìn)行連接、合作、共創(chuàng)、賦能 , 充分釋放多方數(shù)據(jù)價(jià)值。
共享智能技術(shù)在行業(yè)內(nèi) , 也獲得了一些行業(yè)獎(jiǎng)項(xiàng) , 體現(xiàn)了行業(yè)內(nèi)對(duì)這一技術(shù)的認(rèn)可度。2019 年 , 在中國(guó)人工智能峰會(huì)上獲得了紫金產(chǎn)品創(chuàng)新獎(jiǎng) , 在全球人工智能創(chuàng)業(yè)者大會(huì)上獲得應(yīng)用案例示范獎(jiǎng) , 在的世界人工智能產(chǎn)業(yè)安全上獲得了十大創(chuàng)新實(shí)踐 , 在 CCF(中國(guó)計(jì)算機(jī)學(xué)會(huì)), 獲得了科技進(jìn)步優(yōu)秀獎(jiǎng)。
標(biāo)準(zhǔn)是創(chuàng)新也是前瞻 , 不僅解決當(dāng)前的問(wèn)題 , 也能解決未來(lái)的問(wèn)題。作為一家致力于為世界帶來(lái)平等普惠金融服務(wù)的科技公司 , 螞蟻金服一直走在國(guó)內(nèi)外標(biāo)準(zhǔn)制定的前列 , 助力推動(dòng)技術(shù)的規(guī)范化發(fā)展。
螞蟻共享智能的應(yīng)用實(shí)踐
金融行業(yè)作為一個(gè)數(shù)據(jù)驅(qū)動(dòng)的行業(yè) , 不僅對(duì)數(shù)據(jù)的管控更嚴(yán)格 , 對(duì)數(shù)據(jù)的隱私保護(hù)也會(huì)更加重視 , 因此也是最需要通過(guò)技術(shù)手段解決數(shù)據(jù)孤島問(wèn)題的行業(yè) , 這也是很多技術(shù)實(shí)踐都優(yōu)先選擇落地金融領(lǐng)域的原因。而螞蟻共享智能就憑借多年金融實(shí)踐和廣泛應(yīng)用 , 獨(dú)樹(shù)一幟 , 成功幫助金融等相關(guān)行業(yè)逐步解決隱私泄露和數(shù)據(jù)濫用的數(shù)據(jù)共享難題 , 為大數(shù)據(jù)在更多領(lǐng)域的深度應(yīng)用保駕護(hù)航。
接下來(lái)分享三個(gè)典型落地案例。
一個(gè)是在安全風(fēng)控領(lǐng)域 , 螞蟻基于共享智能技術(shù)將風(fēng)控能力賦能合作伙伴 , 聯(lián)合數(shù)據(jù)建模提升模型性能 , 來(lái)建立安全風(fēng)控網(wǎng)絡(luò)。生態(tài)伙伴可以使用可信執(zhí)行環(huán)境技術(shù) , 把數(shù)據(jù)加密傳輸?shù)骄W(wǎng)絡(luò)中共建這個(gè)模型 , 打擊虛假交易、團(tuán)伙作案等 , 大幅度提升風(fēng)控準(zhǔn)確率 , 實(shí)現(xiàn)風(fēng)控網(wǎng)絡(luò)的凈化。通過(guò)這樣的風(fēng)控網(wǎng)絡(luò)平臺(tái) , 使得商家每天新增很多的交易 , 同時(shí)降低資損。
第二個(gè)是中和農(nóng)信 , 螞蟻通過(guò)數(shù)據(jù)融合大幅度提高風(fēng)控性能 , 把原來(lái)傳統(tǒng)的線(xiàn)下模式 , 變成線(xiàn)上自動(dòng)過(guò)審模式 , 完成授信只需 5 分鐘 , 8 個(gè)月累計(jì)放款 31.9 億 , 授信成功人數(shù) 44 萬(wàn)人 , 業(yè)務(wù)覆蓋 20 + 省區(qū) , 300 + 縣城 , 10000 + 個(gè)鄉(xiāng)村 , 助力實(shí)現(xiàn)農(nóng)村普惠金融。
第三個(gè)是與江蘇銀行建立信貸聯(lián)合風(fēng)控機(jī)制 , 通過(guò)共享智能技術(shù) , 構(gòu)建共同的模型強(qiáng)化風(fēng)控管理 , 讓信貸防控的效果進(jìn)一步提升?;诼?lián)合風(fēng)控機(jī)制 , 江蘇銀行能夠在獲得貸款申請(qǐng)后 , 通過(guò)數(shù)據(jù)交互 , 依據(jù)多方數(shù)據(jù)進(jìn)行更科學(xué)的信貸決策 , 在這個(gè)過(guò)程中 , 用戶(hù)的數(shù)據(jù)和隱私也得到了有效的保護(hù)。在螞蟻共享智能等前沿技術(shù)加持下 , 江蘇銀行通過(guò)聯(lián)合風(fēng)控系統(tǒng) , 提升綜合服務(wù)、智慧風(fēng)控能力 , 破解信貸難題 , 在實(shí)現(xiàn)風(fēng)險(xiǎn)抵御能力增強(qiáng)的同時(shí) , 推動(dòng)業(yè)務(wù)穩(wěn)步增長(zhǎng) , 資產(chǎn)質(zhì)量持續(xù)改善。
總的來(lái)說(shuō) , 螞蟻希望構(gòu)建開(kāi)放的共享智能網(wǎng)絡(luò) , 有更多的伙伴、機(jī)構(gòu)參與進(jìn)來(lái) , 一起完成建設(shè) , 打破數(shù)據(jù)孤島 , 助力 AI 技術(shù)更好的落地和應(yīng)用。
何龍林
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml