科技改變生活 · 科技引領(lǐng)未來(lái)
目前在人工智能領(lǐng)域有種提法,認(rèn)為“機(jī)器學(xué)習(xí)”是人工智能領(lǐng)域最能體現(xiàn)“智能”的專業(yè)分支。從發(fā)展歷史上看,機(jī)器學(xué)習(xí)也是人工智能發(fā)展最快的分支,近年來(lái)人工智能技術(shù)的突破大都源自于此。機(jī)器學(xué)習(xí)致力于研究如何通過(guò)計(jì)算的手段,利用既有經(jīng)驗(yàn)改善系統(tǒng)自身的性能。在計(jì)算機(jī)系統(tǒng)中,“經(jīng)驗(yàn)”經(jīng)常以“數(shù)據(jù)”的形式存在。因此,機(jī)器學(xué)習(xí)研究的主要內(nèi)容,就是關(guān)于在計(jì)算機(jī)上從數(shù)據(jù)產(chǎn)生“模型”的算法,即“學(xué)習(xí)算法”。我們只要把經(jīng)驗(yàn)數(shù)據(jù)提供給學(xué)習(xí)算法,就能基于這些數(shù)據(jù)產(chǎn)生一系列的模型,以指導(dǎo)如何面對(duì)新情況時(shí)提供準(zhǔn)確的判斷。
從早期的“符號(hào)機(jī)器學(xué)習(xí)”到如今一統(tǒng)天下的“統(tǒng)計(jì)機(jī)器學(xué)習(xí)”,機(jī)器學(xué)習(xí)逐漸完成了從偏重理論模型研究到實(shí)際應(yīng)用研究為主的轉(zhuǎn)變。其根本原因是由于計(jì)算能力的大幅提高,使得通過(guò)統(tǒng)計(jì)學(xué)和大數(shù)據(jù)研究得到的成果顯著,并常常遠(yuǎn)超人類通過(guò)其他現(xiàn)有技術(shù)積累可以達(dá)到的水平。未來(lái)的人工智能基礎(chǔ)理論創(chuàng)新,很可能來(lái)自于更加基本的認(rèn)知科學(xué)研究。從人類應(yīng)用的角度出發(fā),有必要把統(tǒng)計(jì)技術(shù)和對(duì)科學(xué)背景的深刻理解結(jié)合起來(lái)。
上述觀點(diǎn)的一個(gè)論據(jù)支撐是統(tǒng)計(jì)機(jī)器學(xué)習(xí)算法的前提是假設(shè)樣本數(shù)據(jù)“獨(dú)立同分布”。被認(rèn)為代表機(jī)器學(xué)習(xí)未來(lái)的“遷移學(xué)習(xí)”,研究如何把一個(gè)預(yù)訓(xùn)練的模型用在相關(guān)的其他任務(wù)中,更是要求與遷移關(guān)聯(lián)的雙方的數(shù)據(jù)具備獨(dú)立同分布的條件,這在很多科學(xué)和工程領(lǐng)域(尤其是力學(xué)領(lǐng)域)看起來(lái)是苛刻和不盡合理的。如何對(duì)數(shù)據(jù)的有效性進(jìn)行驗(yàn)證,或是研究出能夠用于“非獨(dú)立”或“不同分布”的學(xué)習(xí)算法,是應(yīng)用背景學(xué)科(如力學(xué))專業(yè)人士應(yīng)該深入探索的命題。
近年來(lái)機(jī)器學(xué)習(xí)里面最火熱的分支是“深度學(xué)習(xí)”,由于硬件性能的大幅提升,深度學(xué)習(xí)采用了復(fù)雜度更高的算法,得到了精細(xì)程度和質(zhì)量更佳的結(jié)果,但同時(shí)也加重了對(duì)數(shù)據(jù)量、數(shù)據(jù)源的準(zhǔn)確性以及運(yùn)算資源的依賴,而這種依賴性嚴(yán)重限制了機(jī)器學(xué)習(xí)應(yīng)用的場(chǎng)景和潛力。如何用更少的計(jì)算資源和數(shù)據(jù)樣本,解決更多工程和科學(xué)中的待解謎題?這也是大家所關(guān)心和期待的人工智能基礎(chǔ)理論創(chuàng)新的核心命題。
馬同
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml