科技改變生活 · 科技引領(lǐng)未來
在最近的第六屆阿里巴巴全球數(shù)學(xué)競賽中,一項(xiàng)新的挑戰(zhàn)吸引了全球的注意:AI大模型挑戰(zhàn)賽。這次比賽不僅有來自全球的數(shù)學(xué)愛好者參與,還特別開放給了AI隊(duì)伍,讓人工智能與人類直接在同一賽場上競技。
第六屆阿里數(shù)學(xué)賽競賽中,17歲學(xué)生姜萍位列12名成全球矚目,同時(shí)AI隊(duì)伍的表現(xiàn)也引人注目,平均分達(dá)到了18分,顯示出它們在解決標(biāo)準(zhǔn)化問題上的能力已經(jīng)與人類選手相當(dāng)。然而,盡管AI的表現(xiàn)在某些方面已經(jīng)接近人類,但在高分段的表現(xiàn)仍有很大差距。AI的最高分為34分,遠(yuǎn)低于人類選手的最高分113分。
這次比賽中,AI隊(duì)伍的最高分是由上海建平中學(xué)的涂津豪設(shè)計(jì)的AI方案獲得。他的方法是讓多個(gè)大模型通過“自問自答自驗(yàn)證”的方式,進(jìn)行深度思考和問題解決,最終從多個(gè)可能的答案中選擇最優(yōu)解。
此外,來自西南交通大學(xué)的特工宇宙團(tuán)隊(duì)和中國人民大學(xué)的SuperCarryMan團(tuán)隊(duì)也表現(xiàn)出色,分別以27分的成績獲得亞軍和季軍。這兩支隊(duì)伍都采用了多智能體系統(tǒng),通過不同智能體的協(xié)作和多階段推理來解決問題。
盡管AI在這次競賽中展現(xiàn)了一定的能力,但賽事的結(jié)果也揭示了AI在進(jìn)行復(fù)雜推理和創(chuàng)新思考方面的局限。浙江大學(xué)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)實(shí)驗(yàn)室的陳天楚指出,目前的大語言模型主要是通過固定速率預(yù)測下一個(gè)詞,而這種一次性輸出的方式并不適合需要深層次邏輯推理和多次試錯(cuò)的任務(wù)。
AI挑戰(zhàn)賽的結(jié)果不僅展示了人工智能在數(shù)學(xué)領(lǐng)域的進(jìn)步和挑戰(zhàn),也引發(fā)了對(duì)AI本質(zhì)的更深入探討。技術(shù)總監(jiān)認(rèn)為,雖然AI在處理規(guī)則明確的計(jì)算問題上可能超越人類,但在需要高度創(chuàng)新和深度邏輯推理的領(lǐng)域,人類的優(yōu)勢仍然明顯。
通過這次競賽,AI的發(fā)展和人類的理解可能會(huì)進(jìn)一步推動(dòng),不僅在數(shù)學(xué)理論上,也可能在AI技術(shù)的應(yīng)用和發(fā)展上帶來新的突破。而阿里數(shù)賽作為全球規(guī)模最大的在線數(shù)學(xué)競賽之一,將繼續(xù)為全球的數(shù)學(xué)愛好者和AI研究者提供一個(gè)展示和競技的平臺(tái)。
活潑溪流M
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml