亚洲区激情区图片小说区,欧洲男女啪啪免费观看,色婷婷久久免费网站,激情六月在线视频观看

563支AI隊(duì)伍和姜萍答了同一份試卷:最高34分,無(wú)一入圍決賽

錢(qián)玉娟2024-06-15 19:50

經(jīng)濟(jì)觀察網(wǎng) 記者 錢(qián)玉娟 6月13日,第六屆阿里巴巴全球數(shù)學(xué)競(jìng)賽(下稱“阿里數(shù)賽”)公布決賽名單,17歲的江蘇漣水中等專業(yè)學(xué)校學(xué)生姜萍排名12位,成為全球30名里唯一的女選手。

連續(xù)多日的熱搜,讓公眾知道了這位天才少女,也讓更多人知道了阿里數(shù)賽。與往屆不同,今年的阿里數(shù)賽首次開(kāi)放了AI大模型挑戰(zhàn)賽,共有563支由全球知名高校院所和企業(yè)組建的AI隊(duì)伍與姜萍解答了同一份試卷。

4月13日早上8點(diǎn),阿里數(shù)賽開(kāi)考,數(shù)萬(wàn)名來(lái)自全球各地的數(shù)學(xué)愛(ài)好者,需要完成其中選擇題、解答題與證明題的考驗(yàn)。但在6月13日公布的決賽名單中,801名晉級(jí)者里沒(méi)有一支AI隊(duì)伍入圍。

據(jù)賽事官方統(tǒng)計(jì),參與競(jìng)賽的AI隊(duì)伍的平均分為18分,已趕上人類選手的平均水平。但AI的最高分僅為34分,與人類選手最高分113分相比,差距甚遠(yuǎn)。

經(jīng)濟(jì)觀察網(wǎng)了解到,AI隊(duì)伍中的最高分由上海建平中學(xué)涂津豪個(gè)人推出的AI方案獲得。涂津豪通過(guò)借鑒自辯論思想,讓多個(gè)大模型進(jìn)行多輪的“自問(wèn)自答自驗(yàn)證”,從而尋求問(wèn)題的最優(yōu)解,再讓AI從中選出唯一答案。

來(lái)自西南交通大學(xué)的特工宇宙團(tuán)隊(duì)和中國(guó)人民大學(xué)的SuperCarryMan團(tuán)隊(duì)均獲得27分,成為本屆阿里數(shù)賽AI挑戰(zhàn)賽的亞軍和季軍。這兩支AI隊(duì)伍均基于Multi-Agent(多個(gè)智能體組成)進(jìn)行方案設(shè)計(jì),前者是讓多種大模型扮演不同角色進(jìn)行思路分析、解題、評(píng)價(jià),并通過(guò)調(diào)用Python等輸出答案;后者則動(dòng)態(tài)調(diào)整推理、邏輯驗(yàn)證和解釋器等多個(gè)階段,并針對(duì)每個(gè)子問(wèn)題選擇合適的參考案例,經(jīng)過(guò)多重驗(yàn)證整合,最終給出答案。

在浙江大學(xué)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)實(shí)驗(yàn)室從事大模型相關(guān)研究工作的陳天楚分析,現(xiàn)有LLM(大語(yǔ)言模型)的工作方法還是以固定的速率根據(jù)上下文預(yù)測(cè)下一個(gè)詞,一次性輸出結(jié)果。像數(shù)學(xué)競(jìng)賽這種需要反復(fù)、多次試錯(cuò)、思考的任務(wù),LLM在完成復(fù)雜推理、嚴(yán)謹(jǐn)思考方面仍存在局限性。

陳天楚透露,目前雖然可以通過(guò)Prompt(輸入到文生圖模型的文字)工程方式,讓單個(gè)LLM自我質(zhì)問(wèn)或多個(gè)LLM相互質(zhì)問(wèn),但這種方式對(duì)模型性能的增益還比較有限,無(wú)法替代經(jīng)過(guò)專業(yè)訓(xùn)練的人類。

公布AI挑戰(zhàn)賽成績(jī)的同時(shí),賽事組委會(huì)給出的AI閱卷點(diǎn)評(píng)中,指出了AI的數(shù)學(xué)短板,諸如邏輯推理能力弱,證明題很難拿到完整得分點(diǎn)等。

在阿里數(shù)賽設(shè)立AI挑戰(zhàn)賽之初,某互聯(lián)網(wǎng)企業(yè)的一位技術(shù)總監(jiān)就對(duì)此十分關(guān)注,他認(rèn)為這是“百模大戰(zhàn)”后,對(duì)AI模型能力的一次考驗(yàn)。雖然在規(guī)則清晰、計(jì)算密集型的問(wèn)題上,AI模型的能力表現(xiàn)可以優(yōu)于人類,但在需要深層次邏輯推理以及高度創(chuàng)新思維的問(wèn)題上,人類選手仍然占據(jù)絕對(duì)優(yōu)勢(shì)。

從第六屆阿里數(shù)賽決賽晉級(jí)名單看,AI大模型做題還難以超越人類,但上述技術(shù)總監(jiān)覺(jué)得,這場(chǎng)數(shù)學(xué)競(jìng)賽的對(duì)決或?qū)⑼苿?dòng)人類對(duì)人工智能本質(zhì)的理解再進(jìn)一步,甚至有望激發(fā)出新的數(shù)學(xué)理論和AI技術(shù)的發(fā)展。

今年,563支AI隊(duì)伍使用模型調(diào)優(yōu)、AI Agent(人工智能體)、提示詞工程等多種方式,試圖推動(dòng)AI構(gòu)建更強(qiáng)大的數(shù)學(xué)能力。

阿里數(shù)賽始辦于2018年,由阿里巴巴公益、達(dá)摩院共同舉辦,每年來(lái)自全球的數(shù)學(xué)愛(ài)好者可以通過(guò)達(dá)摩院官網(wǎng)報(bào)名,競(jìng)賽以不設(shè)報(bào)名門(mén)檻、全民參與著稱。一組數(shù)據(jù)顯示,阿里數(shù)賽至今已累計(jì)吸引了25萬(wàn)人次參賽,成為全球規(guī)模最大的在線數(shù)學(xué)競(jìng)賽。


版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
長(zhǎng)期關(guān)注并報(bào)道TMT領(lǐng)域的重大事件,時(shí)刻保持新聞敏感,發(fā)現(xiàn)前沿趨勢(shì)。擅長(zhǎng)企業(yè)模式、人物專訪及行業(yè)深度報(bào)道。
重要新聞線索可聯(lián)系qianyujuan@eeo.com.cn
微信號(hào):EstherQ138279

熱新聞