“AI科學(xué)家”登場(chǎng)，科研自動(dòng)化時(shí)代來(lái)了？

2024-09-12 01:35:00 來(lái)源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù)：

科技日?qǐng)?bào)記者劉霞

科研過(guò)程可以完全自動(dòng)化嗎？一個(gè)研究機(jī)器學(xué)習(xí)的國(guó)際團(tuán)隊(duì)正在勇闖“無(wú)人區(qū)”。

據(jù)《自然》網(wǎng)站近日?qǐng)?bào)道，日本Sakana AI公司和加拿大、英國(guó)科學(xué)家攜手，創(chuàng)建了一種基于大語(yǔ)言模型的“人工智能（AI）科學(xué)家”。從閱讀文獻(xiàn)到提出新假設(shè)，再到嘗試各種解決方案并撰寫(xiě)論文，整個(gè)研究周期，“AI科學(xué)家”能一氣呵成。

Sakana公司在其官網(wǎng)表示，這位科研“新星”是首個(gè)用于自動(dòng)化科研和開(kāi)放式發(fā)現(xiàn)的綜合AI系統(tǒng)，標(biāo)志著科學(xué)發(fā)現(xiàn)新時(shí)代的開(kāi)始。盡管它展現(xiàn)出非凡的潛力，但目前并不完美，應(yīng)警惕“AI科學(xué)家”被濫用的風(fēng)險(xiǎn)。

推進(jìn)流程行云流水

AI技術(shù)不斷進(jìn)步，讓科學(xué)家能借助一些模型來(lái)集思廣益或編寫(xiě)代碼。然而，這些模型仍然需要大量人工監(jiān)督，或僅囿于執(zhí)行特定任務(wù)。

那么，能否利用基礎(chǔ)模型將整個(gè)科研過(guò)程自動(dòng)化呢？包括加拿大不列顛哥倫比亞大學(xué)機(jī)器學(xué)習(xí)專(zhuān)家在內(nèi)的團(tuán)隊(duì)，成功創(chuàng)建出首位“AI科學(xué)家”。

在想法生成階段，該“AI科學(xué)家”基于一個(gè)起始模板，先進(jìn)行“頭腦風(fēng)暴”，提出多個(gè)不同研究方向，并進(jìn)行廣泛搜索，以確保某些想法是新穎且有趣的；在實(shí)驗(yàn)迭代階段，對(duì)于第一階段提出的某個(gè)想法，“AI科學(xué)家”會(huì)先開(kāi)展實(shí)驗(yàn)，然后生成圖表可視化結(jié)果，并給每個(gè)圖表添加注釋?zhuān)辉谡撐膶?xiě)作階段，它會(huì)模仿標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)會(huì)議的風(fēng)格，撰寫(xiě)出一份文字簡(jiǎn)練、內(nèi)容豐富的論文，并自主查找相關(guān)論文進(jìn)行引用；在自動(dòng)化同行評(píng)審階段，研究團(tuán)隊(duì)開(kāi)發(fā)出一個(gè)自動(dòng)化的“AI審稿人”，其評(píng)估生成論文的準(zhǔn)確性堪與人類(lèi)相媲美。評(píng)估結(jié)果和建議可用于改進(jìn)該項(xiàng)目，實(shí)現(xiàn)持續(xù)的反饋循環(huán)，使“AI科學(xué)家”能夠迭代改進(jìn)其研究成果。

在最初的演示中，該“AI科學(xué)家”針對(duì)擴(kuò)散模型、Transformer模型（一種用于處理語(yǔ)言數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型），以及AI“領(lǐng)悟”（grokking）等機(jī)器學(xué)習(xí)子領(lǐng)域進(jìn)行了深入研究，總共生成了10篇論文，每篇論文的成本約15美元。

美國(guó)華盛頓大學(xué)計(jì)算社會(huì)科學(xué)家杰文·韋斯特表示，該“AI科學(xué)家”行云流水般完成了整個(gè)科研流程，令人印象深刻，有望加速科學(xué)發(fā)現(xiàn)的步伐。

功能遠(yuǎn)非盡善盡美

盡管這位“AI科學(xué)家”潛能巨大，但它遠(yuǎn)非盡善盡美。

Sakana AI公司指出，“AI科學(xué)家”目前還不具備視覺(jué)功能，因此無(wú)法修復(fù)論文中出現(xiàn)的圖表問(wèn)題。例如，它生成的圖表有時(shí)無(wú)法讀取，表格有時(shí)會(huì)超出頁(yè)面范圍，頁(yè)面布局也并不美觀(guān)。

此外，該“AI科學(xué)家”有時(shí)會(huì)出現(xiàn)想法正確但執(zhí)行錯(cuò)誤的情況，也會(huì)因比較不當(dāng)而生成誤導(dǎo)性的結(jié)果。在撰寫(xiě)論文和評(píng)估結(jié)論時(shí)，它還可能會(huì)犯嚴(yán)重錯(cuò)誤。例如，它很難比較兩個(gè)數(shù)字的大小，這是大語(yǔ)言模型的“通病”。為了部分解決這個(gè)問(wèn)題，研究團(tuán)隊(duì)確保所有實(shí)驗(yàn)結(jié)果都可以重復(fù)，并存儲(chǔ)了所有執(zhí)行文件。

研究人員預(yù)計(jì)，未來(lái)多模態(tài)模型“加入戰(zhàn)局”，將助該“AI科學(xué)家”一臂之力。

另外，該“AI科學(xué)家”只能開(kāi)展機(jī)器學(xué)習(xí)領(lǐng)域的研究，且缺乏科研過(guò)程的關(guān)鍵部分：動(dòng)手進(jìn)行實(shí)驗(yàn)的能力。

艾倫人工智能研究所計(jì)算機(jī)科學(xué)家湯姆·霍普表示，目前該大語(yǔ)言模型“仍無(wú)法提出并制定新穎有用的科學(xué)方向”。勞倫斯伯克利國(guó)家實(shí)驗(yàn)室材料科學(xué)家赫布蘭德·希德則認(rèn)為，即使該系統(tǒng)在短期內(nèi)無(wú)法完成更具創(chuàng)造性的工作，仍可將科研過(guò)程中一些重復(fù)性?xún)?nèi)容自動(dòng)化。

Sakana AI也強(qiáng)調(diào)，此類(lèi)系統(tǒng)能否提出真正的變革型想法仍未有定論。未來(lái)的“AI科學(xué)家”能否發(fā)明出像人工神經(jīng)網(wǎng)絡(luò)或信息論一樣的概念也還是個(gè)未知數(shù)。

能力越強(qiáng)越需慎用

研究人員表示，為擴(kuò)大該“AI科學(xué)家”的能力，讓其能夠研究更抽象的領(lǐng)域，如純數(shù)學(xué)領(lǐng)域，可能需要調(diào)遣語(yǔ)言模型之外的其他技術(shù)。

例如，解決數(shù)學(xué)問(wèn)題需要邏輯推理，而目前大多數(shù)AI模型都不擅長(zhǎng)邏輯推理。鑒于此，谷歌深度思維公司開(kāi)發(fā)出AlphaGeometr，將語(yǔ)言模型與符號(hào)引擎（使用符號(hào)和邏輯規(guī)則進(jìn)行推理）相結(jié)合，構(gòu)建出一種神經(jīng)—符號(hào)混合系統(tǒng)。在今年的奧林匹克數(shù)學(xué)競(jìng)賽中，升級(jí)后的AlphaGeometry2在19秒內(nèi)就解答出一道題，令人類(lèi)選手望塵莫及。

研究人員堅(jiān)信，目前的迭代只是個(gè)開(kāi)始?！癆I科學(xué)家”就像AI科研自動(dòng)化領(lǐng)域的GPT-1。隨著不斷迭代，它將如目前的GPT-4一樣，引發(fā)新的科研革命。

不過(guò)，與許多新技術(shù)一樣，“AI科學(xué)家”也打開(kāi)了“潘多拉魔盒”，甚至可能被濫用。

譬如，“AI 科學(xué)家”能自動(dòng)創(chuàng)建論文并提交，這將顯著增加審稿人的工作量，可能阻礙科學(xué)質(zhì)量控制，并給學(xué)術(shù)進(jìn)步帶來(lái)壓力。而且，“AI科學(xué)家”還可能被用來(lái)制造危險(xiǎn)的病毒，給人類(lèi)社會(huì)帶來(lái)潛在危害。

責(zé)任編輯：常麗君

“AI科學(xué)家”登場(chǎng)，科研自動(dòng)化時(shí)代來(lái)了？

友情鏈接

抱歉，您使用的瀏覽器版本過(guò)低或開(kāi)啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁(yè)

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

“AI科學(xué)家”登場(chǎng)，科研自動(dòng)化時(shí)代來(lái)了？

友情鏈接

抱歉，您使用的瀏覽器版本過(guò)低或開(kāi)啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁(yè)

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí)，繼續(xù)瀏覽

“AI科學(xué)家”登場(chǎng)，科研自動(dòng)化時(shí)代來(lái)了？

抱歉，您使用的瀏覽器版本過(guò)低或開(kāi)啟了瀏覽器兼容模式，這會(huì)影響您正常瀏覽本網(wǎng)頁(yè)

3.暫不升級(jí)，繼續(xù)瀏覽