2024年諾貝爾物理學(xué)獎(jiǎng)為何要頒給機(jī)器學(xué)習(xí)?

2024-10-11 9:19:00
  • 2024年諾貝爾物理學(xué)獎(jiǎng)為何要頒給機(jī)器學(xué)習(xí)?

2024年諾貝爾物理學(xué)獎(jiǎng)為何要頒給機(jī)器學(xué)習(xí)?

近日,據(jù)新華社報(bào)道,瑞典皇家科學(xué)院宣布,將2024年諾貝爾物理學(xué)獎(jiǎng)授予美國(guó)科學(xué)家約翰·霍普菲爾德(John Hopfield)和英國(guó)裔加拿大科學(xué)家杰弗里·欣頓(Geoffrey Hinton),表彰他們?cè)谑褂萌斯ど窠?jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方面的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。

作為在科學(xué)界具有舉足輕重的地位和深遠(yuǎn)影響的諾貝爾獎(jiǎng),它不僅是對(duì)科學(xué)家個(gè)人成就的最高肯定,更是對(duì)整個(gè)科學(xué)事業(yè)的推動(dòng)和激勵(lì)。而此次將諾貝爾獎(jiǎng)?lì)C發(fā)給了機(jī)器學(xué)習(xí),不僅是對(duì)當(dāng)下物理學(xué)與AI深度結(jié)合的高度認(rèn)可,也是對(duì)機(jī)器學(xué)習(xí)這門(mén)學(xué)科發(fā)現(xiàn)與發(fā)明的價(jià)值上的肯定。

機(jī)器學(xué)習(xí)的開(kāi)創(chuàng)者

如今只要關(guān)注一些科技相關(guān)的報(bào)道,一定對(duì)AI不會(huì)陌生,國(guó)內(nèi)不少企業(yè)更是已經(jīng)推出了大模型,相信不少人都已經(jīng)用過(guò)。而這些AI大模型在創(chuàng)造之時(shí),基本都使用了機(jī)器學(xué)習(xí)。

與眾人當(dāng)今所熟知的大模型不同的是,此次諾貝爾物理學(xué)獎(jiǎng)并不是授予給當(dāng)下火熱的大模型,而是由霍普菲爾德于1982年所提出的霍普菲爾德神經(jīng)網(wǎng)絡(luò),以及欣頓在上世紀(jì)80年代所發(fā)明的“玻爾茲曼機(jī)”。

在20世紀(jì)80年代初,當(dāng)時(shí)的計(jì)算機(jī)科學(xué)和人工智能領(lǐng)域正處于探索新計(jì)算模型和技術(shù)的階段。彼時(shí),研究人員開(kāi)始重新審視神經(jīng)網(wǎng)絡(luò)作為處理信息的一種方式,尤其是在20世紀(jì)60年代末至70年代初,由于計(jì)算能力的限制以及對(duì)早期簡(jiǎn)單模型(如感知機(jī))的批評(píng),神經(jīng)網(wǎng)絡(luò)的研究一度陷入低谷。

在這一背景下,霍普菲爾德正式提出了霍普菲爾德網(wǎng)絡(luò),主要特點(diǎn)是所有神經(jīng)元節(jié)點(diǎn)之間都是相互連接的,形成了一個(gè)全連接的網(wǎng)絡(luò)結(jié)構(gòu)。這種網(wǎng)絡(luò)提供了一個(gè)模擬人類(lèi)記憶的模型,它保證了向局部極小值的收斂,但有可能收斂到錯(cuò)誤的局部極小值而非全局極小值。因此,該網(wǎng)絡(luò)可以在聯(lián)想記憶和模式識(shí)別方面有著廣泛的作用。

打個(gè)比方,由于霍普菲爾德網(wǎng)絡(luò)有著類(lèi)似于人腦的聯(lián)想記憶功能,即使輸入的信息不完整或帶有噪聲,也能識(shí)別并糾正。當(dāng)然,這種網(wǎng)絡(luò)也存在著記憶容量有限、模式間易干擾、對(duì)噪聲容忍度低、同步更新不穩(wěn)定等缺點(diǎn),導(dǎo)致在實(shí)際應(yīng)用中有一定局限性。但它為后來(lái)的神經(jīng)網(wǎng)絡(luò)研究提供了靈感,促進(jìn)了更多復(fù)雜的網(wǎng)絡(luò)架構(gòu)和訓(xùn)練方法的發(fā)展。

1986年,欣頓與大衛(wèi)·萊姆哈特(D. E. Rumelhart)等提出了誤差反向傳播算法(Error back-propagation algorithm),簡(jiǎn)稱(chēng)BP算法,這一算法至今仍被所有大模型自監(jiān)督學(xué)習(xí)算法所采用。

此外,欣頓還提出了AlexNet模型,將深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)與GPU相融合,并開(kāi)創(chuàng)了第三次人工智能的研究熱潮。此外,欣頓與特倫斯·塞伊諾夫斯基(TerrenceSejnowski)一起發(fā)明了玻爾茲曼機(jī),這是一種基于統(tǒng)計(jì)物理學(xué)中玻爾茲曼分布的隨機(jī)神經(jīng)網(wǎng)絡(luò)模型。這種模型能夠通過(guò)學(xué)習(xí)數(shù)據(jù)中的概率分布來(lái)進(jìn)行推理和決策,對(duì)于理解復(fù)雜系統(tǒng)中的模式識(shí)別具有重要意義。

此次諾貝爾物理學(xué)獎(jiǎng)的頒獎(jiǎng)理由是,利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)的基礎(chǔ)發(fā)現(xiàn)和發(fā)明。而霍普菲爾德與欣頓正是機(jī)器學(xué)習(xí)這門(mén)學(xué)科最開(kāi)始的開(kāi)始,諾貝爾物理學(xué)委員會(huì)秘書(shū)烏爾夫·丹尼爾松在接受采訪(fǎng)時(shí)表示,物理學(xué)獎(jiǎng)可以授予理論上、實(shí)驗(yàn)上或者觀(guān)測(cè)上的發(fā)現(xiàn),也可以授予發(fā)明,今年的獲獎(jiǎng)成果從某種意義上講也是一種發(fā)明,一種可以多種方式應(yīng)用的發(fā)明。

物理學(xué)與計(jì)算機(jī)的必然結(jié)合

2022年末,OpenAI正式推出了ChatGPT,這標(biāo)志著生成式人工智能技術(shù)的一個(gè)重要里程碑。更重要的是,隨著AI大模型的發(fā)展,甚至已經(jīng)開(kāi)始為物理學(xué)的研究帶來(lái)了全新的視角和方法。

AI,特別是機(jī)器學(xué)習(xí)算法,能夠處理海量數(shù)據(jù),并從中識(shí)別出模式和規(guī)律。這對(duì)于分析實(shí)驗(yàn)數(shù)據(jù)、天文觀(guān)測(cè)數(shù)據(jù)等非常有用,可以幫助物理學(xué)家更快地發(fā)現(xiàn)新的物理現(xiàn)象。也可以用于創(chuàng)建更復(fù)雜的物理模型,并且可以加速模擬過(guò)程。還可以用來(lái)設(shè)計(jì)更有效的實(shí)驗(yàn)方案,并優(yōu)化實(shí)驗(yàn)條件,從而提高實(shí)驗(yàn)的效率和準(zhǔn)確性。

甚至在實(shí)際應(yīng)用中,比如集成電路領(lǐng)域,AI依靠機(jī)器學(xué)習(xí)已經(jīng)開(kāi)始設(shè)計(jì)出全新的芯片,通過(guò)發(fā)展迭代,未來(lái)更高難度的芯片設(shè)計(jì)工作完全交由AI也并非不可能。

過(guò)去幾十年來(lái),物理學(xué)與計(jì)算機(jī)科學(xué)正在變得越來(lái)越緊密,甚至計(jì)算機(jī)科學(xué)與物理學(xué)的結(jié)合催生了諸如計(jì)算物理、量子計(jì)算等新興領(lǐng)域,這些領(lǐng)域不僅推動(dòng)了科學(xué)前沿的發(fā)展,還可能帶來(lái)革命性的技術(shù)突破。

發(fā)現(xiàn)沒(méi)有,計(jì)算機(jī),尤其是AI這項(xiàng)工具將我們很多工作都簡(jiǎn)化了,提升了效率,能夠讓人們不再需要去做那些重復(fù)或者只需要計(jì)算的工作,而是更多的從事創(chuàng)造性的事業(yè)。

很多人對(duì)于今年的諾貝爾物理學(xué)獎(jiǎng)結(jié)果有些出乎意料,認(rèn)為機(jī)器學(xué)習(xí)只是一項(xiàng)工作,并未實(shí)際的解決物理學(xué)中的問(wèn)題,因此很難認(rèn)為這項(xiàng)成果能夠被授予諾貝爾獎(jiǎng)。

但物理學(xué)中有一個(gè)分支叫統(tǒng)計(jì)物理(Statistical Physics)它使用概率論和統(tǒng)計(jì)學(xué)的方法來(lái)研究大量微觀(guān)粒子(如原子和分子)組成的宏觀(guān)系統(tǒng)的整體行為。統(tǒng)計(jì)物理的目標(biāo)是通過(guò)分析組成物質(zhì)的基本單元的行為來(lái)解釋宏觀(guān)物理現(xiàn)象,如溫度、壓力、熱容、相變等。

簡(jiǎn)單來(lái)說(shuō),統(tǒng)計(jì)物理就是討論在給出個(gè)體之間的相互作用情況下,集體會(huì)產(chǎn)生什么樣的行為。而機(jī)器學(xué)習(xí)呢,就是將一些很基礎(chǔ)的機(jī)構(gòu)用簡(jiǎn)單的運(yùn)算疊加在一起,然后創(chuàng)造出擁有巨大能量的集體行為。從這個(gè)角度來(lái)看,如今的AI模型恰恰就是驗(yàn)證了統(tǒng)計(jì)物理的想法。

有人工智能專(zhuān)家認(rèn)為,人工神經(jīng)網(wǎng)絡(luò)雖然在物理學(xué)領(lǐng)域還不足與基礎(chǔ)物理學(xué)定律的貢獻(xiàn)相媲美,卻是對(duì)世界可能產(chǎn)生重大影響的人工智能科學(xué)的基礎(chǔ)性貢獻(xiàn)。

寫(xiě)在最后

人類(lèi)的科學(xué)發(fā)展,一定程度上可以認(rèn)為是物理學(xué)的發(fā)展。從萬(wàn)有引力的發(fā)現(xiàn),到相對(duì)論的推導(dǎo),再到如今芯片的制造,超導(dǎo)體的研發(fā)等,都是物理學(xué)的體現(xiàn)。而今,AI開(kāi)始深度參與到我們的生活當(dāng)中,通過(guò)深度學(xué)習(xí),AI能夠幫助我們更高效的完成重復(fù)的工作,解放人類(lèi)的腦力。而這種人工神經(jīng)網(wǎng)絡(luò)的研究,也有助于讓我們了解自己。

回歸最初的本質(zhì),物理通常指的是通過(guò)科學(xué)的方法來(lái)探究物質(zhì)世界的本質(zhì)、結(jié)構(gòu)和運(yùn)動(dòng)規(guī)律的學(xué)科。而在古代漢語(yǔ)中,物理更多的指事物的本性和道理,即事物的本質(zhì)和運(yùn)行的法則。而機(jī)器學(xué)習(xí),何嘗不是一種對(duì)事物本性和道理的探究呢?