“科技迭代的速度越來(lái)越快,我們鉚足了勁往前去追,希望可以摸索出一些出路。作為科研工作者,我感到非常激動(dòng);同時(shí),我還有一種緊迫感,在如此的歷史機(jī)遇面前,希望自己能夠不負(fù)時(shí)代,有所作為,為社會(huì)發(fā)展帶來(lái)更多的創(chuàng)新技術(shù)?!睆?fù)旦大學(xué)教授薛向陽(yáng)說(shuō)。
為貫徹落實(shí)上海市委、市政府《關(guān)于全面推進(jìn)上海城市數(shù)字化轉(zhuǎn)型的意見》精神,推動(dòng)“經(jīng)濟(jì)、生活、治理”全面數(shù)字化轉(zhuǎn)型,引導(dǎo)全社會(huì)共建共治共享數(shù)字城市,在上海市城市數(shù)字化轉(zhuǎn)型領(lǐng)導(dǎo)小組辦公室、上海市經(jīng)濟(jì)和信息化委員會(huì)的指導(dǎo)下,上海市城市數(shù)字化轉(zhuǎn)型應(yīng)用促進(jìn)中心(上海市智慧城市建設(shè)促進(jìn)中心)策劃推出《數(shù)智說(shuō)》系列人物對(duì)話,與媒體平臺(tái)財(cái)聯(lián)社共同合作,邀請(qǐng)上海城市數(shù)字化轉(zhuǎn)型方面具有杰出影響力的專家大咖和領(lǐng)軍先鋒,從經(jīng)濟(jì)、生活、治理三大領(lǐng)域,闡述上海城市數(shù)字化轉(zhuǎn)型最新成果,展現(xiàn)城市數(shù)字化建設(shè)者們的前瞻性視野與可行性經(jīng)驗(yàn),并對(duì)上海建設(shè)國(guó)際數(shù)字之都的未來(lái)圖景進(jìn)行展望,推動(dòng)數(shù)字化轉(zhuǎn)型,賦能城市煥發(fā)新活力。
本期訪談人物:
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師 薛向陽(yáng)
“科技迭代的速度越來(lái)越快,我們鉚足了勁往前去追,希望可以摸索出一些出路。作為科研工作者,我感到非常激動(dòng);同時(shí),我還有一種緊迫感,在如此的歷史機(jī)遇面前,我希望自己能夠不負(fù)時(shí)代,有所作為,為社會(huì)發(fā)展帶來(lái)更多創(chuàng)新技術(shù)?!?/p>
ChatGPT的橫空出世讓人工智能再次成為熱詞,社會(huì)各界對(duì)它的探討與思考也逐漸走向了更深層次:眼下的人工智能已發(fā)展到了什么程度?再一次突破技術(shù)瓶頸還需哪些條件?在人工智能浪潮中,我國(guó)又處于怎樣的地位?
要回答這些問(wèn)題,不妨去最前沿的科學(xué)研究領(lǐng)域看一看。復(fù)旦大學(xué)類腦人工智能科學(xué)與技術(shù)研究院副院長(zhǎng)薛向陽(yáng)教授長(zhǎng)期浸潤(rùn)于人工智能的科研一線,對(duì)人工智能有著大量的科研成果及產(chǎn)業(yè)化經(jīng)驗(yàn),日前,《科創(chuàng)板日?qǐng)?bào)》記者與薛向陽(yáng)教授進(jìn)行了對(duì)話探討。
據(jù)介紹,早在上世紀(jì)70年代后期,復(fù)旦大學(xué)就開啟了人工智能兩個(gè)重要方向的研究,即計(jì)算機(jī)視覺和自然語(yǔ)言處理,目前已形成了一支頗具規(guī)模的AI研究團(tuán)隊(duì)。薛向陽(yáng)教授領(lǐng)導(dǎo)的計(jì)算機(jī)視覺團(tuán)隊(duì)開發(fā)了計(jì)算機(jī)視覺算法庫(kù),包含了圖像字符檢測(cè)與識(shí)別、行人重識(shí)別、單目三維目標(biāo)檢測(cè)等性能領(lǐng)先的算法模型,顯著提升了檢測(cè)識(shí)別精度。此外,該AI研究團(tuán)隊(duì)還自主開發(fā)了基于深度神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理算法庫(kù),最近開源了大型語(yǔ)言模型MOSS,大大降低了自然語(yǔ)言處理技術(shù)的應(yīng)用門檻……
從完成特定任務(wù)的小模型,到多任務(wù)大模型
“回顧我的學(xué)術(shù)生涯,激動(dòng)二字是我最大的感觸?!毖ο蜿?yáng)稱,這種激動(dòng)之情,是算法的快速迭代發(fā)展所帶來(lái)的,“你很難再找到另一個(gè)行業(yè),可以在短短十多年內(nèi),發(fā)生如此高頻的迭代進(jìn)化,而且,這種迭代進(jìn)化還極大推動(dòng)了社會(huì)經(jīng)濟(jì)的發(fā)展,引發(fā)了深刻的產(chǎn)業(yè)變革”。
薛向陽(yáng)介紹稱,在過(guò)去短短十幾年的時(shí)間里,計(jì)算科學(xué)發(fā)生了“翻天覆地”的變化,“由于數(shù)據(jù)的爆發(fā)式增長(zhǎng)、CPU/GPU計(jì)算能力的大幅提高、硬件的快速迭代和深度學(xué)習(xí)算法的發(fā)展成熟,計(jì)算科學(xué)領(lǐng)域取得了顯著的成就——其實(shí),仔細(xì)算起來(lái),深度學(xué)習(xí)算法也就發(fā)展了不到十年的時(shí)間”。
對(duì)此,作為科研工作者,薛教授最直接的感受是課題研究的方式變了。
“過(guò)去我們做研究,是一個(gè)任務(wù)、一個(gè)模型、一批數(shù)據(jù),各個(gè)課題小組根據(jù)任務(wù)‘單兵作戰(zhàn)’;現(xiàn)在有了大模型,它可以實(shí)現(xiàn)通用化,不再需要那么多單個(gè)的任務(wù)小組了。但是,大模型需要算力,動(dòng)輒需要幾百上千個(gè)高性能GPU卡,這又讓學(xué)術(shù)研究的門檻提高了很多。”薛向陽(yáng)表示。
更進(jìn)一步來(lái)說(shuō),薛向陽(yáng)認(rèn)為,隨著大模型在日常生活中的逐漸滲透,未來(lái)的人才培養(yǎng)方式也會(huì)發(fā)生改變:相較于考試“得分”,學(xué)生的創(chuàng)造力及創(chuàng)新能力會(huì)顯得更加重要。
更值得一提的是,在這股技術(shù)浪潮面前,薛向陽(yáng)坦言,中國(guó)還有自身獨(dú)特的優(yōu)勢(shì)。
“首先,中國(guó)具有多應(yīng)用場(chǎng)景的優(yōu)勢(shì),在由應(yīng)用所驅(qū)動(dòng)的研究領(lǐng)域,我們已經(jīng)處于全球領(lǐng)先水平;其次,在原創(chuàng)性的基礎(chǔ)研究方面,雖然目前國(guó)內(nèi)還有短板,但再有一段時(shí)間,想必也會(huì)有所突破?!毖ο蜿?yáng)稱,從全球范圍來(lái)看,在人工智能研究領(lǐng)域取得重大突破的,有不少杰出的華人科學(xué)家。
因此,作為科研工作者,薛向陽(yáng)既感覺到自己面對(duì)著巨大的機(jī)會(huì)窗口,可作為的空間廣闊,又明顯感到自己責(zé)任在肩:“科技迭代的速度越來(lái)越快,我們鉚足了勁往前去追,也希望可以摸索出一些出路。作為科研工作者,我感到非常激動(dòng);同時(shí),我還有一種緊迫感,在如此的歷史機(jī)遇面前,希望自己能夠不負(fù)時(shí)代,有所作為,為社會(huì)發(fā)展帶來(lái)更多創(chuàng)新技術(shù)。”
腦科學(xué)研究的突破,將繼續(xù)促進(jìn)算法的迭代
在進(jìn)行科研攻關(guān)的過(guò)程中,薛向陽(yáng)把自己的視線瞄向了腦科學(xué)。
據(jù)悉,人工智能的技術(shù)路線大致可分為兩條:一條以ChatGPT為代表,依靠海量數(shù)據(jù)和強(qiáng)大算力,通過(guò)對(duì)深度學(xué)習(xí)算法的不斷迭代,更好地建立起輸入和輸出之間非線性映射關(guān)系,這一類構(gòu)建大模型方法可以稱之為功能類腦;另一條則是結(jié)構(gòu)類腦的大模型構(gòu)建方法,通過(guò)模擬仿真人腦規(guī)模的神經(jīng)網(wǎng)絡(luò),稱之為數(shù)字孿生大腦,在此基礎(chǔ)上研究感知、學(xué)習(xí)、記憶、決策等認(rèn)知功能。目前,復(fù)旦類腦智能科學(xué)與技術(shù)研究院在馮建峰院長(zhǎng)領(lǐng)導(dǎo)下,有一支跨學(xué)科研究團(tuán)隊(duì)正在開展這方面的探索研究。
薛向陽(yáng)稱,他認(rèn)為,第二條技術(shù)路線如果走通,可能會(huì)帶來(lái)比ChatGPT更具顛覆性的變革。
他進(jìn)一步解釋稱,這一方面是因?yàn)樯疃葘W(xué)習(xí)算法具有一定的“先天限制”。比如,模型訓(xùn)練依賴人工對(duì)數(shù)據(jù)進(jìn)行標(biāo)注;模型反映復(fù)雜關(guān)聯(lián)關(guān)系,缺乏透明性,對(duì)預(yù)測(cè)結(jié)果缺少合理解釋;模型易受對(duì)抗樣本攻擊,對(duì)應(yīng)用場(chǎng)景穩(wěn)定性要求極高等等。
另一方面,基于數(shù)字孿生大腦開展其認(rèn)知功能的研究,是類腦智能研究的一個(gè)新的探索方向。
“人腦有860億個(gè)神經(jīng)元,每個(gè)神經(jīng)元可能連接到1000~10000個(gè)其他神經(jīng)元,神經(jīng)信號(hào)經(jīng)由這些連接所形成的神經(jīng)環(huán)路進(jìn)行信息的接受、傳遞和處理,其復(fù)雜程度是Chatgpt4的上百倍,而大腦能耗大致是15~30瓦?!毖ο蜿?yáng)激動(dòng)表示,如果有一天,計(jì)算機(jī)可以像人腦一樣進(jìn)行計(jì)算,不僅耗能低,而且計(jì)算效率驚人,那么這又會(huì)為人類社會(huì)帶來(lái)什么呢?
實(shí)際上,人腦的強(qiáng)大特性已給到科學(xué)家們對(duì)于人工智能的新啟發(fā),這也是人工神經(jīng)元、類腦智能算法的基礎(chǔ)。
早在1943年,心理學(xué)家McCulloch和數(shù)學(xué)家Pitts參考了生物神經(jīng)元的結(jié)構(gòu),發(fā)表了抽象的神經(jīng)元模型MCP。以此為開端,學(xué)界接連提出了人工神經(jīng)網(wǎng)絡(luò)ANN和深度卷積神經(jīng)網(wǎng)絡(luò)CNN,最后實(shí)現(xiàn)了0到9的簡(jiǎn)單字符識(shí)別,在其基礎(chǔ)上構(gòu)建出了各種各樣的深度神經(jīng)網(wǎng)絡(luò)模型,成為今天我們所見到的各種大模型的肇始。
不過(guò),薛向陽(yáng)表示,所謂“知其然,知其所以然”,要學(xué)習(xí)人腦是如何對(duì)信息進(jìn)行接受、傳遞和處理的,首先就要了解人腦的工作原理。但一直以來(lái),礙于科學(xué)技術(shù)水平有限,人類對(duì)于人腦的研究始終有限。
在復(fù)旦大學(xué),得益于各類項(xiàng)目支持,科研人員們把對(duì)人腦的研究往前推進(jìn)了一大步:其類腦人工智能科學(xué)與技術(shù)研究院是國(guó)內(nèi)高校最早成立的腦科學(xué)與類腦前沿交叉研究機(jī)構(gòu)之一,現(xiàn)在,通過(guò)數(shù)字孿生、核磁共振等技術(shù),該研究院已完成了對(duì)人類的大腦全數(shù)字化仿生,進(jìn)而在計(jì)算機(jī)上復(fù)刻出一個(gè)數(shù)字大腦。
“我們可以去了解大腦的結(jié)構(gòu),反解大腦結(jié)構(gòu),構(gòu)建數(shù)字孿生大腦。腦科學(xué)家們可以基于該研究成果進(jìn)行腦疾病發(fā)病機(jī)制的研究;后期,甚至可以接入一個(gè)機(jī)器人,將數(shù)字孿生腦植到機(jī)器人上……”薛向陽(yáng)解釋稱,打開想象力,基于數(shù)字孿生腦,他們可以做的工作還有很多很多。
同時(shí),薛向陽(yáng)也坦言稱,這是一個(gè)龐大的工程,涉及認(rèn)知神經(jīng)科學(xué)、計(jì)算生物學(xué)、計(jì)算精神病學(xué)、人工智能算法、類腦智能技術(shù)與轉(zhuǎn)化等前沿基礎(chǔ)和應(yīng)用研究,需要打通芯片、算法等軟硬件方面的各項(xiàng)合作。最近,復(fù)旦大學(xué)大數(shù)據(jù)研究院在院長(zhǎng)鄔江興院士領(lǐng)導(dǎo)下,正在探索用晶上系統(tǒng)實(shí)現(xiàn)全腦仿真,以其進(jìn)一步提高芯片集成度和降低功耗,從而持續(xù)提升類腦智能系統(tǒng)的效能。