①知識(shí)圖譜擅長表達(dá)專業(yè)知識(shí)、私密知識(shí),這與大模型所表達(dá)的參數(shù)化、不可理解的知識(shí)是緊密的互補(bǔ)關(guān)系; ②復(fù)旦大學(xué)教授肖仰華認(rèn)為,大模型沒有通識(shí)能力,是不可能發(fā)展出專業(yè)認(rèn)知能力。通用大模型的行業(yè)適配和優(yōu)化的道路才剛剛開始**。
《科創(chuàng)板日?qǐng)?bào)》9月9日訊(記者 黃心怡)在上海舉行的2023 inclusion·外灘大會(huì),吸引了多家金融大模型廠商參會(huì),探討大模型技術(shù)從基礎(chǔ)大模型走向行業(yè)大模型的機(jī)會(huì)和挑戰(zhàn)。
多位金融領(lǐng)域的專家指出,大模型對(duì)整個(gè)金融體系的影響是長期的,但金融業(yè)對(duì)精準(zhǔn)度、可控性、安全等都有很高的要求,而當(dāng)下大模型仍無法解決幻覺問題——不準(zhǔn)確或誤導(dǎo)性的輸出,影響了其應(yīng)用落地。要解決這一點(diǎn),應(yīng)注重知識(shí)圖譜技術(shù)與大模型技術(shù)的融合,并重視傳統(tǒng)小模型的協(xié)同作用,不管是重底座、輕應(yīng)用,還是重應(yīng)用、輕底座,都是錯(cuò)誤的。
▍大模型對(duì)金融體系將產(chǎn)生長期影響
相關(guān)研究數(shù)據(jù)顯示,目前國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個(gè),其中金融行業(yè)大模型約18個(gè)。螞蟻集團(tuán)、度小滿、恒生電子、同花順等已經(jīng)在積極研發(fā)金融大模型。
有業(yè)內(nèi)分析認(rèn)為,中國金融機(jī)構(gòu)經(jīng)歷互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)兩大浪潮之后,如今正迎接第三波大模型浪潮。
中國社科院國家金融與發(fā)展實(shí)驗(yàn)室副主任楊濤在會(huì)上表示,大模型對(duì)整個(gè)金融體系的影響是一個(gè)長期的過程,而短期內(nèi)在某些方面已經(jīng)體現(xiàn)了一些價(jià)值:
一是在提升面向客戶的服務(wù)能力方面,可為金融機(jī)構(gòu)員工的專業(yè)化營銷、渠道維護(hù)提供更加智能化的間接支持。
二是在改善機(jī)構(gòu)工作流程與效率方面,可進(jìn)一步提升業(yè)務(wù)鏈條智能化與辦公模式的自動(dòng)化。
三是在文本處理方面,對(duì)金融機(jī)構(gòu)的一般文本、專業(yè)合規(guī)文件及業(yè)務(wù)所需的信息,都能更低成本、高效地提供技術(shù)支持。
四是對(duì)金融機(jī)構(gòu)實(shí)現(xiàn)了IT支持,其代碼生成的功能提升了IT基礎(chǔ)工作的效率。
平安集團(tuán)首席科學(xué)家肖京介也分享了正在開展的大模型和AIGC實(shí)踐。肖京介透露,平安集團(tuán)有幾十萬業(yè)務(wù)員,每個(gè)業(yè)務(wù)員可以通過人工智能生成多個(gè)高清數(shù)字人,從而擁有自己的數(shù)字分身,提高營銷能力。
在客戶服務(wù)方面,平安集團(tuán)的語音機(jī)器人去年總計(jì)服務(wù)了26億次客戶,約占客服業(yè)務(wù)的81%。在保險(xiǎn)理賠方面,借助AI技術(shù)實(shí)現(xiàn)98.6%的案件一天內(nèi)賠付。在風(fēng)控領(lǐng)域,通過人臉和聲音等身份識(shí)別技術(shù)來反欺詐,并對(duì)債券、投資或二級(jí)市場(chǎng)投資等領(lǐng)域可能出現(xiàn)的風(fēng)險(xiǎn),借助智能系統(tǒng)進(jìn)行防范和預(yù)警。
不過,大模型本身能力仍有很多地方待改進(jìn)。
肖京介指出,不管是精準(zhǔn)度、可控性、安全等很多地方需要不斷進(jìn)步。此外,在投產(chǎn)價(jià)值上,大模型的一大弊端是成本很高?!捌髽I(yè)做任何工作都要考慮產(chǎn)出,不能只看投入。而生成式大模型雖然在業(yè)務(wù)場(chǎng)景中逐漸出現(xiàn)成效,但還沒有呈現(xiàn)出規(guī)模化的效應(yīng)。”
▍大模型、小模型互相協(xié)同
復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華提到,“大模型的出現(xiàn)顛覆了認(rèn)知。讓我們發(fā)現(xiàn)行業(yè)的很多問題恰恰是建立在通用的認(rèn)知能力基礎(chǔ)上。沒有通識(shí)能力,是不可能發(fā)展出專業(yè)認(rèn)知能力?!?/p>
但是,通用大模型的行業(yè)適配和優(yōu)化的道路才剛剛開始。“大模型在金融領(lǐng)域的應(yīng)用屬于復(fù)雜決策任務(wù),要比ChatGPT這一類開放閑聊的任務(wù),困難得多。通用模型里面的專業(yè)知識(shí)是遠(yuǎn)遠(yuǎn)不夠的。為此,大模型需要進(jìn)行面向領(lǐng)域的訓(xùn)練優(yōu)化,提升大模型的行業(yè)認(rèn)知能力。” 肖仰華稱。
其中,特別要注重大模型與知識(shí)圖譜的協(xié)同。肖仰華認(rèn)為,知識(shí)圖譜擅長表達(dá)的是專業(yè)知識(shí)、私密知識(shí),和可理解、可控的符號(hào)知識(shí),這與大模型所表達(dá)的參數(shù)化、不可理解的知識(shí)是緊密的互補(bǔ)關(guān)系,可以緩解大模型的幻覺問題。
此外,企業(yè)還需從知識(shí)、能力、價(jià)值三方面重新架構(gòu)自身系統(tǒng)。在這個(gè)過程當(dāng)中,尤其要重視傳統(tǒng)小模型的價(jià)值。“傳統(tǒng)的分類模型、預(yù)測(cè)模型依然有用,我們真正要做的是把大模型、小模型協(xié)同起來。實(shí)際上小模型的插件應(yīng)用,可顯著地補(bǔ)足通用大模型能力的不足。重底座、輕應(yīng)用和重應(yīng)用、輕底座,都是在行業(yè)里使用大模型的錯(cuò)誤。兩者我們要兼顧,把大模型、小模型協(xié)同好?!?/p>
▍大模型就像“鸚鵡學(xué)舌” 數(shù)理能力有待提升
螞蟻集團(tuán)CTO何征宇在接受《科創(chuàng)板日?qǐng)?bào)》記者采訪時(shí)表示,AI大模型在語言文字上有較強(qiáng)的表現(xiàn),但在數(shù)理邏輯上仍有差距。
何征宇把大模型比喻為一只大號(hào)的鸚鵡?!艾F(xiàn)在,大模型學(xué)習(xí)東西的過程,就像是鸚鵡學(xué)舌。人類不斷重復(fù)告訴大模型1+1=2,通過一段時(shí)間地訓(xùn)練,它可以說人話、告訴你答案。但并不意味著真的理解了,特別在邏輯推斷、數(shù)理分析方面,你想想一只鸚鵡怎么可能做好量化分析?”
螞蟻集團(tuán)副總裁、金融大模型負(fù)責(zé)人王曉航則在采訪中坦言,金融對(duì)知識(shí)專業(yè)性、邏輯的嚴(yán)謹(jǐn)性,以及合規(guī)性都要求很高。原生大模型距離金融行業(yè)的要求還有很大的鴻溝,如何防止大模型出現(xiàn)幻覺,并沒有很好的辦法。
“為此,我們采用了知識(shí)圖譜的結(jié)構(gòu)化數(shù)據(jù),與大模型參數(shù)化數(shù)據(jù)相結(jié)合雙驅(qū)動(dòng)方式。希望通過積累的大規(guī)模金融領(lǐng)域的知識(shí)圖譜,能確保大模型的專業(yè)和嚴(yán)謹(jǐn)性。通過知識(shí)的注入、一致性的對(duì)齊,在生成完后,對(duì)真實(shí)和一致性進(jìn)行判別,這是一個(gè)系統(tǒng)化的過程?!?/p>
王曉航認(rèn)為,當(dāng)下金融業(yè)還沒有成熟到可以全面駕馭大模型所帶來的機(jī)會(huì)?!?strong>這依賴金融科技公司,金融體系內(nèi)部的科技力量,能夠把技術(shù)轉(zhuǎn)化成產(chǎn)品、轉(zhuǎn)化成平臺(tái)。我判斷,這還需要大概1、2年的時(shí)間?!?/p>