①大模型作為創(chuàng)業(yè)公司來講,一定要慎重,這個豪賭是很大的; ②AI應用的生態(tài)需要更加繁榮,這樣才能反過來推動模型的發(fā)展。
《科創(chuàng)板日報》9月8日訊(記者 黃心怡) 今年以來AI熱度持續(xù)攀升,近半年內(nèi)全球近百家公司、機構(gòu)相繼發(fā)布大語言模型相關產(chǎn)品。國內(nèi)也正面臨著“百模大戰(zhàn)”,有數(shù)據(jù)顯示,全國有至少130家公司研究大模型產(chǎn)品,其中做通用大模型的有78家。
在外灘大會期間,《科創(chuàng)板日報》記者對話了小冰公司CEO李笛,螞蟻集團副總裁、螞蟻基礎大模型負責人徐鵬,就大模型的落地前景和挑戰(zhàn)進行了探討。
“現(xiàn)在行業(yè)里面最大的問題其實是太雷同了?!崩畹褜τ诖竽P惋L潮直言,“大家都沿著同一條路徑往前走,沒有多樣性,這和創(chuàng)新精神是違背的。創(chuàng)新其實不是追趕,而是有新的方法,去實現(xiàn)自己的優(yōu)勢?!?/p>
李笛還強調(diào),大模型創(chuàng)業(yè)需要慎重?!拔矣X得大模型作為創(chuàng)業(yè)公司來講,一定要慎重。如果創(chuàng)新是在一個維度的線性發(fā)展,那么只要追就可以了。但現(xiàn)在還不知道技術(shù)范式是不是這個方向。一旦最后的方向跟現(xiàn)在的方向有夾角,那么你跟得越快,創(chuàng)業(yè)公司就會走得越偏。當然,如果原本是一個擁有非常強業(yè)務的公司,想嘗試用大模型去改變原來的業(yè)務,那么是沒有任何問題的。但假如你就是吃大模型這碗飯,那這個豪賭是很大的。因為沒有人能確定,OpenAI也不能確定,風險很高?!?/p>
對于大模型同質(zhì)化的問題,徐鵬也認為,“現(xiàn)在很多吃大模型這碗飯的,大家做的都是偏雷同的,真正對于擴性本身的發(fā)展并不能帶來多大的推動作用?!?/p>
不過,徐鵬補充說道,雷同從另一個角度看,也是源于中國還處于追趕的階段,首先要及格,之后才有機會發(fā)展的更好。
“比如說百度、騰訊、阿里等等,都要做到跟GPT類似的水平。相信在這之后會有很多創(chuàng)新的點,可以做不一樣的東西。只是現(xiàn)階段還處在追齊GPT能力的階段?!?/p>
金沙江創(chuàng)投主管合伙人張予彤在大會上指出,當前生成式人工智能創(chuàng)業(yè)與投資爆發(fā),今年上半年投資額已超過去年全年水平。頭部25家生成式AI已吸收170億美金的融資,估值雖有泡沫,但泡沫中也有顛覆性的機會。生成式AI投資將圍繞那些具備護城河的AI原生應用展開。
徐鵬表示,AI應用的生態(tài)需要更加繁榮,這樣才能反過來推動模型的發(fā)展?,F(xiàn)在至少看起來應用生態(tài)還不夠繁榮,應用的場景上面還沒有那么豐富。
”還是要從應用入手,應用可以做出來非常多不一樣的東西?!毙禊i說,“如今國內(nèi)外的開源模型,給大家?guī)砹藙?chuàng)新上的便利,不用從頭開始浪費大量的財力去訓練基礎模型。所以,如果大家都把力量放在大模型應用的創(chuàng)新上面,會反過來看到大模型在什么地方做得不到位,哪里還有很大的提升空間,反過來能促進大模型技術(shù)的發(fā)展?!?/p>
數(shù)據(jù),是決定大模型性能的三大要素之一。用來訓練模型的數(shù)據(jù),將直接決定模型的質(zhì)量。李笛判斷,中文語料所存在的挑戰(zhàn)沒有想象中那么大?!?strong>中文的語料要好好地清洗,還是可以的。但把語料真正挖清楚、清洗得足夠好,這是苦力活。
徐鵬也認同語料清洗確實是一個苦力活。“而且誰都逃不開,但是中文本身的數(shù)據(jù)量級應該是夠的?!?/p>
展望大模型的未來,徐鵬稱,短期內(nèi)容易高估技術(shù)帶來的變化,而長期可能會低估其產(chǎn)生的效應,要冷靜地看待長期帶來的價值。
“當這樣的大潮起來之時,要非常認真地看清它,到底帶來的東西是什么,能力邊界到底在哪里。既不能盲目做太多不切實際的幻想,但又不能離開這個幻想。因為只有幻想才有動力,才有更多的人愿意做一些看上去不靠譜的事情。我們應有一定的機制支持人們長期在這個方向做進一步的投入,然后找到核心應用場景、真正能夠帶來變化的東西。然后就可以反哺到人工智能的發(fā)展?!?/p>