
量化機(jī)構(gòu)九坤投資和微軟成功復(fù)現(xiàn)DeepSeek-R1
財(cái)聯(lián)社記者獲悉,九坤投資與微軟亞洲研究院近日刊文稱,首次成功復(fù)現(xiàn)了DeepSeek-R1,特別是其在強(qiáng)化學(xué)習(xí)領(lǐng)域的成果,同時(shí)在技術(shù)層面提出了創(chuàng)新性的見解。該學(xué)術(shù)文章名為Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning,為微軟亞洲研究院、Ubiquant及其他獨(dú)立研究人員共同撰寫。據(jù)悉,同為量化巨頭,九坤投資在數(shù)據(jù)、算法、算力方面有著強(qiáng)大的技術(shù)儲備和人才儲備,近年來持續(xù)在AI前沿技術(shù)領(lǐng)域展開系統(tǒng)且深入的研究,不僅長期探索通用技術(shù)并推動其場景應(yīng)用,還在多個(gè)細(xì)分領(lǐng)域進(jìn)行了多元化的研究拓展 ,力求構(gòu)建更為全面的AI技術(shù)體系。在業(yè)內(nèi)看來,DeepSeek的模型全部開源,全球掀起復(fù)現(xiàn)DeepSeek-R1的熱潮,此前包括HuggingFace、伯克利大學(xué)、上海交大等機(jī)構(gòu)均有相關(guān)復(fù)現(xiàn)研究,并取得一定的成果。(財(cái)聯(lián)社記者 閆軍)
我要評論
反饋意見 

歡迎您發(fā)表有價(jià)值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論