今天(6月4日)油價(jià)調(diào)整最新消息:本輪油價(jià)有望大幅下跌!
2024-06-04
更新時(shí)間:2024-06-04 15:50:00作者:佚名
斯坦福AI團(tuán)隊(duì)抄襲清華系大模型一事,在AI圈炸開(kāi)了鍋。
事件起因是5月29 日,一個(gè)由斯坦福學(xué)生組成的AI團(tuán)隊(duì)發(fā)布了一篇名為《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,稱訓(xùn)練出了一個(gè)開(kāi)源多模態(tài)模型Llama 3-V。這一模型比 GPT-4、Gemini Ultra、Claude Opus 等模型能力更強(qiáng),而且訓(xùn)練成本只需要500美元。
Llama 3-V模型的團(tuán)隊(duì)成員 Aksh Garg 在社交平臺(tái)X上發(fā)帖介紹了這一模型。該帖很快閱讀量便超過(guò)30萬(wàn),Llama 3-V 也很快沖上了全球知名開(kāi)源社區(qū)HuggingFace的趨勢(shì)榜首頁(yè)。
隨后,有熱心網(wǎng)友發(fā)現(xiàn),Llama 3-V與清華系大模型創(chuàng)業(yè)公司面壁智能的MiniCPM-Llama3-V 2.5在模型結(jié)構(gòu)、代碼、配置文件等方面幾乎一模一樣,只是斯坦福AI團(tuán)隊(duì)將其中的變量名稱做了更改。該網(wǎng)友更是直接將相關(guān)的關(guān)鍵證據(jù)一一截圖,進(jìn)行列舉證明。
簡(jiǎn)言之,Llama3-V疑似套殼抄襲了面壁智能的MiniCPM-Llama3-V 2.5。發(fā)現(xiàn)了這一問(wèn)題的網(wǎng)友在Llama3-V頁(yè)面上提出了質(zhì)疑,但Llama3-V頁(yè)面很快就被作者刪除了。目前,Llama3-V 的GitHub項(xiàng)目主頁(yè)已顯示為“404”,HuggingFace上的Llama3-V項(xiàng)目已不可見(jiàn)。作者社交媒體賬號(hào)上,此前宣傳Llama3-V的內(nèi)容頁(yè)已經(jīng)遭到刪除。
6月3日,Aksh Garg在其社交平臺(tái)上發(fā)文回應(yīng)了質(zhì)疑,他艾特另外兩名成員Siddharth Sharma和Mustafa Aljadery,并表示:“我和Siddharth都忙于自己的全職工作,所以Mustafa為該項(xiàng)目編寫了所有代碼。我倆都對(duì)多模態(tài)模型感到非常興奮,并且喜歡他向我們描述的架構(gòu)擴(kuò)展,所以我們幫助他推廣該產(chǎn)品。”他還進(jìn)一步表示:“在看到這些(抄襲)指控后,我們與Mustafa討論了Llama3-V的原創(chuàng)性證明,并要求提供訓(xùn)練代碼,但到目前為止還沒(méi)有看到任何證據(jù)。我們向原作者道歉,也對(duì)自己沒(méi)有盡職盡責(zé)地驗(yàn)證其作品的原創(chuàng)性感到非常失望。”
公開(kāi)資料顯示,Siddharth Sharma與Aksh Garg都是斯坦福大學(xué)計(jì)算機(jī)系的本科生,發(fā)表過(guò)數(shù)篇機(jī)器學(xué)習(xí)相關(guān)的論文。Siddharth Sharma曾在亞馬遜實(shí)習(xí)過(guò)一段時(shí)間,目前主要從事與AI和數(shù)據(jù)相關(guān)工作。Aksh Garg 則在SpaceX、斯坦福大學(xué)和加州理工學(xué)校等知名企業(yè)機(jī)構(gòu)都實(shí)習(xí)過(guò)。Aksh Garg 所說(shuō)的“編寫了所有代碼”的Mustafa Aljadery則就讀于南加州大學(xué),目前其社交平臺(tái)X 賬號(hào)已被設(shè)為隱私狀態(tài)。
值得注意的是,斯坦福 AI 實(shí)驗(yàn)室主任 Christopher David Manning 在社交平臺(tái)發(fā)帖譴責(zé)了抄襲行為,同時(shí)還對(duì)清華的開(kāi)源模型表達(dá)了贊賞。
這一事件中的另外一個(gè)主角面壁智能也進(jìn)行了公開(kāi)回應(yīng)。面壁智能CEO李大海在其朋友圈中發(fā)文表示:“技術(shù)創(chuàng)新不易,每一項(xiàng)工作都是團(tuán)隊(duì)夜以繼日的奮斗結(jié)果,也是以有限算力對(duì)全世界技術(shù)進(jìn)步與創(chuàng)新發(fā)展作出的真誠(chéng)奉獻(xiàn)。我們希望團(tuán)隊(duì)的好工作被更多人關(guān)注與認(rèn)可,但不是以這種方式。我們對(duì)這件事深表遺憾!一方面感慨這也是一種受到國(guó)際團(tuán)隊(duì)認(rèn)可的方式,另一方面也呼吁大家共建開(kāi)放、合作、有信任的社區(qū)環(huán)境。一起加油合作,讓世界因AGI的到來(lái)變得更好。”
公開(kāi)資料顯示,面壁智能成立于2022年8月,專注于大模型技術(shù)創(chuàng)新與應(yīng)用轉(zhuǎn)化。創(chuàng)始團(tuán)隊(duì)主要來(lái)自于清華大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室(THUNLP),公司CEO李大海是知乎首席技術(shù)官(CTO),聯(lián)合創(chuàng)始人劉知遠(yuǎn)是清華大學(xué)計(jì)算機(jī)系副教授、博士生導(dǎo)師。
天眼查顯示,面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數(shù)千萬(wàn)人民幣天使輪融資;今年4月,公司宣布完成新一輪數(shù)億元融資,由春華創(chuàng)投、華為哈勃領(lǐng)投,北京市人工智能產(chǎn)業(yè)投資基金等跟投,知乎作為戰(zhàn)略股東持續(xù)跟投支持。
值得注意的是,李大海曾表示面壁智能是他作為知乎CTO發(fā)起的唯一一個(gè)項(xiàng)目。作為中等梯隊(duì)的互聯(lián)網(wǎng)上市企業(yè),知乎面對(duì)全新的技術(shù)浪潮,想要熱情擁抱,又無(wú)法如創(chuàng)業(yè)公司一樣全情投入其中,于是選中面壁智能,作為AI大模型浪潮中對(duì)知乎技術(shù)力量的補(bǔ)充。而知乎所掌握大量中文互聯(lián)網(wǎng)優(yōu)質(zhì)語(yǔ)料,也為面壁智能開(kāi)展大模型訓(xùn)練提供了豐富的數(shù)據(jù)。
去年4月,知乎與面壁智能宣布聯(lián)合研發(fā)的首個(gè)中文大模型“知海圖AI”和應(yīng)用“熱榜摘要”正式面世。除此以外,雙方在面壁智能研發(fā)的中文基座大模型CPM-Bee10b、對(duì)話類模型產(chǎn)品“面壁露卡”,以及內(nèi)測(cè)第二款知乎場(chǎng)景下的模型應(yīng)用“搜索聚合”等方面,也開(kāi)展了廣泛深入的合作。