国产chinesehd精品酒店,邱淑贞aa极毛片,国产在线色视频,玖玖爱zh综合伊人久久

AMD發(fā)布首個AI小語言模型:6900億token amd aib

更新時間:2024-10-03 14:56:21作者:佚名

AMD發(fā)布首個AI小語言模型:6900億token amd aib

  AMD發(fā)布了自己的首個小語言模型(SLM),名為“AMD-135M”。

  相比于越來越龐大的大語言模型(LLM),它體積小巧,更加靈活,更有針對性,非常適合私密性、專業(yè)性很強的企業(yè)部署。

  AMD-135小模型隸屬于Llama家族,有兩個版本:

  一是基礎(chǔ)型“AMD-Llama-135M”,擁有多達6700億個token,在八塊Instinct MIM250 64GB加速器上訓練了六天。

  二是延伸型“AMD-Llama-135M-code”,額外增加了專門針對編程的200億個token,同樣硬件訓練了四天。

  它使用了一種名為“推測解碼”(speculative decoding)的方法,通過較小的草稿模型,在單次前向傳播中生成多個候選token,然后發(fā)送給更大的、更精確的目標模型,進行驗證或糾正。

  這種方法可以同時生成多個token,不會影響性能,還可以降低內(nèi)存占用,但因為數(shù)據(jù)交易更多,功耗也會增加。

  AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型,測試了推測解碼使用與否的性能。

  比如在MI250加速器上,性能可提升最多約2.8倍,銳龍AI CPU上可提升最多約3.88倍,銳龍AI NPU上可提升最多約2.98倍。

  AMD-135M小模型的訓練代碼、數(shù)據(jù)集等資源都已經(jīng)開源,遵循Apache 2.0。

  按照AMD的說法,它的性能與其他開源小模型基本相當或略有領(lǐng)先,比如Hellaswag、SciQ、ARC-Easy等任務超過Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務則基本類似GTP2-124MN、OPT-125M。

本文標簽: 首個  模型  語言  

為您推薦

AMD發(fā)布首個AI小語言模型:6900億token amd aib

AMD發(fā)布首個AI小語言模型:6900億token

2024-10-03 14:56

iphone定位是gps還是北斗(蘋果定位是北斗嗎)

1、iphone定位是gps。2、GPS是英文Global Positioning System(全球定位系統(tǒng))的簡稱。GPS起始于1958年美國軍方的一個項目,1964年投入使用。20世紀70年代,美國陸??杖娐?lián)合研

2024-09-30 07:37

越獄版IOS5.0的五筆輸入法安裝方法 越獄版ios5.0的五筆輸入法安裝方法下載

越獄版IOS5.0的五筆輸入法安裝方法 很多朋友在找5.0可以用的五筆輸入法,可惜第三方的都沒有出來,綜合網(wǎng)上的其他方法,我找到一個簡單的方法以,共大家參考。

2024-09-30 00:04

ios5.0.1升級5.1設置右上角一直出現(xiàn)1問題的解決方法

ios5.0.1升級5.1設置右上角一直出現(xiàn)1問題的解決方法 對于手持5.01固件設備的同學。近幾天手機上應該都會收到官方的提示升級了。而很大一部分因為各種原因

2024-09-30 00:03

蘋果11可使用北斗導航嗎(蘋果11可使用北斗導航嗎怎么設置)

1、北斗導航蘋果版:蘋果手機不支持,作為國產(chǎn)衛(wèi)星定位系統(tǒng)的北斗導航系統(tǒng),是由三部分組成,衛(wèi)星、地面控制站和用戶接收機。從目前蘋果手機的參數(shù)頁面來看,蘋果手機不支持國產(chǎn)北斗導航系統(tǒng),卻支持比北斗差的日本導航系統(tǒng),和歐洲伽利

2024-09-29 21:38

充手機怎么充的快 手機怎樣充的更快

1、打開飛行模式 在充電的時候,可以打開手機的飛行模式,這樣會停止網(wǎng)絡信號,不能打電話發(fā)信息上網(wǎng),給手機足夠的空間,這樣充電的速度也就大大提升了,等到電充足夠了再把飛行模式關(guān)閉即可。2、卸掉手機殼 現(xiàn)在很多人為了保護手機

2024-09-29 19:29