国语自产偷成人精品视频,国产女人高潮叫床男人桶到爽,香港三日本8a三级少妇三级99,在线观看电影,久久99精品久久久久久

AMD架構(gòu)創(chuàng)新成果:最新AI系統(tǒng)比2020年的產(chǎn)品能效提高28.3倍

AMD架構(gòu)創(chuàng)新成果:最新AI系統(tǒng)比2020年的產(chǎn)品能效提高28.3倍

段雅柔 2024-12-11 行業(yè)新聞 9 次瀏覽 0個評論

  來源:IT之家

  12 月 11 日消息,AMD 早在 2021 年就制定了“到 2025 年將 EPYC 處理器和 Instinct 加速器的能效提高 30 倍”的目標(biāo)。

  根據(jù) AMD 官方的說法,雖然還沒到 2025 年,但他們現(xiàn)在距離這一成果已經(jīng)只差臨門一腳:配備最新 EPYC 9575F?和 Instinct MI300X 的機(jī)器相比?2020 年一臺未公開的機(jī)器能效提高了 28.3 倍。

  AMD 在測試中使用了?Llama3.1-70B(vLLM 0.6.1.post2、TP8 Parallel、FP8、連續(xù)批處理)模型,然后對比其推理性能的差異。

  AMD 并未透露其測試中用到的這套 2020 年硬件規(guī)格,但很顯然基于?Zen 2 系列的 EPYC 7002 處理器(單個 CPU 最多 64 核)以及基于初代 CDNA 架構(gòu)的 Instinct MI100 加速器。

  AMD 還表示,除了“給力”的硬件提升之外,這一成績是通過架構(gòu)改進(jìn)和軟件優(yōu)化綜合實(shí)現(xiàn)的成果,這是可以預(yù)料到的結(jié)果。

  該公司最近剛推出了基于 CDNA 3 架構(gòu)的 Instinct MI325X 加速器,配備了 288 GB HBM3E 內(nèi)存子系統(tǒng);AMD 明年還將推出基于 CDNA 4 架構(gòu)的 Instinct MI355X,與 MI325X 相比性能(FP8 和 FP16)將提高約 80%。

  除了 FP8 和 FP16 外,MI325X 還將支持 FP4 和 FP6 格式,其峰值性能將達(dá)到 9.2 PetaFLOPS(FP4),這對于許多大語言模型來說非常實(shí)用。也就是說,AMD 要想實(shí)現(xiàn)在 2025 年實(shí)現(xiàn)其計(jì)算平臺能效提高 30 倍的目標(biāo)并不難。

  AMD 高級副總裁、AMD 公司研究員和產(chǎn)品技術(shù)架構(gòu)師 Sam Naffziger 表示,“通過我們對硬件和軟件協(xié)同設(shè)計(jì)中深思熟慮的方法,我們對實(shí)現(xiàn) 30x25 目標(biāo)很有信心,并對未來充滿期待,我們已經(jīng)看到了在未來幾年內(nèi)實(shí)現(xiàn)大幅能效提升的有效途徑。”

你可能想看:

轉(zhuǎn)載請注明來自河南地坪一站式服務(wù)商,本文標(biāo)題:《AMD架構(gòu)創(chuàng)新成果:最新AI系統(tǒng)比2020年的產(chǎn)品能效提高28.3倍》

每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

評論列表 (暫無評論,9人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
網(wǎng)站統(tǒng)計(jì)代碼