日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

龙芯3A5000评测 国产自主指令集架构实战

發(fā)布時(shí)間:2023/11/29 综合教程 34 生活家
生活随笔 收集整理的這篇文章主要介紹了 龙芯3A5000评测 国产自主指令集架构实战 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

芯片器件中最著名的產(chǎn)物是CPU,國(guó)內(nèi)CPU行業(yè)經(jīng)歷步履維艱的發(fā)展,關(guān)注度越來(lái)越高,在政務(wù)、通訊、計(jì)算等領(lǐng)域經(jīng)??梢钥吹絿?guó)產(chǎn)CPU的身影。但通用CPU領(lǐng)域還是國(guó)外CPU占據(jù)主導(dǎo)。桌面端有英特爾和AMD,移動(dòng)端有ARM和高通等企業(yè),國(guó)產(chǎn)CPU想要突出重圍并不容易。

這些年國(guó)內(nèi)CPU企業(yè)在不斷發(fā)展的同時(shí)也在尋找破局之法,國(guó)內(nèi)CPU廠商最常見(jiàn)的發(fā)展模式是購(gòu)買(mǎi)指令集架構(gòu)授權(quán),ARM、MIPS甚至X86均有國(guó)內(nèi)CPU企業(yè)獲得了授權(quán)。購(gòu)買(mǎi)指令集架構(gòu)授權(quán)無(wú)疑是一種高效的手段,相當(dāng)于在別人準(zhǔn)備好地基的土地上建房子,產(chǎn)品不能稱(chēng)為完全國(guó)產(chǎn)自主。

不過(guò)授權(quán)終究是授權(quán),沒(méi)有相應(yīng)產(chǎn)權(quán)的保護(hù),依舊可能會(huì)受到制約。

在2021年4月,龍芯中科率先在國(guó)產(chǎn)自主化跨出一步,宣布推出完全自主指令集架構(gòu):LoongArch,頂層架構(gòu)到指令功能和ABI標(biāo)準(zhǔn)完全自主。這表明龍芯中科未來(lái)的CPU不再使用MIPS指令集架構(gòu),從今年推出的3A5000開(kāi)始都將使用LoongArch架構(gòu),這無(wú)疑是芯片國(guó)產(chǎn)化的重要里程。

我們參照官方的資料,做了一下龍芯3A5000的微架構(gòu)圖,可以粗略看到3A5000大體分為4個(gè)區(qū)塊,每個(gè)區(qū)塊包含一個(gè)核心和一個(gè)緩存。

根據(jù)官方的資料,LoongArch依舊屬于RISC陣營(yíng),擁有RISC的特點(diǎn),比如32位定長(zhǎng)指令,32個(gè)通用寄存器,32個(gè)浮點(diǎn)/向量寄存器。但LoongArch也進(jìn)行了改進(jìn),取消了RISC的指令延遲槽,直接跳轉(zhuǎn)指令的目標(biāo)地址相對(duì)PC計(jì)算,增加相對(duì)轉(zhuǎn)移偏移量。

LoongArch 擁有近2000條指令,并充分考慮兼容需求,相同的源代碼編譯成LoongArch比編譯成龍芯此前支持的MIPS時(shí)動(dòng)態(tài)執(zhí)行指令數(shù)減少10%-20%,也就是運(yùn)行效率更高,性能也會(huì)提升。

LoongArch還深入研究了MIPS、X86、ARM的特性,能對(duì)這些主流架構(gòu)進(jìn)行二進(jìn)制翻譯,對(duì)MIPS可以實(shí)現(xiàn)100%的翻譯,能實(shí)現(xiàn)跨平臺(tái)兼容,龍芯目標(biāo)是在2025年的時(shí)候消除指令集之間的壁壘。

2021年7月,龍芯中科發(fā)布了兩款基于LoongArch指令集架構(gòu)的處理器:3A5000和3C5000L。3A5000處理器是面向桌面端的產(chǎn)品,3C5000L則是服務(wù)器處理器。3A5000主頻為2.3Ghz-2.5GHz,擁有4顆核心,每個(gè)處理器核心采用 64 位 LA464 自主微結(jié)構(gòu),支持DDR4-3200MHz內(nèi)存,支持Hyper Transport 3.0控制器。3C5000L則由4個(gè)3A5000封裝,擁有16個(gè)核心。

3A5000處理器內(nèi)置了安全模塊,可以對(duì)Meltdown(熔斷)和Spectre(幽靈)兩個(gè)經(jīng)典CPU漏洞有效免疫,與上一代3A4000一樣支持內(nèi)置加解密算法和安全可信模塊,也是目前唯一通過(guò)國(guó)內(nèi)商密二級(jí)型號(hào)鑒定測(cè)試的CPU內(nèi)置模塊。

龍芯3A5000通用處理器主要應(yīng)用在消費(fèi)級(jí)桌面市場(chǎng),未來(lái)會(huì)推出包括臺(tái)式機(jī)、筆記本、一體機(jī)等產(chǎn)品,這次我們拿到了搭載3A5000處理器的臺(tái)式整機(jī)產(chǎn)品,龍芯3A5000整機(jī)在外觀上采用經(jīng)典的商用辦公主機(jī)風(fēng)格,以黑色為主格調(diào),前面板提供一個(gè)常規(guī)開(kāi)關(guān)按鈕,兩個(gè)USB 2.0接口,兩個(gè)音頻輸入/輸出接口。


龍芯3A5000整機(jī)

主板I/O處,提供一個(gè)VGA視頻口,一個(gè)串行COM接口,4個(gè)USB 2.0接口,2個(gè)USB 3.2 Gen1 5Gbps接口,一個(gè)有線網(wǎng)口。


主板I/O

其他配件上,這臺(tái)主機(jī)使用了256GB的SATA固態(tài),雙8GB DDR4 3200MHz內(nèi)存。顯卡為AMD RadeonHD 8750M,顯卡I/O提供一個(gè)VGA接口,一個(gè)HDMI接口。


紫光國(guó)芯(UnilC)2*8GB DDR4 3200MHz內(nèi)存


AMD RadeonHD 8750M

卸下散熱器,可以看到這次的主角:龍芯3A5000,龍芯3A5000的芯片代號(hào)為“KMYC70”,這樣命名是紀(jì)念抗美援朝70年,而服務(wù)器3C5000L芯片代號(hào)則為“CPC100”以慶祝建黨100周年。

這臺(tái)主機(jī)中,龍芯3A5000直接焊接封裝在主板上,不支持DIY更換。

編譯器方面,龍芯3A5000配套的三大編譯器GCC、LLVM、GoLang和三大虛擬機(jī)Java、JavaScript、.NET均已完成開(kāi)發(fā),龍芯自家基礎(chǔ)版操作系統(tǒng)Loongnix和面向工控領(lǐng)域的LoongOS已經(jīng)發(fā)布,不過(guò)我們手里這臺(tái)龍芯3A5000整機(jī)使用的為統(tǒng)信UOS系統(tǒng),因?yàn)閮?yōu)化等問(wèn)題,會(huì)與Loongnix及其他系統(tǒng)的龍芯3A5000主機(jī)性能有差異。


主機(jī)配置

統(tǒng)信UOS系統(tǒng)由多家國(guó)內(nèi)操作系統(tǒng)核心企業(yè)自愿發(fā)起并研發(fā)完善的安全、易用、穩(wěn)定的操作系統(tǒng)產(chǎn)品,也是未來(lái)芯片國(guó)產(chǎn)化的生態(tài)關(guān)鍵一步。其官網(wǎng)目前已經(jīng)開(kāi)放下載,有興趣的用戶可以自行去官網(wǎng)下載嘗試。那么除了統(tǒng)信UOS操作系統(tǒng)之外,實(shí)際上國(guó)內(nèi)自主開(kāi)發(fā)的操作系統(tǒng)麒麟Kylin龍芯版也是不錯(cuò)的選擇。

此次參與測(cè)試的處理器除了龍芯3A5000之外,還增加了inteli59500 六核 14nm處理器、國(guó)產(chǎn)ARM V8 四核 7nm處理器和國(guó)產(chǎn)ARM V8 八核 14nm處理器作為對(duì)比參考,整機(jī)主要的硬件參數(shù)保持一致。

其中, intel i5 9500 六核 14nm架構(gòu)處理器主頻3.0-4.4Ghz,熱設(shè)計(jì)功耗65W。國(guó)產(chǎn)ARM V8 四核 7nm處理器主頻可達(dá)2.6GHz,單芯片可支持64核。另一款國(guó)產(chǎn)ARM V8 八核 14nm處理器,兼容64位ARMv8指令集,主頻2.3GHz。

需要提前說(shuō)明的是,參與測(cè)試的四款處理器核心數(shù)量并非一致,因此在多核測(cè)試項(xiàng)目中我們?nèi)√幚砥鞯淖疃嗪藬?shù)成績(jī)。

基準(zhǔn)測(cè)試

下面我們正式開(kāi)始測(cè)試,首先依然選擇大眾熟悉的UnixBench測(cè)試工具。這款軟件是一個(gè)類(lèi) Unix(Unix,BSD,Linux)系統(tǒng)下的性能測(cè)試工具,被廣泛用于測(cè)試 Linux 系統(tǒng)主機(jī)的性能??梢詼y(cè)試系統(tǒng)調(diào)用、讀寫(xiě)、進(jìn)程、圖形化測(cè)試等成績(jī),也是一個(gè)全方面考驗(yàn)整機(jī)的軟件。


UnixBench單核、多核性能測(cè)試

從測(cè)試結(jié)果可以看到,龍芯3A5000和國(guó)產(chǎn)ARM V8 四核 7nm這款處理器的性能表現(xiàn)都很出色,龍芯3A5000單核性能達(dá)到了1685分,相比上一代龍芯3A4000提升非常明顯,單核性能已逼近了intel i5 9500 六核 14nm這款處理器的水平。這一點(diǎn)也正符合龍芯先通過(guò)設(shè)計(jì)優(yōu)化提高單核性能,再利用先進(jìn)工藝增加核數(shù)的升級(jí)策略。

多核性能對(duì)比中,龍芯3A5000達(dá)到4314分與國(guó)產(chǎn)ARM V8 四核 7nm的4387分基本持平,但如果與intel i5 9500 六核 14nm對(duì)比還是有不小差距。不過(guò),4核龍芯3A5000反而比國(guó)產(chǎn)ARM V8 八核 14nm這款處理器的性能高出了600多分。

接下來(lái)我們進(jìn)行SPEC 2006對(duì)比測(cè)試,SPEC 2006是一個(gè)大型的CPU性能測(cè)試項(xiàng)目,重點(diǎn)測(cè)試系統(tǒng)的處理器,內(nèi)存子系統(tǒng)和編譯器。能夠測(cè)試CPU最基礎(chǔ)的定點(diǎn)性能和浮點(diǎn)性能。同樣需要提前說(shuō)明的是,測(cè)試處理器由于核心數(shù)量并不對(duì)等,因此我們?cè)诙嗪藴y(cè)試環(huán)節(jié)選擇最多核數(shù)的成績(jī)。


SPEC CPU2006 BASE性能測(cè)試

本次我們將SPEC 2006測(cè)試分為單核與多核測(cè)試。龍芯3A5000單核定點(diǎn)為25.1分,單核浮點(diǎn)為26分。相比intel i5 9500 六核 14nm這款處理器的確有不小的差距,但單核定點(diǎn)與國(guó)產(chǎn)ARM V8 四核 7nm這款處理器不相上下,單核浮點(diǎn)略優(yōu)于國(guó)產(chǎn)ARM V8 四核 7nm這款處理器。龍芯3A5000對(duì)比國(guó)產(chǎn)ARM V8 八核 14nm處理器的單核定點(diǎn)則高出近10分,單核浮點(diǎn)則高出近一倍。

多線程測(cè)試中,intel i5 9500 六核 14nm處理器依然表現(xiàn)最佳,而龍芯3A5000的多核定點(diǎn)與多核浮點(diǎn)均高于國(guó)產(chǎn)ARM V8 四核 7nm處理器,由于國(guó)產(chǎn)ARM V8 八核 14nm處理器核心數(shù)量上具有一定的優(yōu)勢(shì),因此定點(diǎn)和浮點(diǎn)的分?jǐn)?shù)要高于龍芯3A5000和國(guó)產(chǎn)ARM V8 四核 7nm處理器。

Stream是業(yè)界主流的內(nèi)存帶寬測(cè)試程序,測(cè)試行為相對(duì)簡(jiǎn)單可控。 該程序?qū)PU的計(jì)算能力要求很小,對(duì)CPU內(nèi)存帶寬壓力很大。 隨著處理器核心數(shù)量的增大,而內(nèi)存帶寬并沒(méi)有隨之成線性增長(zhǎng),因此內(nèi)存帶寬對(duì)提升多核心的處理能力就越發(fā)重要。


Stream內(nèi)存測(cè)試

在Stream Copy測(cè)試子項(xiàng)性能中,龍芯3A5000的表現(xiàn)相當(dāng)出色,已超過(guò)了intel i5 9500 六核 14nm處理器。其中Copy單線性能獲得16864分,多線性能獲得21873分。國(guó)產(chǎn)ARM V8 八核 14nm處理器和國(guó)產(chǎn)ARM V8 四核 7nm處理器分?jǐn)?shù)相差不大,但Copy的整體表現(xiàn)比龍芯3A5000稍遜一籌。

應(yīng)用測(cè)試

實(shí)際上,除了處理器的單核與多核的基準(zhǔn)性能測(cè)試之外,用戶軟件應(yīng)用體驗(yàn)則可以更直觀反應(yīng)處理器之間的性能差異,下面我們就來(lái)實(shí)測(cè)一下辦公常用WPS、瀏覽器與視頻播放器方面的應(yīng)用體驗(yàn)。

我們將搭載四款處理器的主機(jī)安裝上同樣版本的統(tǒng)信UOS操作系統(tǒng),然后用WPS辦公軟件分別打開(kāi)10MB(文本+圖片)、50M(文本+圖片)以及 50M(文本+圖片+視頻)單個(gè)大容量文件,重點(diǎn)測(cè)試打開(kāi)文檔速度來(lái)衡量處理器的性能,為了盡可能保證測(cè)試數(shù)據(jù)樣本的規(guī)律性,每個(gè)文檔均打開(kāi)5次后取平均值。


WPS辦公軟件打開(kāi)文檔速度對(duì)比(時(shí)間越短越好)

通過(guò)實(shí)際測(cè)試可以看到,10MB(文本+圖片)文檔打開(kāi)速度中,國(guó)產(chǎn)ARM V8 八核 14nm處理器用時(shí)最短為1.47秒,龍芯3A5000打開(kāi)速度為1.54秒。50M(文本+圖片)打開(kāi)速度中,國(guó)產(chǎn)ARM V8 四核 7nm處理器用時(shí)最長(zhǎng)為3.01秒,50M(文本+圖片+視頻)測(cè)試中,國(guó)產(chǎn)ARM V8 八核 14nm處理器則用時(shí)最長(zhǎng)為4.24秒,intel i5 9500 六核 14nm處理器用時(shí)最短為2.23秒。綜合來(lái)看,intel i5 9500 六核 14nm處理器的整體表現(xiàn)較好,而龍芯3A5000略好于國(guó)產(chǎn)ARM V8 四核 7nm處理器,國(guó)產(chǎn)ARM V8 八核 14nm處理器小容量文件打開(kāi)文件速度較好,但是大文檔打開(kāi)速度上不夠理想。

瀏覽器是我們?nèi)粘S^看網(wǎng)頁(yè)信息和視頻的重要應(yīng)用,目前每個(gè)網(wǎng)頁(yè)基本上都充斥著大量的圖形,對(duì)于CPU運(yùn)行也會(huì)打來(lái)不小的負(fù)荷壓力。下面我們就來(lái)測(cè)試一下四款處理器在瀏覽器上的性能表現(xiàn)。我們同時(shí)打開(kāi)瀏覽器并加載愛(ài)奇藝視頻網(wǎng)站,對(duì)比一下打開(kāi)時(shí)間。由于龍芯自家提供有Loongnix瀏覽器,因此龍芯3A5000選擇自家龍芯瀏覽器V3.1,而其他均選擇火狐瀏覽器進(jìn)行測(cè)試。


瀏覽器打開(kāi)愛(ài)奇藝網(wǎng)站速度(時(shí)間越短越好)單位:秒

由于愛(ài)奇藝網(wǎng)站中存在視頻、圖片、CSS、JavaScript等等,因此加載頁(yè)面對(duì)處理器性能也提出一定的要求。通過(guò)測(cè)試可以看到intel i5 9500 六核 14nm處理器加載速度表現(xiàn)較好用時(shí)1.4秒,龍芯3A5000的1.78秒也很不錯(cuò),最長(zhǎng)用時(shí)的則是國(guó)產(chǎn)ARM V8 八核 14nm處理器用時(shí)2.35秒。

最后對(duì)比測(cè)試的是影音播放性能,我們選擇統(tǒng)信UOS操作系統(tǒng)下的默認(rèn)視頻播放器,并打開(kāi)同樣大小的1080P視頻mp4格式,分別測(cè)試四款處理器加載視頻的時(shí)間。


影院播放器加載1080P MP4視頻時(shí)間(時(shí)間越短越好)單位:秒

通過(guò)實(shí)測(cè)可以看到,國(guó)產(chǎn)ARM V8 四核 7nm處理器加載速度最快為1.43秒,龍芯3A5000為1.64秒緊隨其后,最慢的則是國(guó)產(chǎn)ARM V8 八核 14nm處理器用時(shí)2.09秒。此外值得一提是,由于龍芯3A5000處理器性能提升顯著,因此在播放4K高清視頻的軟解能力也得到進(jìn)一步提升,在脫離獨(dú)顯的情況下依然可以流暢播放高清視頻。

長(zhǎng)久以來(lái),龍芯中科的目標(biāo)是讓中國(guó)人用上完全自主的CPU處理器,二十年風(fēng)華歲月,彈指一揮間,LoongArch的出現(xiàn)讓龍芯離這個(gè)目標(biāo)邁進(jìn)了一大步,這也不僅僅是龍芯的突破,也是中國(guó)自主CPU行業(yè)的新里程碑。

基于自主指令系統(tǒng)LoongArch的龍芯3A5000性能表現(xiàn)非常讓人滿意,短期內(nèi)的短板是生態(tài)建設(shè),應(yīng)用軟件適配還需要加強(qiáng)。盡管作為過(guò)渡階段,龍芯的二進(jìn)制翻譯系統(tǒng)LAT可以實(shí)現(xiàn)跨指令平臺(tái)應(yīng)用兼容,也能夠運(yùn)行部分X86/Windows應(yīng)用軟件,但要想實(shí)現(xiàn)滿足各種應(yīng)用需求的龐大軟件生態(tài),仍需要國(guó)內(nèi)軟件廠商的群策群力。

生態(tài)涉及的復(fù)雜程度有時(shí)候會(huì)比單一技術(shù)還要令人頭痛,CPU生態(tài)需要硬件、系統(tǒng)和用戶作為支持,硬件上龍芯已經(jīng)有了LoongArch加持的龍芯3A5000,系統(tǒng)方面有統(tǒng)信UOS、麒麟Kylin等國(guó)產(chǎn)操作系統(tǒng)的適配。LoongArch目前最需要的是用戶,用戶不僅包括消費(fèi)者,也包括開(kāi)發(fā)者,沒(méi)有開(kāi)發(fā)者帶來(lái)的軟件生態(tài)支持,就不會(huì)有大量消費(fèi)者買(mǎi)單,沒(méi)有用戶消費(fèi)就沒(méi)有資金繼續(xù)研發(fā),所以LoongArch大力推廣生態(tài)是當(dāng)下最重要的一步。

蘋(píng)果M1被認(rèn)為可以威脅到英特爾和Windows,也是因?yàn)橛脩艋鶖?shù)龐大,加上全球上千萬(wàn)的iOS開(kāi)發(fā)者,才能成為CPU行業(yè)的黑馬。

有些用戶可能比較難理解,為啥我們CPU做了那么多年,國(guó)內(nèi)CPU生態(tài)還是建立不起來(lái)。這里筆者舉個(gè)例子,前段時(shí)間有消息稱(chēng)英特爾要在歐洲建立一座晶圓廠,投入是多少呢?消息顯示英特爾整個(gè)生命周期內(nèi)總投資或?qū)⒊^(guò)1000億美元,即使包括一些國(guó)家的政策補(bǔ)貼,英特爾每年在芯片研發(fā)上也有百億美元投入。國(guó)內(nèi)CPU整個(gè)行業(yè)實(shí)際投入都遠(yuǎn)低于英特爾這樣的企業(yè),根本不能滿足所有芯片企業(yè)的需求,大多只勉強(qiáng)維持研發(fā)。

而且,國(guó)外CPU和操作系統(tǒng)在軟件生態(tài)、產(chǎn)業(yè)體系上磨合了幾十年。正所謂差之毫厘,謬之千里,一個(gè)微小細(xì)節(jié)失誤就會(huì)讓一條億萬(wàn)投入的產(chǎn)品線作廢,沒(méi)有資本必然玩不轉(zhuǎn),門(mén)檻高,難入行,久而久之活下來(lái)的越來(lái)越少。

在這樣的環(huán)境下,龍芯能夠推出自主化指令集架構(gòu)LoongArch實(shí)屬不易,準(zhǔn)確的說(shuō)像龍芯這樣現(xiàn)在還堅(jiān)持做國(guó)產(chǎn)自主芯片的企業(yè)都值得尊敬。

不經(jīng)一番寒徹骨,怎得梅花撲鼻香,自主之路無(wú)比艱難,龍芯這份勇氣令人贊嘆?,F(xiàn)在龍芯已經(jīng)踏出最艱難的第一步,接下來(lái)就是生態(tài)體系的建立。目前龍芯中科已經(jīng)建立LoongArch社區(qū),同時(shí)將會(huì)組建LoongArch聯(lián)盟,免費(fèi)開(kāi)放LoongArch,希望更多的開(kāi)發(fā)者可以參與其中,讓國(guó)產(chǎn)自主CPU走的更遠(yuǎn),期待龍芯中科為我們帶來(lái)全新自主的國(guó)產(chǎn)CPU生態(tài)領(lǐng)域。

總結(jié)

以上是生活随笔為你收集整理的龙芯3A5000评测 国产自主指令集架构实战的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。