基準(zhǔn)程序評測方法與Tensilica處理器性能評價
出處:維庫電子市場網(wǎng) 發(fā)布于:2023-06-20 11:33:50
基準(zhǔn)程序評測方法是微處理器性能評價的重要尺度。本文在介紹基準(zhǔn)測試程序的基礎(chǔ)上,重點對CPU基準(zhǔn)測試、嵌入式處理器和媒體處理器基準(zhǔn)程序測試進行了分析,并給出了Tensilica微處理器與其它幾款當(dāng)今重要的微處理器的EEMBC和BDTI評測結(jié)果。
嵌入式和媒體基準(zhǔn)測試程序包括EDN嵌入式微處理器測試程序組EEMBC(嵌入式微處理器基準(zhǔn)測試協(xié)會)、BDTI基準(zhǔn)測試程序組、MediaBench測試程序組以及MiBench基準(zhǔn)測試程序組。其中,EEMBC、BDTI已經(jīng)稱為嵌入式處理器和媒體處理器評測事實上的標(biāo)準(zhǔn)。
EEMBC主要是開發(fā)和驗證現(xiàn)實世界的基準(zhǔn)測試和基準(zhǔn)測試得分,幫助設(shè)計師選擇與系統(tǒng)適用的嵌入式處理器。提交EEMBC進行基準(zhǔn)測試的所有處理器都需要進行代表不同載荷和性能參數(shù)的多項測試,如通信、網(wǎng)絡(luò)、消費、辦公自動化、汽車/工業(yè)、嵌入式Java和微控制器相關(guān)的應(yīng)用。EEMBC的成員包括的半導(dǎo)體、IP供應(yīng)商和編譯器公司,EEMBC建立了基準(zhǔn)測試標(biāo)準(zhǔn),并通過EEMBC驗證實驗室(ECL)提供通過了驗證的基準(zhǔn)測試結(jié)果。
MediaBench基準(zhǔn)測試程序主要來自圖像處理、通信和DSP應(yīng)用領(lǐng)域。例如JPEG、MPEG、 GSM、G.721話音壓縮、Ghostscript和ADPCM。JPEG主要是圖像壓縮,MPEG用于視頻傳輸中的編解碼。Ghostscript是Postscript語言解釋器,ADPCM用于自適應(yīng)差分脈沖編碼調(diào)整。
MiBench是一個自由的嵌入式基準(zhǔn)測試程序組,同EEMBC類似。由于EEMBC不對專用研究人員自由開發(fā),故密執(zhí)安的研究人員對35個嵌入式程序進行編譯,形成了MiBench基準(zhǔn)測試程序組。以EEMBC為模型,MiBench分成6類:汽車電子、消費類電子、網(wǎng)絡(luò)、辦公自動化、信息安全和電信。所有程序均采用C語言寫成。MiBench可以和任何嵌入式平臺接口,因為所有測試均是源碼開放的。
EEMBC(EDN嵌入式微處理器基準(zhǔn)組)基準(zhǔn)測試程序組主要對嵌入式微處理器進行性能評測。EEMBC評測程序包括一系列能夠反映實際的嵌入式應(yīng)用領(lǐng)域。這些基準(zhǔn)程序主要針對汽車電子、工業(yè)控制、消費電子、網(wǎng)絡(luò)應(yīng)用、辦公自動化以及電信等領(lǐng)域。尤其重要的是,EEMBC對機器控制、數(shù)碼相機、打印機、無線蜂窩電話、調(diào)制解調(diào)器等與嵌入式微處理器相關(guān)的應(yīng)用非常適合。
EEMBC論壇從上述應(yīng)用中得到了37個獨立的算法,從而構(gòu)成了EEMBC的個版本。事實上,EEMBC業(yè)已稱為嵌入式處理器評測的業(yè)界標(biāo)準(zhǔn)。
微處理器用戶對數(shù)字信號處理器進行選擇時需要一種方法和依據(jù),這種方法必須簡單、易用,并且能夠全面反映處理器的實際應(yīng)用。處理器提供商經(jīng)常采用MIPS和MFLOPS(每秒百萬次浮點運算)作為處理器速度的評價尺度。然而,這種評價方法對處理器體系結(jié)構(gòu)和指令集的多樣性并不能很好地進行評估。因此,采用這種方法是毫無意義的。事實上,由于處理器指令集的多樣性使得這種傳統(tǒng)方法不能反映處理器的實際應(yīng)用。例如,TMS320C6202時鐘頻率為300MHZ,每個時鐘周期發(fā)射8條指令。Freescale的DSP56852時鐘頻率為120MHZ。因此,如果按照傳統(tǒng)的MIPS測量尺度地話,TMS320C6202的數(shù)據(jù)處理能力為2400MIPS,而DSP56852應(yīng)為120MIPS。即前者是后者的20倍。然而,如果執(zhí)行BDTI的基準(zhǔn)測試程序(FIR濾波器)就會發(fā)現(xiàn),前者僅僅比后者快6倍。因此,采用傳統(tǒng)的MIPS評價尺度與處理器的實際情況是不吻合的。
為了滿足這種評估需求,BDTI公司在1997年引入了BDTI測試基準(zhǔn)程序組。該程序組來自于BDTI開發(fā)的許多信號處理器算法基準(zhǔn)測試程序。1999年,BDTI對原來的BDTI程序組進行了更新以便能更好地反映當(dāng)今信號處理器地應(yīng)用情況,于是建立了BDTI2000基準(zhǔn)程序組。
BDTI2000基準(zhǔn)程序組對數(shù)字信號處理器速度進行全面評估。BDTI2000基準(zhǔn)程序組的初版本是由BDTI公司在1997年引入的,其后續(xù)版本很好地反映當(dāng)今的信號處理器應(yīng)用。BDTI2000基準(zhǔn)程序組分值基于信號處理器應(yīng)用的結(jié)果,并在目標(biāo)處理器上進行了優(yōu)化。
我們首先探討建立BDTI2000基準(zhǔn)程序組的目標(biāo)和評價方法學(xué),然后對BDTI2000基準(zhǔn)程序組進行分類。事實上,為了保證評價尺度的有用性和實效性,信號處理器評測必須滿足如下目標(biāo):
適度性: 評價尺度必須反映處理器執(zhí)行信號處理算法頻度的性能;
公正性和性:評價尺度必須來源于基準(zhǔn)程序的實際計算結(jié)果,且對任何處理器都是一樣的。
簡單性:評價尺度必須方便地進行比較,用一個數(shù)值來表示評測結(jié)果;
廣泛性:評價尺度必須廣泛,適合任何一類可編程處理器;
獨立性:評測分值必須經(jīng)過獨立地第三方驗證以確保能夠真實反映處理器地性能;
有效性:評測分值是有效的,且是公開的。
Tensilica高性能可配置處理器技術(shù)
Tensilica成立于1997年7月,專門為日益增長的大規(guī)模嵌入式應(yīng)用需求提供優(yōu)化的特定應(yīng)用的微處理器解決方案。Tensilica擁有Xtensa和LX的可配置和可擴展的微處理器內(nèi)核,是一家能夠生成定制微處理器內(nèi)核的廠商,全部開發(fā)過程均可自動化完成。
Tensilica的Xtensa LX處理器架構(gòu)具有兩個顯著優(yōu)勢。首先,Tensilica充分使用自定義的FLIX(長度靈活的指令擴展)指令,它包括七種不同的64位指令字格式以及8個并行操作指令槽。FLIX提供VLIW風(fēng)格的并行執(zhí)行功能,但卻沒有VLIW處理器通常導(dǎo)致的代碼膨脹現(xiàn)象。實際上,與缺省配置(out-of-box)的Xtensa LX 處理器核相比,優(yōu)化的Xtensa LX處理器核能夠取4倍到5倍的性能提升,而代碼量則降低了2%。其次,Tensilica利用TIE (Tensilica指令擴展)隊列來加速IP包的校驗功能。通過TIE隊列,SoC設(shè)計者可以不使用標(biāo)準(zhǔn)處理器總線,而直接將數(shù)據(jù)輸入到一個Xtensa LX處理器的執(zhí)行單元,同樣,在一個SoC設(shè)計里有一個專門的硬件加速模塊。傳統(tǒng)處理器的數(shù)據(jù)傳輸能力局限于每個時鐘周期32或64位數(shù)據(jù)讀寫,但帶有TIE隊列的Xtensa處理器可以在每個隊列端口上維持一定的傳送數(shù)據(jù)率,用戶可定義的數(shù)據(jù)傳輸帶寬為1024位。通過這種方式,Xtensa LX處理器成為的一款可以讓設(shè)計者避免傳統(tǒng)處理器總線瓶頸的處理器。而且Tensilica為用戶定義的TIE隊列提供C編譯器和指令集仿真器的支持。
Xtensa LX處理器核中的定制指令集每個時鐘周期可以執(zhí)行多個操作,可以將兩個輸入隊列的數(shù)據(jù)與本地數(shù)據(jù)相結(jié)合,然后將計算結(jié)果輸送到兩個輸出隊列。嵌入式網(wǎng)絡(luò)設(shè)備中的IP包操作是TIE隊列的典型應(yīng)用。在一個SoC設(shè)計中,一個網(wǎng)絡(luò)工程師為獲得包處理的高吞吐量,通常設(shè)計定制的包頭校驗硬件。如果使用傳統(tǒng)的處理器,首先要讀全部的數(shù)據(jù)包,然后執(zhí)行包頭校驗和校驗位計算。因此傳統(tǒng)技術(shù)通常需要設(shè)計定制的加速器。通過使用Xtensa LX處理器,定制的包處理硬件和包緩存隊列出口和入口能夠被集成到處理器中。因此,Xtensa LX在基準(zhǔn)測試中的IP包校驗部分可以獲得33倍的性能提升。利用Tensilica的TIE技術(shù),在幾小時內(nèi)即可以完成處理器設(shè)計。而傳統(tǒng)的RTL方法則需要幾周的RTL設(shè)計和幾個月的驗證。
Xtensa V和LX的EEMBC評測結(jié)果
1. Xtensa V的EEMBC評測結(jié)果
Tensilica的Xtensa V缺省配置情況下的EEMBC測試結(jié)果如圖1所示,整個評測包括四個EEMBC基準(zhǔn)測試程序組,即EEMBC 消費類電子基準(zhǔn)程序組Consumermarks、電信基準(zhǔn)測試程序組Telemarks、網(wǎng)絡(luò)基準(zhǔn)測試程序組Netmarks和辦公自動化測試程序組Oamarks。
下面對每一組基準(zhǔn)測試程序分別進行評價。
EEMBC 消費類電子基準(zhǔn)程序組Consumermarks: 視頻處理是消費類電子基準(zhǔn)程序組的主要,例如數(shù)碼相機、數(shù)字電視和游戲機。視頻處理包括顏色空間轉(zhuǎn)換、2D濾波和圖像壓縮。
EEMBC 電信基準(zhǔn)測試程序組Telemarks:電信領(lǐng)域應(yīng)用是非常重要的一類,其數(shù)據(jù)通常為16位定點數(shù)據(jù),形成壓縮數(shù)據(jù)流或者冗余編碼信道數(shù)據(jù)流進行傳輸。在過去的幾年中,DSP能夠很好地處理濾波、誤差校正和傳輸算法方面地應(yīng)用。電信基準(zhǔn)測試程序組Telemarks主要涵蓋上述應(yīng)用。
EEMBC網(wǎng)絡(luò)基準(zhǔn)測試程序組Netmarks:網(wǎng)絡(luò)應(yīng)用與消費類電子和電信應(yīng)用有很大不同,它們的算術(shù)運算較少、數(shù)據(jù)并行性程度低,但需要頻繁的控制流判決。EEMBC網(wǎng)絡(luò)基準(zhǔn)測試程序組Netmarks包括路由和分組數(shù)據(jù)處理。
EEMBC辦公自動化測試程序組OAmarks:OA程序組的應(yīng)用是打印機領(lǐng)域,包括灰度尺度抖動、位級圖像旋轉(zhuǎn)和文本處理。
2. Xtensa LX的EEMBC評測結(jié)果
Tensilica的Xtensa LX處理器在EEMBC辦公自動化基準(zhǔn)測試Oamark中獲得了分?jǐn)?shù),其分值大約是同類處理器的四倍。
Tensilica Xtensa LX處理器在EEMBC網(wǎng)絡(luò)2.0基準(zhǔn)測試中也同樣優(yōu)于其它高性能微處理器。網(wǎng)絡(luò)2.0基準(zhǔn)測試程序組包括TCPmark和IPmark,前者表示在因特網(wǎng)有效時客戶端設(shè)備的處理器性能;而后者則代表網(wǎng)絡(luò)路由器、網(wǎng)關(guān)和交換機的處理器性能。對基于仿真的EEMBC網(wǎng)絡(luò)2.0基準(zhǔn)測試結(jié)果進行歸一化處理,事實表明,經(jīng)過優(yōu)化的Xtensa LX處理器內(nèi)核性能更高,而且代碼密度和功耗方面表現(xiàn)出了更高的優(yōu)越性。
EEMBC對Xtensa LX處理器內(nèi)核其它方面的評測結(jié)果如下:
芯片面積和功耗:在標(biāo)準(zhǔn)的130納米工藝技術(shù)下,使用傳統(tǒng)的標(biāo)準(zhǔn)單元實現(xiàn)技術(shù),Xtensa LX處理器內(nèi)核面積僅為1.2平方毫米(存儲器面積除外)。當(dāng)工作于工作頻率304兆赫茲時消耗的功率大約為115毫瓦。
代碼密度:Xtensa LX針對EEMBC網(wǎng)絡(luò)2.0版本基準(zhǔn)測試的代碼大小經(jīng)過ECL為65,208字節(jié)。
通信能力:通過使用Xtensa LX處理器內(nèi)核獨特的隊列功能,設(shè)計者能夠完全不通過總線即可以完成數(shù)據(jù)傳輸,從而增加了數(shù)據(jù)吞吐量。
3. Xtensa LX的BDTI測試結(jié)果
BDTIsimMark2000和BDTIMark2000是截然不同的兩種基準(zhǔn)測試程序組。BDTIMark2000基準(zhǔn)程序組僅僅用于處理器經(jīng)過硬件驗證后的性能測試;而BDTIsimMark2000程序組則只對仿真結(jié)果進行性能測試。BDTIsimMark2000和BDTIMark2000用于測試處理器的信號處理器速度,從這種意義上講,它比MIPS或者MFLOPS那種簡單的評價尺度要準(zhǔn)確得多。
對Xtensa LX處理器和其他幾款處理器進行BDTIsimMark2000測試。為了保持BDTI測試的一致性,各個處理器核均利用壞情況下的時鐘頻率,制造工藝均為0.13um。壞情況是指工藝、電壓和溫度三個方面。對于已經(jīng)封裝的處理器,采用系列中快的處理器來計算分值。定點處理器測試分值結(jié)果,Xtensa LX處理器分值為6150,超過其他處理器。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://www.hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 單片機技術(shù)特性與嵌入式開發(fā)實踐指南2026/1/7 10:00:02
- 單片機(MCU)與數(shù)字信號處理器(DSP)分類及選型技術(shù)指南2025/12/30 10:02:37
- 工業(yè)級DSP信號處理系統(tǒng):硬件適配與抗干擾工程方案2025/12/15 14:41:00
- HOLTEK推出HT32F65533G/733G內(nèi)建N/N預(yù)驅(qū)電機專用SoC單片機2025/11/26 14:11:41
- 什么是C51數(shù)據(jù)類型擴充定義2025/10/27 13:59:22
- 高速PCB信號完整性(SI)設(shè)計核心實操規(guī)范
- 鎖相環(huán)(PLL)中的環(huán)路濾波器:參數(shù)計算與穩(wěn)定性分析
- MOSFET反向恢復(fù)特性對系統(tǒng)的影響
- 電源IC在惡劣環(huán)境中的防護設(shè)計
- 連接器耐腐蝕性能測試方法
- PCB電磁兼容(EMC)設(shè)計與干擾抑制核心實操規(guī)范
- 用于相位噪聲測量的低通濾波器設(shè)計與本振凈化技術(shù)
- MOSFET在高頻開關(guān)中的EMI問題
- 電源IC在便攜式設(shè)備中的設(shè)計要點
- 連接器結(jié)構(gòu)設(shè)計常見問題分析









