AMD推土機效率低下的原因?

時間 2021-06-03 02:20:06

1樓:

首先模組化架構悲劇,雙核被視為1.5核心,杯不杯具。八核四模組當四核用,也是很悲劇的。

浮點的不太算,現在英特爾浮點能力也不強,幾年都不見長進。關鍵是流水線長啊,你21條pk英特爾14條確信可以。聯絡一下架構效率超級低的賽揚D吧。

而且網上所說的打樁機架構效率相當於英特爾酷睿一代我也是不苟同,那個估計是算模組的,真正算單執行緒的估計慘不忍睹。網上有人推測壓路機架構比酷睿2單執行緒還差20%左右,所以嘛,工程隊單執行緒架構效率就大約在奔騰4到酷睿2之間,略像奔騰4演進版(雖然實質不同)綜上所述,架構效率差的原因主要是流水線太長,次要原因是目前應用對該架構優化差勁(所以會出現上文兩核心當一核心半的奇葩事件)

2樓:Alan Li

AMD的推土機架構的理念是:

1. 在核的數量上領先,以核多的優勢達到更好的總體效能

2. 在提高每乙個CPU核的處理器頻率的同時保持指令級並行速度

AMD Bulldozer的設計是為將來大規模多執行緒計算設計的。這樣的設計帶來的影響是在效能方面有所取捨:

1. 為了達到更高的CPU核心處理頻率,Bulldozer的指令流水線被延長

2. 核的數量增加導致片上快取大小按同樣的比例增加,使得快取訪問延遲被拉長

對於執行緒數量較少的情況,AMD採用Intel的辦法提高執行速度:即關閉空閒核的同時提高執行核的時鐘頻率,此為Turbo Core。

現在的問題是:指令流水線變長,快取訪問時間變長,如何彌補這裡的效能損失。答案是超執行緒:通過同時發射兩個執行緒的指令來飽和乙個核的指令流水線,以此覆蓋快取訪問延遲。

現在Bulldozer出現的問題是:

1. 如上所述,n核Bulldozer能提供最大效能的情況,應是同時執行2n個執行緒時。但是現時一般應用都針對2-4核優化,沒有充分利用bulldozer的架構優勢。

2. 對於n核SMT,在作業系統眼裡看到的是2n核CPU。在做thread scheduling的時候,應該盡量把一對affined執行緒放在乙個核上,儘量減少使用的核數量,這樣可以最大程度利用Turbo Core。

但實際上作業系統沒有這樣的資訊無法做更細粒度的scheduling。AMD把效能損失怪罪微軟,微軟後來推出了效能補丁,效果如何不清楚。

當然AMD本身單核的CPU效能就不如Intel,再加上新架構要求的優化模式不一樣,Bulldozer的效能就遠遠沒達到預期了。

為什麼 AMD 的推土機 打樁機失敗了,銳龍卻成功了?

一三呃 推土機世代其實是PC cpu發展歷史上一次失敗的嘗試,類似之前p4世代片面追求主頻一樣。P4世代intel證明了高效的核心比高主頻更划算,推土機世代amd證明了片面追求多核弱化單核不可取。其實消費級PC cpu的目標很簡單,就是在單核不斷提公升的前提下追求多核能力提公升 劃重點,單核不斷提公...

推土機vs坦克,哪個更厲害?

英特納雄耐爾 這一定是坦克在人類史上被黑得最慘的一次。題主不要以為大號的推土機就能打得過坦克。1000噸的P1000 1500噸的P1500 下面我新增正經回答。大家不要以為坦克只是一門自行火炮,現代的主戰坦克是非常強悍的陸戰之王。論火力。其主炮可以壓制和消滅陸地上一切有生力量!論機動性。公路上能飆...

AMD 推土機架構 是因為太超前還是是失敗的產物?

一三呃 推土機的產品其實在設計上受到了sun的ultra sparc T1 T2的影響 剛好後者在2005 2007年發布,那時候估計就是推土機立項的時間 sun的CPU在伺服器上應用尚可,但本身的單核效能非常差 劃重點 而消費級應用對單核效能極其敏感。不用說在多核應用沒那麼普及的2011年,就是筆...