為什麼超級計算機的CPU要整合在一起,而不是造乙個大號的乙個CPU?

時間 2021-05-10 08:29:31

1樓:路釗

不知道你所說的大號的CPU有多大,晶圓級的嗎?現在有個大的用於人工智慧的晶元就有那麼大,乙個晶圓就乙個晶元。

只是問題是,目前最大的晶圓就是300mm,不能再大了,再大成套生產裝置過於昂貴。

還有乙個問題就是功率的問題。目前最大的通用晶元,晶元面積也不超過1000mm2,功率卻有300w。

那密度做上去以後散熱問題就成了超算最大的問題。所以現在超算用全浸沒散熱。

你真的很難想象,其實超算中體積最大的其實是散熱裝置。晶元其實很小的。

2樓:

這是超級計算機和大型計算機的區別。

超算就是追求順序單任務,那就是用大量通用CPU、FPU和各自的記憶體組成計算節點,堆疊而成,架構複雜。機櫃眾多,但是可以簡單分解成多個重複的邏輯元件。最簡單的理解,就是可以用大量重複的PC當計算節點組成乙個超算。

而每個計算節點邏輯上的作用是一樣的,重複的,可以互換的。

大型機是針對特定任務高併發及時響應需求。設計專門化的CPU,和相對簡單的專門化架構,一般不能再細分成邏輯元件。這種雖然CPU不多但是靠大力出奇蹟。

這種路線走到極致就是 ECL工藝的MCM晶元,一片CPU就是大磚頭一樣的體積、KW級別的功耗,一般是液冷。36bit 、48bit、54bit 這樣奇葩的字長。當然,天價是一定的。

這種技術鼎盛時期是七八十年代。而且取得了不錯的市場。但是因為你不可能永遠用乙個封閉的系統生態當模板生搬硬套多種多樣的商業計算模式。

所以現在已經到了技術壽命終末期。所以你見到的絕大多數都是超算,而不是大型機。

3樓:劉笑天

良品率問題啊

舉個簡單的例子吧

數數簡單吧

那麼假設你身邊一大堆公尺非常多讓你乙個乙個數出來有多少粒兩個方案

整個籃子的公尺拿回公尺堆重新數

問以上兩個方案哪乙個總體上的出錯少

4樓:銳致創新

我認為乙個大號的CPU不用互聯。既減少了成本又騰出空間。這才是科學的。而且轉移方便也不用人力物力的拆裝,靠譜。

-----大號的CPU之間的互連成本難以想象。

正文:1、實現的工藝超級複雜,目前的晶元都是通過一塊一塊的晶圓實現的,大塊CPU工藝無法達到;

2、怎麼封裝?怎麼解決對晶元的封測問題?

3、怎麼散熱?估計大塊的CPU剛執行散發的熱量就爆了。

4、怎麼通訊?不同的CPU組合在一起是需要不同的拓撲和架構組合而成,中間需要進行複雜的通訊協議,需要試錯,大塊的CPU怎麼解決通訊問題是一方面,因為debug而產生的試錯成本也是很高的。

5樓:

說得簡單一點,拋開物理可行性不談,100個核的乙個晶元,有乙個出問題了,需要換,就得吧剩下的99個沒問題的一起換掉。

縱然可以把壞掉的核心關掉,讓剩下的好核繼續跑,直到失效率超過了一定比例,但是這樣搞的結果就是第一設計變得複雜了,第二其實並不減少維護的工作量。

把這個問題微觀化,其實就是為什麼搞半導體的拼了老命要把晶元往小了做的原因之一:良率。

6樓:煙雨微瀾

那麼問題來了,這個「大」要多大?拋開開發成本不談,乙個U,再大效能也有吃滿的一天;而多U系統,不僅可以應對不同級別的需求,從理論上只要U足夠多,效能可以→+∞

簡單的高數思想和工業設計問題。

7樓:未知的自己

你這麼想,如果你做了乙個大號CPU,為何不能把很多這樣的大號CPU集合到一起做乙個超級計算機呢?

再次強調超級計算機追求集合效能,不去強調單體效能。

美國Summit超級計算機的CPU規格(製造工藝 執行緒等)是怎麼樣的?

以下內容來自 微型計算機 節點 機架和整體 在了解了Summit的基本資訊後,接下來本文將進一步分析組成Summit的硬體部分。從硬體架構方面來看,Summit依舊採用的是異構方式,其主CPU來自於IBM Power 9,22核心,主頻為3.07GHz,總計使用了103752顆,核心數量達到2282...

超級計算機為什麼要用上萬個普通民用CPU組成?

好好考慮下你的 整合成一顆的定義 的定義 有一種整合叫Multi Chip Module,俗稱 膠水 但是這個從 簡單 的角度來看,除了改進延遲以外和現在的互聯系統並沒有太大的區別。MCM方案也不是沒有,Power系列一直都是這樣,AMD的伺服器處理器膠水了好幾年了。不過人家MCM也有限度,大了的話...

為什麼計算機cpu的記憶體要分為4gb和8gb?

滔滔清風 計算機是以二進位制形式儲存資料的,因此很多東西都是 2 的指數倍,就比如說這裡的 4 GiB 和 8 GiB。記憶體 4 GiB,代表記憶體有 2 個儲存單元,在設計電路的時候,就可以用 32 根位址線來表示所有記憶體,這樣 32 根線就能全部有效利用。而使用其它非 2 的指數的數字,則會...