其實 G5 的效能目前只能說差強人意
發表於 : 11/08/2003 2:49 am
這是從去年 IBM 在 Microprocessor Forum 正式發表 PowerPC 970,一直到今天的感想。雖然 PowerPC 970 源自 Power4 Regatta,但是,實際上相較於高階 x86 PC 處理器-尤其是 Intel Xeon-的效能優勢,卻遠不如 Apple 官方宣傳的如此巨大,甚至與事實有著相當程度的出入。
就以經常作為 PC vs Mac benchmark 的 Cinebench 2003 來說好了,它的 CPU software render 項目,是透過 Maxon Cinema 4D 的程式核心,計算一張 620 * 620 的 shadow map 所需要的時間。下面是我自己測試的結果:(主記憶體皆為 512MB,除了 Xeon 和 Athlon 64 FX 主記憶體是 DDR-333,其餘都是 DDR-400)
單 CPU 測試部份:
PowerPC G5 1.8Ghz 190 分
PowerPC G5 2.0Ghz 220 分
PowerPC G5 2.0Ghz 288 分 (使用針對 G5 最佳化的 Beta 版)
Athlon 64 3000+ (1.8Ghz) 256 分
Athlon 64 FX (2.2Ghz) 306 分
P4 3.2Ghz w/HT 312 分
P4 3.2Ghz w/o HT 312 分
P4EE 3.2Ghz w/HT 320 分 (看來多出 2MB L3 cache 沒啥影響)
P4EE 3.2Ghz w/o HT 320 分
單 Xeon 3.06Ghz 1MB L3 cache w/HT 311 分
單 Xeon 3.06Ghz 1MB L3 cache w/o HT 311 分
多 CPU 測試部份就比較有趣了,尤其是單顆 Intel P4/Xeon 啟動 Hyper-Threading 後的結果:
P4 3.2Ghz w/HT 378 分
P4EE 3.2Ghz w/HT 384 分
雙 PowerPC G5 2.0Ghz 403 分
雙 PowerPC G5 2.0Ghz 525 分 (針對 G5 最佳化的 Beta 版)
雙 Xeon 3.06Ghz 1MB L3 cache w/o HT 578 分 (1.87 倍)
雙 Xeon 3.06Ghz 1MB L3 cache w/HT 663 分 (2.14 倍)
因為 Cinebench 本身針對多處理器以及 TLP 的最佳化程度非常高,尤其 Intel 的 Hyper-Threading 可以增加 20% 左右的效能。所以,考量到在 multi-threading 化的程式之中發掘效能的潛力,這也就是為何外界普遍預測 PowerPC G6 將會是以 IBM 新一代的 Power5 為核心,而 Power5 相較於 Power4,改進的重點也都在於 TLP 硬體實作的導入。
PS Bench (PhotoShop 7.0.1) 和 iTune 的部分,我還沒測試過 dual Xeon,不過我想情況應該是相去不遠。
至於之前引起眾多爭議的 SPEC CPU 2000 數據,問題還是出在 VeriTest 那個「來路不明」的 gcc 3.3,以及測試報告中 Intel P4 以及 Xeon 的數據嚴重偏低所致。雖然 IBM 在八月底就提供 XL C compiler 6.0 及 XL Fortran compiler 8.1 for MacOS X beta 版免費下載,也隨即公佈了針對 SPEC CPU 2000 的最佳化 configuration 建議,但是到現在都還沒看到使用這兩套新 compiler 所產生的 SPEC CPU 2000 測試結果,只聽過有 NASA 的工程師,在 SPEC CPU fp 的部分,出現了相較於 g77 提升 210% 的驚人傳言。不過,連 IBM 和 Apple 官方都沒有發布更新的數據。(我自己現在也搞不定,如果有人全數擺平請告知小弟一下)
其實,我自己對 PowerPC 970 的架構和 AltiVec 指令集 (應該是現今最強大的 SIMD 延伸指令集了) 很有信心,不過,目前所可以看到的測試結果,都只能用差強人意來形容,根據個人使用 PowerMac G5 的經驗,也不認為會比 Wintel PC 有著明顯的效能優勢。簡而言之,G5 的實力絕對不僅於此,所以 Apple 和 IBM 一定要更努力一點才行。當然,Mac 的價值,絕不僅是效能上的優勢。
就以經常作為 PC vs Mac benchmark 的 Cinebench 2003 來說好了,它的 CPU software render 項目,是透過 Maxon Cinema 4D 的程式核心,計算一張 620 * 620 的 shadow map 所需要的時間。下面是我自己測試的結果:(主記憶體皆為 512MB,除了 Xeon 和 Athlon 64 FX 主記憶體是 DDR-333,其餘都是 DDR-400)
單 CPU 測試部份:
PowerPC G5 1.8Ghz 190 分
PowerPC G5 2.0Ghz 220 分
PowerPC G5 2.0Ghz 288 分 (使用針對 G5 最佳化的 Beta 版)
Athlon 64 3000+ (1.8Ghz) 256 分
Athlon 64 FX (2.2Ghz) 306 分
P4 3.2Ghz w/HT 312 分
P4 3.2Ghz w/o HT 312 分
P4EE 3.2Ghz w/HT 320 分 (看來多出 2MB L3 cache 沒啥影響)
P4EE 3.2Ghz w/o HT 320 分
單 Xeon 3.06Ghz 1MB L3 cache w/HT 311 分
單 Xeon 3.06Ghz 1MB L3 cache w/o HT 311 分
多 CPU 測試部份就比較有趣了,尤其是單顆 Intel P4/Xeon 啟動 Hyper-Threading 後的結果:
P4 3.2Ghz w/HT 378 分
P4EE 3.2Ghz w/HT 384 分
雙 PowerPC G5 2.0Ghz 403 分
雙 PowerPC G5 2.0Ghz 525 分 (針對 G5 最佳化的 Beta 版)
雙 Xeon 3.06Ghz 1MB L3 cache w/o HT 578 分 (1.87 倍)
雙 Xeon 3.06Ghz 1MB L3 cache w/HT 663 分 (2.14 倍)
因為 Cinebench 本身針對多處理器以及 TLP 的最佳化程度非常高,尤其 Intel 的 Hyper-Threading 可以增加 20% 左右的效能。所以,考量到在 multi-threading 化的程式之中發掘效能的潛力,這也就是為何外界普遍預測 PowerPC G6 將會是以 IBM 新一代的 Power5 為核心,而 Power5 相較於 Power4,改進的重點也都在於 TLP 硬體實作的導入。
PS Bench (PhotoShop 7.0.1) 和 iTune 的部分,我還沒測試過 dual Xeon,不過我想情況應該是相去不遠。
至於之前引起眾多爭議的 SPEC CPU 2000 數據,問題還是出在 VeriTest 那個「來路不明」的 gcc 3.3,以及測試報告中 Intel P4 以及 Xeon 的數據嚴重偏低所致。雖然 IBM 在八月底就提供 XL C compiler 6.0 及 XL Fortran compiler 8.1 for MacOS X beta 版免費下載,也隨即公佈了針對 SPEC CPU 2000 的最佳化 configuration 建議,但是到現在都還沒看到使用這兩套新 compiler 所產生的 SPEC CPU 2000 測試結果,只聽過有 NASA 的工程師,在 SPEC CPU fp 的部分,出現了相較於 g77 提升 210% 的驚人傳言。不過,連 IBM 和 Apple 官方都沒有發布更新的數據。(我自己現在也搞不定,如果有人全數擺平請告知小弟一下)
其實,我自己對 PowerPC 970 的架構和 AltiVec 指令集 (應該是現今最強大的 SIMD 延伸指令集了) 很有信心,不過,目前所可以看到的測試結果,都只能用差強人意來形容,根據個人使用 PowerMac G5 的經驗,也不認為會比 Wintel PC 有著明顯的效能優勢。簡而言之,G5 的實力絕對不僅於此,所以 Apple 和 IBM 一定要更努力一點才行。當然,Mac 的價值,絕不僅是效能上的優勢。