1 頁 (共 1 頁)

其實 G5 的效能目前只能說差強人意

發表於 : 11/08/2003 2:49 am
waterball
這是從去年 IBM 在 Microprocessor Forum 正式發表 PowerPC 970,一直到今天的感想。雖然 PowerPC 970 源自 Power4 Regatta,但是,實際上相較於高階 x86 PC 處理器-尤其是 Intel Xeon-的效能優勢,卻遠不如 Apple 官方宣傳的如此巨大,甚至與事實有著相當程度的出入。

就以經常作為 PC vs Mac benchmark 的 Cinebench 2003 來說好了,它的 CPU software render 項目,是透過 Maxon Cinema 4D 的程式核心,計算一張 620 * 620 的 shadow map 所需要的時間。下面是我自己測試的結果:(主記憶體皆為 512MB,除了 Xeon 和 Athlon 64 FX 主記憶體是 DDR-333,其餘都是 DDR-400)

單 CPU 測試部份:

PowerPC G5 1.8Ghz 190 分
PowerPC G5 2.0Ghz 220 分
PowerPC G5 2.0Ghz 288 分 (使用針對 G5 最佳化的 Beta 版)
Athlon 64 3000+ (1.8Ghz) 256 分
Athlon 64 FX (2.2Ghz) 306 分
P4 3.2Ghz w/HT 312 分
P4 3.2Ghz w/o HT 312 分
P4EE 3.2Ghz w/HT 320 分 (看來多出 2MB L3 cache 沒啥影響)
P4EE 3.2Ghz w/o HT 320 分
單 Xeon 3.06Ghz 1MB L3 cache w/HT 311 分
單 Xeon 3.06Ghz 1MB L3 cache w/o HT 311 分

多 CPU 測試部份就比較有趣了,尤其是單顆 Intel P4/Xeon 啟動 Hyper-Threading 後的結果:

P4 3.2Ghz w/HT 378 分
P4EE 3.2Ghz w/HT 384 分
雙 PowerPC G5 2.0Ghz 403 分
雙 PowerPC G5 2.0Ghz 525 分 (針對 G5 最佳化的 Beta 版)
雙 Xeon 3.06Ghz 1MB L3 cache w/o HT 578 分 (1.87 倍)
雙 Xeon 3.06Ghz 1MB L3 cache w/HT 663 分 (2.14 倍)

因為 Cinebench 本身針對多處理器以及 TLP 的最佳化程度非常高,尤其 Intel 的 Hyper-Threading 可以增加 20% 左右的效能。所以,考量到在 multi-threading 化的程式之中發掘效能的潛力,這也就是為何外界普遍預測 PowerPC G6 將會是以 IBM 新一代的 Power5 為核心,而 Power5 相較於 Power4,改進的重點也都在於 TLP 硬體實作的導入。

PS Bench (PhotoShop 7.0.1) 和 iTune 的部分,我還沒測試過 dual Xeon,不過我想情況應該是相去不遠。

至於之前引起眾多爭議的 SPEC CPU 2000 數據,問題還是出在 VeriTest 那個「來路不明」的 gcc 3.3,以及測試報告中 Intel P4 以及 Xeon 的數據嚴重偏低所致。雖然 IBM 在八月底就提供 XL C compiler 6.0 及 XL Fortran compiler 8.1 for MacOS X beta 版免費下載,也隨即公佈了針對 SPEC CPU 2000 的最佳化 configuration 建議,但是到現在都還沒看到使用這兩套新 compiler 所產生的 SPEC CPU 2000 測試結果,只聽過有 NASA 的工程師,在 SPEC CPU fp 的部分,出現了相較於 g77 提升 210% 的驚人傳言。不過,連 IBM 和 Apple 官方都沒有發布更新的數據。(我自己現在也搞不定,如果有人全數擺平請告知小弟一下)

其實,我自己對 PowerPC 970 的架構和 AltiVec 指令集 (應該是現今最強大的 SIMD 延伸指令集了) 很有信心,不過,目前所可以看到的測試結果,都只能用差強人意來形容,根據個人使用 PowerMac G5 的經驗,也不認為會比 Wintel PC 有著明顯的效能優勢。簡而言之,G5 的實力絕對不僅於此,所以 Apple 和 IBM 一定要更努力一點才行。當然,Mac 的價值,絕不僅是效能上的優勢。

Re: 其實 G5 的效能目前只能說差強人意

發表於 : 11/08/2003 4:34 am
CD
waterball 寫:......
當然,Mac 的價值,絕不僅是效能上的優勢。
非常之同意!也許不久的將來,哪個"僅"字又要拿掉也說不定。但...奇怪的是Apple老是將Intel當假想敵,是否以為將Intel擊敗它會大獲全勝,近十年的事實看來,並非如此喔! :(

也許不該這麼說! :oops: Apple若不這麼做,目前的佔有率會更少呢!若是以這個角度來看,它的策略是有效的! 8)

發表於 : 11/08/2003 10:02 am
jychiu
>單 CPU 測試部份:
>單 Xeon 3.06Ghz 1MB L3 cache w/HT 311 分
>PowerPC G5 2.0Ghz 288 分 (使用針對 G5 最佳化的 Beta 版)
>
>多 CPU 測試部份就比較有趣了,尤其是單顆 Intel P4/Xeon 啟動 Hyper-Threading 後的結果:
>雙 Xeon 3.06Ghz 1MB L3 cache w/HT 663 分 (2.14 倍)
>雙 PowerPC G5 2.0Ghz 525 分 (針對 G5 最佳化的 Beta 版)

不甚了解, 雖說速度無法隨頻率提高而有相同幅度的提升, 但 PPC G5 若為 3 Ghz 是否較為接近(參考用).
另外 MP 或 HT 就某種程度上來說, 向量與純量以及 compiler 等皆會影響到結果. 有時 prefetch 錯誤所浪費的時間也抵銷了加速的時間.
雖然 Cinebench 高度平行化, 但我們手邊常用軟體是否具有高度地平行化,
這個可能比較貼近我們的實際感受, 尤其是 OS 本身(這點我就很看好 APPLE :o ).
若有錯誤之處, 懇請不吝指教, 謝謝.

發表於 : 11/08/2003 12:57 pm
waterball
問題在於:PowerPC 970 並沒有那麼高時脈的版本。這種情況就很類似 Intel 與 AMD 之間的較量,同時脈的產品效能較好並不見得有意義,因為消費者只會在乎誰的高階產品有著效能上的優勢,也從來沒有人規定不能用高時脈去換取效能。

長期而言,姑且不論現在的情況,thread-level parallelism 的確是一個趨勢。除了 Intel 在今年秋季 IDF 表示,未來將會超過 90% 的軟體受益於 TLP 的導入,IBM 的 Power5 在 SMT 上的發展,就是一個最好的證明,未來的 PowerPC G6 也一定會走上這條路。

至於 OS 技術的部分,從當初 Darwin 直接引進 FreeBSD,再看看微軟的 Longhorn,真的會讓人對 Apple 的技術能力感到憂心。另外,再好的處理器和硬體架構,也需要高度最佳化的 compiler 以及應用程式與以配合。不過,Apple 現在就給人只想要倚賴 IBM 的感覺,這樣絕不是什麼好事情,光從一個最具指標性的 SPEC CPU 2000 就可以看出來了。

發表於 : 11/08/2003 11:28 pm
fatkit
[quote="waterball"]問至於 OS 技術的部分,從當初 Darwin 直接引進 FreeBSD,再看看微軟的 Longhorn,真的會讓人對 Apple 的技術能力感到憂心。[quote]

不大明白,我雖然不大懂這些技術,但如果有現成好的系統,何必再要獨自開發新的系統?而且我對Longhorn的印像極差,感覺上只是在NT上硬加一大堆新功能,架床疊屋,越搞越複雜,越來越難理解M$在系統之中搞了什麼手腳。

發表於 : 11/09/2003 12:24 am
the real unknown
fatkit 寫:不大明白,我雖然不大懂這些技術,但如果有現成好的系統,何必再要獨自開發新的系統?而且我對Longhorn的印像極差,感覺上只是在NT上硬加一大堆新功能,架床疊屋,越搞越複雜,越來越難理解M$在系統之中搞了什麼手腳。
上面這句話,把Longhorn換成OS X,NT換成NeXT,M$換成蘋果,有什麼不一樣?

發表於 : 11/09/2003 2:45 am
Macuser
fatkit 寫:

不大明白,我雖然不大懂這些技術,但如果有現成好的系統,何必再要獨自開發新的系統?
你是否在說os9到osx嗎?

發表於 : 11/09/2003 2:58 am
edbass
我覺得,要比CPU的話最好是拿同時脈的產品來比會比較公平。還有,他們這些比CPU的分數,個人覺得非常沒有意義。因為整體效能是最重要的 :D ,一但Apple變成了開放系統,他的優勢就沒了。

發表於 : 11/09/2003 9:25 am
rlong
請看12月份的Macword page 60 "The race is on"一文,對G5, P4, Athlon 64 FX-51, Opteron有精彩的比較,看來Apple要在PC市場上以速度稱霸可還遙遠的呢。
最現實的是,用iTune將80GB的WAVE檔轉成AAC檔在Dual G5要發上兩個小時,用iPulse監看,似乎iTune只支援單CPU,就像號稱Mac天王壓縮軟體Stuff it 8.0也不支援雙CPU一般。再快的硬體沒有軟體配合,還是跛腳鴨一隻。
解決StuffIt可將要壓縮的檔案分成二份,一份用drop stuff去壓,另一份交給StuffIt delux,哈!速度快一倍!
:idea:

發表於 : 11/09/2003 9:40 am
rlong
在相同的硬體--
Dual G5, 2GB RAM, Raid HDD Strip mode下

OSX 10.2.8 XBench測得總體分數是 180
OSX 10.3.0 XBench測得總體分數是 221

若將能源節約的處理器執行效能設定:
high: XBench測得總體分數是 221
auto: XBench測得總體分數是 200
auto: XBench測得總體分數是 161

發表於 : 11/09/2003 9:11 pm
jychiu
回應一下 rlong
>>再快的硬體沒有軟體配合,還是跛腳鴨一隻。

這也是我想說的 :o
常常看到某些廣告辭, 不曉得有哪些 OS, 哪些 AP, 哪些 User 使用到?

發表於 : 11/10/2003 12:14 pm
waterball
不過我自己使用 iPulse 2.0 監看 iTune 4.0 壓縮 AAC 的過程,看來還是有支援 SMP 吧?還是說 MacWorld 使用的 iTune 版本比較舊?