国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      新聞    /    正文

寶劍鋒自磨礪出!細(xì)談RV770背后的故事

    [泡泡網(wǎng)顯卡頻道 1月13日] 感謝anandtech放出這篇博客,更感謝chiphell幫助我們消除語言的障礙,讓我們讀到如此精彩的“背后”。

    當(dāng)我步出AMD Santa Clara辦公室的電梯時,我聽到背后有人叫我名字。我回過頭去卻發(fā)現(xiàn)誰也不認(rèn)識。不過這很正常,因?yàn)槲沂巧狭四昙o(jì)的人啦,在這個行業(yè)里已經(jīng)干了12年。謝天謝地Carrell Killerbrew根據(jù)一張照片認(rèn)出了我。至于他是根據(jù)哪張照片認(rèn)出我的,我不知道。

    我們往前走,進(jìn)了一個小房間,里面有一張桌子幾把椅子,桌子中央有一個麥克風(fēng)。屋里除了我,還有Carrell Killebrew,Eric Demers, Mike Schmit和Mark Leather(編者按:牛人云集啊,基本都是AMD的院士,可見AnandTech站長面子很大)。這些人中的大部分我都沒有見過,但是聽過他們的名字。最好情況下我們能和Technical Marketing的人交流,但是很少有機(jī)會能和主架構(gòu)師或者院士打交道。但是今天,在這個房間里,我發(fā)現(xiàn)我和AMD和一群院士,一群最聰明的人在一起。

  Carrell Killebrew是RV770項目的領(lǐng)導(dǎo)者,他正是你期望的那類人,帶領(lǐng)一個工程師團(tuán)隊開發(fā)GPU。Carrell作了開場白,他說今天所有的談話都會被記錄在案,他假設(shè)所有人對這一點(diǎn)都沒有異議。他問我我想談什么,他給我了一些話題以供選擇,比如GPU未來的趨勢,GPU的架構(gòu),用GPU來實(shí)現(xiàn)視頻的轉(zhuǎn)碼等等?;蛘咚推渌耍梢哉?wù)凴V770背后的故事。

    Carrell最后提出的話題引起了我的興趣,我從來沒有想象過這一點(diǎn)。當(dāng)RV770在夏天發(fā)布的時候,我們想當(dāng)然的認(rèn)為這是款很好的產(chǎn)品,它攪亂了NVIDIA的架構(gòu)體系,給了我們在$200和$300美金價位最有價值的產(chǎn)品。那時我們探尋了Readeon 4800系列的架構(gòu)和性能,但是只花了一頁的篇幅來討論AMD的小核心(Small-die)策略。AMD過去8年中一直致力于制造越來越大的GPU。但是在RV770上,AMD反其道而行之,但是那時我居然沒有注意這一點(diǎn)。我隨意的提到這一點(diǎn),談?wù)摿讼逻@個策略和NVIDIA的策略的不同之處,但是我沒有深入進(jìn)去。

  通常情況下,類似AMD這樣的制造商告訴我他們做了什么事,我通常都會問“為什么”。當(dāng)Intel向我介紹Nehalem的Cache架構(gòu),我問他們?yōu)槭裁匆@樣設(shè)計并稍后發(fā)布了我的心得。對Radeon HD4800系列的每一個方面,我們也做了同樣的事,但我們都忽略了最重要的一點(diǎn)!那就是設(shè)計GPU的策略。這篇文章我寫得很艱難,沒有圖表,沒有架構(gòu)可以分析,我只是坐在這間房子里,聽這些人談話,這些人在兩個小時時間里和我分享過去三年他們干的事情。我想把文章寫得客觀中立,我希望我會,因?yàn)樵谀莻€房間里和他們的交流是我跟AMD最好的一次交流。



● 序幕:讓全世界為之一振的槍聲


Radeon9700Pro讓很多人第一次認(rèn)識了ATI

    讓我們回到2001年,那時ATI還是獨(dú)立的公司,正在設(shè)計R300(Readeon 9700 Pro)。那時NVIDIA正統(tǒng)領(lǐng)著市場,ATI還不能推翻NVIDIA的王位。那時ATI正在討論Radeon和Radeon 8500,公司內(nèi)部認(rèn)為要贏得市場,就必須贏得光環(huán)效應(yīng)。如果ATI可以制造出最快的GPU,就能增加品牌認(rèn)知度并培育品牌忠誠度,不只是賣出高端的GPU芯片,低端GPU的芯片的銷售也能因此受益。但是最重要的一點(diǎn)是:那時高端產(chǎn)品的售價是$399--記住這一點(diǎn)。

    ATI里的每一個人都在思考他們必須設(shè)計最快的GPU,擊敗NVIDIA,所以Radeon 8500的繼任者是一個大家伙。Radeon 8500采用0.15微米工藝,大概有六千萬個晶體管。R300仍然采用0.15微米工藝,但是有1.1億個晶體管,芯片面積基本是Radeon 8500的兩倍。GeForce4(NV25)大概有6300萬個晶體管。即使NVIDIA也不敢在150nm的工藝上造如此大的芯片。因此GeForce4的繼任者準(zhǔn)備采用130nm的工藝。我們都知道接下來的故事,R300最終被命名為ATI Radeon 9700 Pro,蹂躪了GeForce4。R300的成功堅定了ATI的策略:為了擊敗NVIDIA,芯片面積要不斷增大,以后每一代的GPU都要更大更快。

重新評估策略:2005年設(shè)計RV770

    記住導(dǎo)致成功的因素比記住成功更重要。2005年ATI的處境和當(dāng)初設(shè)計R300的時候相似。R300的成功是因?yàn)锳TI重新評估了制造GPU的策略。在那個時候,ATI決定造一顆大芯片來贏得高端,并將其轉(zhuǎn)化為每一個價格區(qū)間都有競爭力的產(chǎn)品。值得一提的是R300的持續(xù)成功還部分歸因于NVIDIA在GeForce FX上的失敗。這是ATI上演的完美風(fēng)暴。ATI造了一顆最大的GPU,NVIDIA在其后的一段時間里無法回應(yīng)。正如Intel在試圖瘋狂提高P4的頻率時撞上了功耗墻。但是2005年時,ATI開始發(fā)現(xiàn)GPU(當(dāng)時ATI還稱核心為VPU)過于龐大了。設(shè)計周期越來越長,芯片面積不斷增長。制造如此大的GPU已經(jīng)不是那么合算了。


設(shè)計芯片技術(shù)不是唯一,設(shè)計策略才是大局轉(zhuǎn)變的關(guān)鍵

  AMD認(rèn)為一顆非常大的GPU,如果沒有使用Repair Structures和Harvesting(兩種技術(shù)我稍后會討論)的話,只有30%是可用的。也就是說,對一片晶圓而言,每100個GPU只有30%是功能完好,可以零售的。制造如此復(fù)雜的電路成本是非常昂貴的,那些Fab的設(shè)備造價很容易就達(dá)到數(shù)十億美金。所以不能讓如此多的晶圓被浪費(fèi)。謝天謝地有技術(shù)可以讓30%可用變成90%可用。第一種技術(shù)稱之為可修復(fù)性(Repair Structures)。

    其思想非常簡單:設(shè)計冗余單元。如果芯片某個功能單元包含10個流處理器,實(shí)際上要設(shè)計11個流處理器。如果有瑕疵出現(xiàn)那么我們可以啟用那個備用的流處理器。這種技術(shù)通常也用在片上內(nèi)存(on-die memory)的設(shè)計上。這樣當(dāng)某一部分出現(xiàn)問題時,不會導(dǎo)致整個功能單元不能用。但是這個地方通常有個折中,如果你設(shè)計了太多的冗余單元,那么你就面臨著芯片面積太大的風(fēng)險,并且這些增大的面積對實(shí)際性能毫無貢獻(xiàn)。但是如果你設(shè)計的冗余單元不夠,那么你的良品率就不足。

    第二種技術(shù)稱之為Harversting,所有人肯定都很熟悉。其思想是:假設(shè)一片晶圓上功能完好的芯片只有很少一部分,但是我們并不丟掉那些有瑕疵的芯片,我們關(guān)閉某些功能單元,然后把他們當(dāng)做低端芯片賣。例如,如果你設(shè)計某個功能單元包含了10個流處理器,預(yù)期只有30%的產(chǎn)品是10個流處理器都可用,50%的產(chǎn)品可用其中的8個。那么你可以把8個流處理器可用的芯片當(dāng)做稍微低端的芯片賣。因此這種方法使得一片晶圓上80%的芯片都可用,如果可能的話,你還可以屏蔽更多的流處理器單元,使得接近100%的芯片都可用。良率會隨著時間改善,如果你一直依賴于Harversting,那么這種方法最終會損害你的財務(wù)表現(xiàn)。在上面的例子中,隨著良率的改善,越來越多的芯片10流處理器可用,但是你還是只能當(dāng)成8流處理器賣。某種意義上說,值一塊錢的東西你賣八毛錢。當(dāng)然你也可以設(shè)計8流處理器的新版本,但是這會耗費(fèi)額外的時間、金錢和工程師資源。

    GT200系列就是采用Harvesting技術(shù)的典型。GeForce GTX260就是GTX280的Harvesting版本。隨著良率的改善,NVIDIA推出了GeForce GTX 260+(216 SP)。但是要注意并沒有為GT200系列設(shè)計任何的冗余單元。因此GT200系列的芯片上最多有240個流處理器,如果240個流處理器不能用的話,那么就當(dāng)成GTX260或者GTX260+來賣。與之形成鮮明對比的是RV770系列,兩個版本的RV770功能單元的規(guī)格都是一致的,所不同的只有頻率和功耗的不同。從芯片的角度來看,AMD不必通過賣縮減版本的產(chǎn)品來保證良率(編者按:估計AnandTech站長當(dāng)時還不知道Radeon HD4830)。注意,一家公司是否采用Harvesting技術(shù)并不會影響終端用戶。

    在這種情況下,GeForce GTX260/260+實(shí)際上對終端用戶是有利的,因?yàn)樗哂泻蚏adeon HD4870同樣的價值。但是它無助于改善NVIDIA的財務(wù)表現(xiàn),如果一家公司長期依賴于Harvesting策略的話,最終是要付出代價的。但是我懷疑NVIDIA會在事情變壞之前用55nm的GT200版本使自己全身而退。AMD并不想設(shè)計一顆GPU過度依賴于靠Repair和Harvesting來提高良率。于是一個殺手級的論斷出爐:制造大型的GPU并非最符合客戶利益。

● 思路進(jìn)發(fā):設(shè)計一款為需求而生的GPU


圖為AMD在財政分析日上公開的圖

    對桌面CPU市場而言,性能級產(chǎn)品只占7%左右。雖然這一部分貢獻(xiàn)了大量的營收,但是市場的大頭是主流級的產(chǎn)品。ATI在2005年就意識到這一點(diǎn)。高端的GPU變得越來越昂貴。R300上市價格是$399,但是隨后我們看到$499、$599、$600的GPU。

    越來越高的價格是由于越來越大的芯片面積,以及采用類似Harvesting這樣技術(shù),保證不論GPU有多大,營收是穩(wěn)定的。售價$399的R300同主流級的產(chǎn)品價格是足夠接近的,這使得ATI能夠花幾個月縮減它的規(guī)模來占領(lǐng)其他市場區(qū)間。但是現(xiàn)在,縮減高端GPU的規(guī)模(編者按:這里的意思大概是設(shè)計出流處理數(shù)量更少的原生GPU)來占領(lǐng)主流級市場所花費(fèi)的時間已經(jīng)增加到了6-9個月。到現(xiàn)在為止,我們?nèi)匀豢床坏讲捎肎T200架構(gòu)的中端產(chǎn)品。NVIDIA把GTX280的發(fā)布價格定在$600,然后花9個月時間制造出價值$200的中端衍生品,這在AMD看來是在傷害消費(fèi)者的利益(doing the market a disservice)?,F(xiàn)在是時候來重新審視這個策略了。

    AMD不再想重新裁剪高端GPU的規(guī)模來制造中端CPU,他們想設(shè)計一款在$200-$300價格區(qū)間中最有價值的產(chǎn)品。要這么做就不得不推翻原來的策略,并且希望NVIDIA在某種程度上不要采用同樣的策略。(編者按:其實(shí)從G80轉(zhuǎn)型至G92這樣的策略上,不多不少都顯示了NVIDIA開始傾向著這樣的想法)

● 打賭:NVIDIA會跟風(fēng)采用同樣策略嗎?

    在2005年的春天,ATI有R480在市場上(Radeon X850 系列)。它采用130nm工藝,是另一顆130nm芯片R420(Radeon X800)系列的改進(jìn)版。從R420到R480的演進(jìn)是非常重要的,因?yàn)镹VIDIA會以此來推斷ATI未來的行動。ATI仍然在設(shè)計R520,也就是Radeon X1800,但是正如你們記得的那樣,它延期了。R520的延期引發(fā)了多米諾效應(yīng),其后的每一個項目都受到了影響,包括R600,當(dāng)然R600的延期還有其自身原因。

    當(dāng)ATI審視R520的時候,發(fā)現(xiàn)它很大并且也不劃算。因此在R520的基礎(chǔ)上設(shè)計R580的時候,ATI做了一個讓人意想不到的改變:打破1:1:1:1的比例。在R520中,ALU:TMU:ROP:Z的比例是1:1:1:1,但是在R580里,這個比例變?yōu)?:1:1:1。增加ALU資源但是不增加紋理單元和顯存帶寬。ATI注意到,應(yīng)用程序?qū)hader的運(yùn)算能力的要求在增加但是對紋理過濾和顯存位寬的需求并沒有增加。這個改變使得從R520到R580的演化遠(yuǎn)比很多人想象中的大,包括NVIDIA。那時Radeon X1800并不是很有競爭力,一方面因?yàn)樗难悠冢硪环矫嬉惨驗(yàn)镚70的確很好。

    AMD收購ATI后,Radeon X1900使NVIDIA讓出了性能王座。AMD從R520到R580讓人意想不到的變化無疑激怒了NVIDIA,NVIDIA習(xí)慣把持性能王座,它肯定不想王位被AMD奪去。在AMD內(nèi)部,Carrell正在下一個賭注,他打賭NVIDIA會低估R580,NVIDIA會像評估R480一樣評估R580。他打賭NVIDIA會被R580弄得大吃一驚然后弄出一顆比G70大得多的芯片。NVIDIA不想丟掉性能王座,G80會是一個怪獸。AMD原計劃R520在2005的初夏上市,結(jié)果是10月才上市,差不多晚了6個月。正如我之前提到的,這個延期使得后續(xù)所有項目都被延期。整個R600家族都受此影響。AMD估計NVIDIA的G71會比R520快20%左右,并且不會估計到R580在架構(gòu)上的大改變。(編者按:事實(shí)的確如此,G71仍然不敵R580,但其實(shí)在市場上,G71借助優(yōu)秀的成本控制戰(zhàn)勝了R580)


這是一場靠互相猜測上演的戲法

  此時,AMD正在計劃R600項目,知道這是一個大家伙。最開始預(yù)估芯片面積18mm x 18mm,然后變成19mm,然后是20mm。工程師一直在問Carrell,你覺得NVIDIA的芯片會比這還大?當(dāng)然會,因?yàn)樗麄儾幌雭G掉性能王座,在R580之后他們當(dāng)然要重新奪回。R580的成功是否會影響到G80的大小和功耗在AMD內(nèi)部一直被討論。我很確定NVIDIA肯定會說他們的設(shè)計和AMD毫無關(guān)系,但是明顯我們都知道AMD的地位,并且Carrell的預(yù)計是正確的,G80是一個大家伙。不只是因?yàn)镚80優(yōu)秀,還因?yàn)镽600延期,延得太晚了。

    R600仍然被R520的延期影響,并且它自身還面臨AA的硬件單元等一系列問題。即便不開AA,R600與G80的競爭也很艱難。AMD丟掉了GPU性能王座,AMD最大的芯片不能和NVIDIA競爭,其后一年,AMD的營收和市場占有率都不斷下降。而與此同時,Carrell仍然試圖讓每個人都信服RV770的設(shè)計走了一條正確的道路,贏得性能王座并不像R300那會就意味著贏得一切!那時,他的論調(diào)聽起來就像是一個瘋子說的一樣。當(dāng)Carrell和他的同仁們正在規(guī)劃RV770的時候,他們預(yù)想RV770不只是和對手同樣大小的芯片相比要好,也要有足夠的競爭力。因?yàn)镹VIDIA仍然堅持大芯片這個模式。Carrell相信G80的繼任者非常大,RV770有優(yōu)勢,因?yàn)镹VIDIA不得不在設(shè)計上有很多改變。

  Carrell和他的ATI同仁將會經(jīng)歷他們生命中的驚奇時刻!

如果不打破這個現(xiàn)狀

  如果不打破現(xiàn)狀,我們會很危險。在2005年,AMD和NVIDIA都面臨這樣的情況:造一顆最快的GPU,并提供穩(wěn)定的驅(qū)動程序,那么就可以贏得市場。過去幾年中,AMD一直是這么干的。但是在公司內(nèi)部,有一些人認(rèn)為是時代改變了。在很多方面AMD和NVIDIA都面臨不同的挑戰(zhàn),NVIDIA從之前激進(jìn)的工藝更新策略中汲取了教訓(xùn),GT200很有可能仍然采用老的,更成熟的工藝,因此導(dǎo)致GT200的面積很大。AMD選擇走一條NVIDIA沒有走過的路,制造工藝的演進(jìn)更加迅速,以此造出更小面積的GPU。競爭對手偏愛造一顆越來越大的GPU,而AMD則分兩面看待這個問題,他們沒有遇到真正的競爭,他們可以干任何他們想干的事。對AMD而言,問題變成小核心的策略會奏效嗎?


中型核心打天下之路其實(shí)荊棘滿途

  今天我們很容易說:“當(dāng)然”。但是你要明白那是在2005年,RV770的規(guī)格正在被草擬的時候。想象坐在一大群人中,他們的工作一直是制造世界上最快的GPU,但是你卻要對他們說“把性能王座讓給NVIDIA,讓NVIDIA獲得光環(huán)效應(yīng),我們要做的是設(shè)計在$200-$300價格段最好的GPU”的話,會是怎樣的一個狀況。當(dāng)然接下來就是白熱化的討論,是否AMD能把賭注下在不再造一顆最快的GPU,而是造一顆稍微低端的GPU上。

    AMD把圖形市場劃分為5個區(qū)間:狂熱級,性能級,平衡級,主流級和入門級。在2005年夏,AMD決定瞄準(zhǔn)性能級市場,而非狂熱級市場。你可以認(rèn)為性能級市場正是2002年R300競爭的市場。R300 $399的價格和Radeon 4870 $299的價格很接近,而GTX280發(fā)布的時候價格是$599。AMD把這看作是策略上的改變,R300當(dāng)時為了性能可以不管芯片面積,而RV770不同,它面臨這芯片面積和功耗的明確限制。

    我們今天知道,AMD內(nèi)部很多人對RV770大開綠燈。Rick Bergman,決定把他的職業(yè)生涯和RV770拴在一根線上,因?yàn)槿绻鸕V770不成功,他要為此負(fù)責(zé)。Carrell回憶Rick Bergman和一群人坐在桌子旁討論RV770的場景;Rick把頭轉(zhuǎn)向Matt Skynner,問他是否認(rèn)為這個策略可行,是否造一顆比NVIDIA的GPU更小,但是仍然能成功的GPU的可行性,是否我們能在性能級市場上制造光環(huán)效應(yīng)。

    Matt很顯然仔細(xì)思考了這個問題,他轉(zhuǎn)向Rick說,我認(rèn)為我們能。Carrell感到如果沒有Matt Skynner的支持,AMD不可能走這條路。而Rick Bergman確保了RV770的項目被良好執(zhí)行。當(dāng)然也有很多非常聰明的工程師,他們造就了R300和R580這樣的產(chǎn)品,但并不認(rèn)同這個策略。有些人會說,如果AMD不弄出個和GT200能真正單挑的芯片,游戲就結(jié)束了。但是Carrell這樣的人會說,這個策略是可行的,因?yàn)樗钦_的方向。這就像政治,每一方都認(rèn)為自己的觀點(diǎn)是正確的,但是你只能選擇一個。并且兩方還要同處一個屋檐下,低頭不見抬頭見。

● 部分人很沮喪但是整個團(tuán)隊在繼續(xù)發(fā)展

  整個RV770設(shè)計花了大約三年時間,這意味著當(dāng)我們討論R600的失敗時,那幫工程師正在設(shè)計RV770并對此持樂觀態(tài)度。Carrell,Rick Bergman和其他人要求整個團(tuán)隊忘記發(fā)生在R600上的事情,忘掉AMD丟掉性能王座這個事情,致力于做好RV770。在我的整個采訪中,我一直能感受到這樣一個事實(shí):整個RV770團(tuán)隊給AMD留下了深刻印象。整個團(tuán)隊沒有分崩離析,盡管有不同意見,盡管對往哪個方向走有過搖擺,但是整個團(tuán)隊仍然團(tuán)結(jié)有力。

    AMD認(rèn)為采取不追求絕對性能的設(shè)計策略是有意義的,但是如果失去了光環(huán)效應(yīng)怎么辦?歷史上因?yàn)槭ス猸h(huán)效應(yīng)而失敗的案例不甚枚舉。對此AMD制定了嚴(yán)格紀(jì)律,把歷史放在一邊,做我們認(rèn)為正確的事情。這不僅要求不受歷史的影響,還要同以前養(yǎng)成的觀念做斗爭,即,要轉(zhuǎn)變這樣一種觀念:在設(shè)計的時候從來不考慮芯片變大的限制。AMD通過RV770取得的成功使我想起了Intel的Atom設(shè)計團(tuán)隊。每一個團(tuán)隊成員在設(shè)計他們負(fù)責(zé)的模塊的時候都面臨著模塊大小的嚴(yán)格限制,而這個限制從來不會被妥協(xié)。逆境中往往會涌現(xiàn)最好的人。在業(yè)界我聽過最好的故事,就是Intel設(shè)計Banias的工程師,以及AMD設(shè)計RV770的工程師全身心的投入工作,而不管是否會被擊倒。激情以一種有趣的方式成為一個人最強(qiáng)大的盟友。


R600那驚人的功耗相信不容易讓人忘記

● 對于功耗的規(guī)劃

  我們所有人都應(yīng)該為把功耗當(dāng)做免費(fèi)的午餐而感到自責(zé)。Intel設(shè)計了5年的處理器,從來沒有考慮過功耗問題,設(shè)計GPU的家伙同樣如此。在R300和R420的時代,ATI從來沒有考慮過功耗。在那個時候,對功耗的估計是如此的微不足道以至于ATI甚至沒有找到一套好的估計功耗的方法。設(shè)計一款TDP被限定的產(chǎn)品是不可能的?,F(xiàn)在AMD的工具好了很多,現(xiàn)在要達(dá)成功耗上的目標(biāo)和達(dá)成時鐘頻率的目標(biāo)或是芯片大小的目標(biāo)沒有什么不同?,F(xiàn)在,功耗不會有大的變化(想想為什么高端CPU的功耗總是130W附近)。

    每一個人的設(shè)計都面臨功耗的限制,現(xiàn)在面臨的問題是如何在功耗保持不變的情況下提高性能?,F(xiàn)在我們的處理器,無論是CPU還是GPU變得更加高效,而不是傻傻的堆規(guī)模上去以此提高性能。架構(gòu)上面臨一個有趣的問題是,在一顆大約10億個晶體管的芯片里傳遞數(shù)據(jù)要耗費(fèi)很多的功耗。Carrell告訴我在45nm和32nm階段,在FPU里傳遞數(shù)據(jù)的功耗和這個FPU進(jìn)行乘法運(yùn)算的功耗一樣多。考慮到數(shù)據(jù)傳遞變成了一個越來越高功耗的任務(wù),未來GPU的設(shè)計很重要的一點(diǎn)是要盡可能的保持?jǐn)?shù)據(jù)存儲在本地,減少數(shù)據(jù)傳遞到寄存器和片上緩存中。我們能看到更多的本地寄存器(Local register)以及更多的多層內(nèi)存結(jié)構(gòu)。隨著芯片變得越來越復(fù)雜,把寄存器文件集中放到一個位置越來越困難。

    AMD承認(rèn)在R600的制造上功耗過大的問題。從那以后,AMD重新專注于功耗效率。當(dāng)晶體管越來越小時,漏電也變成一個日益嚴(yán)峻的問題,有時候?yàn)榱颂岣吣屈c(diǎn)效率而使得漏電很高并不劃算。假設(shè)你有一塊100W的GPU,你愿意其中的40W都是因?yàn)槁╇姸幌牡魡幔窟€是你想要其中的80W用來真正干事情,只有20W被浪費(fèi)?Intel也同樣汲取了P4的教訓(xùn)。

● 真的只是小問題?AMD需要新的內(nèi)存技術(shù)

  R600擁有令人難以置信的512bit顯存位寬,因此引出的問題是芯片面積很大,所以你不得不進(jìn)行復(fù)雜的繞線(Route)。為了達(dá)成RV770的芯片面積目標(biāo),AMD需要256bit的顯存位寬。但是如果使用現(xiàn)在的顯存技術(shù),256bit的位寬無法提供足夠的顯存帶寬來達(dá)成RV770的性能目標(biāo)。再一次想象那是在2005年,ATI決定完全拋棄過去贏得GPU戰(zhàn)爭的策略,即使這個小核心策略的成功要依賴于一種新的顯存技術(shù),在那時這個新的顯存技術(shù)甚至連技術(shù)原型都沒有。那時GDDR5的規(guī)范還沒有最終確定,沒有測試設(shè)備,沒有界面設(shè)計,什么都沒有。只知道GDDR5可以提供GDDR3兩倍的帶寬,這樣就可以依靠256bit的顯存位寬達(dá)成一個512bit顯存位寬的目標(biāo)。這正是AMD想要的,所以AMD決定采用GDDR5。


三年前誰會知道GDDR5會成功面世?

  不幸的是GDDR5能否在2008年夏上市并不只是取決于AMD,內(nèi)存制造商也有很多問題需要解決。AMD投入了很多金錢和工程師資源來和內(nèi)存制造商緊密合作,以確保不僅GDDR5的規(guī)格要定下來,而且在2008夏GDDR5要可用,性能良好。注意只有RV770會用到GDDR5,這意味著只有AMD來獨(dú)自推動這項新技術(shù)。

    AMD做了很多工作來推動GDDR5,這是有風(fēng)險的,即使RV770性能非常好,但是在上市時如果顯存沒有準(zhǔn)備好,RV770仍然不得不延期。RV770許配給了GDDR5,沒有其他選擇了。如果GDDR5不能在3年內(nèi)準(zhǔn)備好并投入生產(chǎn)上市,AMD將面臨既沒有高端GPU,也沒有性能級GPU的窘境。如果GDDR5工作正常,那么意味著RV770能夠成功,并且從另一方面來講,這是NVIDIA所不具備的。當(dāng)然,這是建立在AMD的小核心策略是可行的基礎(chǔ)上……

● 一名網(wǎng)站編輯拯救了Radeon HD4850

  AMD有這樣的習(xí)慣:從媒體中選擇好的評論員,然后招致到公司里。我們的第一個圖形版塊編輯Matthew Witheiler,從杜克大學(xué)畢業(yè)后就加盟了AMD。在加盟AMD之前,他在AnandTech度過了3年的美好時光。在ATI,他最終成為了最年輕的產(chǎn)品經(jīng)理。另一個杰出的評論員是Dave Baumann,來自于Beyond 3D。在Beyond 3D,Baumann在分析兩款彼此競爭的產(chǎn)品時表現(xiàn)出了卓越的能力。他在AMD的一項主要工作就是在公司內(nèi)部比較R600和G80,這是發(fā)生在2006年11月份的事情(編者按:Dave Baumann是在06年6月加盟ATI的)。很顯然,G80對RV770有重大影響。雖然當(dāng)時架構(gòu)已經(jīng)定了,但是時鐘頻率、電路板設(shè)計、顯存大小等等都是在2008年初才定下來。

    最初,RV770的目標(biāo)是R600的1.5倍,現(xiàn)在回過頭去看,這是不夠的。在接下來的一年半里,1.5倍R600的性能變成2倍R600的性能,最終達(dá)到了2.5倍R600的性能,而價格卻是位于$200 - $300這個區(qū)間里。Dave在2008年二月變成了RV770的產(chǎn)品經(jīng)理??紤]到他加盟AMD并不久,而且這個產(chǎn)品非常重要,這是件大事。RV670讓我們看到了AMD重回競爭者的行列,但是AMD需要RV770讓他們重回巔峰。


Radeon HD4850爆發(fā)的光芒差點(diǎn)被埋沒

  當(dāng)Dave開始負(fù)責(zé)RV770的時候,很多產(chǎn)品的規(guī)格已經(jīng)規(guī)劃好了。芯片已經(jīng)從Fabs里流片回來。在這個時候,AMD的工程師并沒有準(zhǔn)備好或者并不愿意再對規(guī)格做改變。Baumann先生認(rèn)為RV770XT不錯(XT是Radeon HD4870的內(nèi)部代號),用他的話講,規(guī)格很完美。對Radeon HD4870的唯一修改就是增加了第二條PCIe電源連接線,僅此而已。他關(guān)注的是另一個更重要的產(chǎn)品,RV770 Pro,即Radeon HD4850,他認(rèn)為規(guī)格有些低了。

    讓我們來了解下AMD當(dāng)時的處境。你的工程師團(tuán)隊過去三年一直在設(shè)計一款可能失敗的產(chǎn)品,因?yàn)檫@是同過去你所做過的完全不同的產(chǎn)品。你的上一代旗艦級GPU并不完美(R600),而RV670做得不錯,可仍然沒有從NVIDIA手中搶到多少市場份額。你剛剛完成一款全新的GPU的設(shè)計,但是這個年輕的產(chǎn)品經(jīng)理卻告訴你必須要做些改變。對Baumann而言,這是有膽識的行動,他并不看重臉面,他要的是幫助他的團(tuán)隊贏得勝利。最后的改變迅速而容易的發(fā)生了,這是發(fā)生在RV770上的真實(shí)故事。

    Radeon HD4850原來是256MB顯存,500MHz的核心頻率,900MHz的顯存頻率。Dave堅持認(rèn)為Radeon HD4850需要512MB的GDDR3和625MHz的核心頻率,以及933MHz的顯存頻率。他不但堅持這個規(guī)格,也使得工程師團(tuán)隊信服了這個規(guī)格并做了改變。Dave向工程師們論述為什么要改變規(guī)格以及市場需要怎樣的規(guī)格。在討論快結(jié)束時,他已經(jīng)不需要說服他們了。板卡和ASIC團(tuán)隊擁護(hù)這樣的改變。

    如果沒有這樣的改變,RadeonHD4850不能對NVIDIA的GeForce 9800GTX施加如此大的壓力,GeForce 9800GTX的價格也不會降得這么快。

● 最后的小插曲:在RV770上市開賣之后

  RV770的設(shè)計在2008年五月完成,六月開始制造。直到NDA解除那一天,公司內(nèi)部仍然有人感覺小核心策略是錯誤的。但是他們后來很快發(fā)現(xiàn)這個決定是多么的正確,快得超出他們想象。Radeon HD4800系列最后遇到的一點(diǎn)小障礙發(fā)生在上市前一周。當(dāng)Chris hook打電話給我,告訴我一些Radeon HD4850已經(jīng)在歐洲開賣,我們拿到了第一塊Radeon HD4850。AMD做了如下規(guī)定:我們可以談?wù)揜adeon HD4850的性能,但是不能談?wù)揜adeon HD4870的性能和RV770的架構(gòu)。在30小時之內(nèi),我們發(fā)布第一份分析文章,做出了一個很明確的結(jié)論:AMD做了正確的事。GeForce 9800GTX的價格突然暴降,以便維持競爭力,但是即使如此也不夠,Radeon HD4850是$199價位最好的卡。

  從臺灣回來我一直在思考一件事:AMD怎么知道NVIDIA的計劃或者是NVIDIA怎么知道AMD的計劃,所以我很問得很直白:你們這些家伙從哪兒得到這些信息?回答不出意外:臺灣。所有的板卡制造商都知道兩家的信息并且常常共享信息(編者按:板卡廠商這種無間道行為,其實(shí)往往最終目的都是獲得更多的資源和利益)。


Radeon HD4000系列的出現(xiàn),讓GT200系列成為歷史上降價最快的高端顯卡

  AMD計劃推進(jìn)他們這一成功的策略,通過觀察路線圖我們可以得知,當(dāng)AMD發(fā)布RV770時,NVIDIA在G92上沒法大做文章(編者按:這或許也是NVIDIA大力推行CUDA和物理引擎的原因之一)。NVIDIA力求GT200像G80一樣,他發(fā)布了一款全新的芯片,把價格定得高高在上,多數(shù)用戶可能在2010年的某個時候買得起它。已有的產(chǎn)品線已經(jīng)足夠充實(shí)了。

    AMD幸運(yùn)之處在于NVIDIA在2008年只有GT200,而且GT200的性能并不足夠強(qiáng)。Radeon HD4850最初目標(biāo)是性能超過GeForce 8800GT,擊敗GeForce 9800GTX并不是必須的,畢竟GeForce 9800GTX賣$300,而Radeon HD4850只賣$200。Radeon HD4870的目標(biāo)是擊敗GeForce 9800GTX。但是AMD沒有想到的是Radeon HD4870如此的優(yōu)秀以至于打敗了GeForce GTX260(編者按:原文打敗這詞有點(diǎn)偏向性,用“稍勝過”這樣的表達(dá)方式更為穩(wěn)妥)。AMD現(xiàn)在賣$300的卡可以和NVIDIA賣$400的全新設(shè)計的卡競爭。對AMD而言,RV770是一塊蛋糕,美味超出預(yù)期。每個人都可以聞到它的香味,他們知道RV770會很好,但是他們沒有估計到他會如此之好。NVIDIA的反應(yīng)非常迅速,坦白講,沒有哪個公司可以如此迅速的反應(yīng),但是這不會改變AMD已經(jīng)成功的事實(shí)。

    現(xiàn)在沒有人質(zhì)疑Carrell的想法,每個人都同意這個策略是對的。我的問題是:多久AMD會再一次重新評估他們設(shè)計GPU的策略?第一次是2001年,造就了R300;第二次是2005年,造就了RV770。什么時候那些艱難的決定需要再一次做出?可能在2012/2013年前我們都看不到策略的改變。接下來的問題是NVIDIA會對AMD的策略做出何種反應(yīng)?黃仁勛并不會樂意接受失敗,尤其是像這樣失敗。NVIDIA仍然有很強(qiáng)的研發(fā)實(shí)力,過幾年我們會看到RV770是如何影響NVIDIA的設(shè)計。可能NVIDIA也意識到小核心策略是對的,可能NVIDIA仍然堅持造很大的GPU,或許第三種可能也存在,只是我們沒有想到。

● 接下來的挑戰(zhàn)和關(guān)于INTEL的威脅

  正如R300一樣,RV770的成功部分由于NVIDIA的失敗(編者按:或許說得更貼切的是輕視)。與NV30不同的是,GT200并沒有延期,性能也不是差得離譜。它只是價格太高了。AMD制造出RV770很幸運(yùn),NVIDIA造了一顆如此巨大的GPU,因?yàn)樗乇芰藘蓚€主要的風(fēng)險:55nm和GDDR5。這兩點(diǎn)AMD都抓住了。下一輪的較量并不輕松,NVIDIA采用了55nm,最終也會使用GDDR5。AMD不可能每年都能發(fā)布Radeon HD4800這樣的產(chǎn)品。即使現(xiàn)在NVIDIA試圖通過激進(jìn)的價格策略拉近差距,但是仍然面臨沒有任何GT200系列的主流產(chǎn)品的尷尬局面,在2010年之前都不會有。更別提把核心面積為576mm的芯片和AMD的260mm的芯片賣同樣價格對NVIDIA財務(wù)的影響。


在AMD眼中,巨型核心GT200其實(shí)處于一種既成功又失敗的地位

  Carrell非常坦白的告訴我不可能每一次都能做出完美的產(chǎn)品。他想這樣,但是現(xiàn)實(shí)中這樣是不可能的。有很多因素超出了AMD或者NVIDIA的控制,但是有時候機(jī)會降臨然后又抓住了機(jī)會,就會造就Radeon HD4800或是Radeon 9700Pro這樣的產(chǎn)品。Carrell補(bǔ)充到,在那些外部因素的限制的范圍內(nèi),AMD能做最有競爭力的產(chǎn)品。在各種情況的限制下,有可能做到最好。也許它不能成為完美的產(chǎn)品,但是可以成為一款好產(chǎn)品。我特別問到RV8xx系列有何特別之處,他告訴我AMD有些非常有趣,非常創(chuàng)新,非常有用的技術(shù)會用到RV8xx系列中。我想問更多,但是考慮到Carrell和其他AMD同仁給我的信息,我不能太貪心。


作為老對手,Intel仍然是AMD最強(qiáng)的對手

  除了剛才提到的,還有Intel的Larrabee,最神秘的GPU,第一款可編程的GPU。我和Carrell在最后的30分鐘里自然也談到了它。AMD和Intel,以及NVIDIA,都認(rèn)為數(shù)據(jù)級并行會變得難以置信的重要。他是下一次計算機(jī)性能發(fā)展的新浪潮。我們還不清楚在桌面市場上數(shù)據(jù)級并行計算會以何種方式進(jìn)行,但是如果它發(fā)生,這是一件大事。這間屋里的每一個人都對競爭對手表現(xiàn)了崇高敬意。像NVIDIA一樣,AMD把Larrabee看成非常像CPU的GPU。對GPU而言,最大的挑戰(zhàn)是讓數(shù)據(jù)并行算法在GPU上能像在CPU上一樣實(shí)現(xiàn)。Intel在這方面的確有獨(dú)到之處,因?yàn)長arrabee是基于X86的,對程序員而言,整個開發(fā)環(huán)境都很熟悉。AMD相信自己的GPU同Larrabee相比在性能上仍然占優(yōu)(巨大的優(yōu)勢),但是Larrabee自出娘胎起就有編程上的優(yōu)勢。值得一提的是,無論誰制造GPU,AMD、NVIDIA或是Intel,程序員仍然需要重寫數(shù)據(jù)并行的代碼。AMD相信寫出高效的并行代碼需要一定功力,難度比程序員通常編寫的代碼要高一個數(shù)量級。如果你能夠有效利用GPU的能力,你就能駕馭巨大的計算能力。你只需$170就可以獲得大約1萬億次浮點(diǎn)指令的計算能力。如果你是個杰出的程序員,你當(dāng)然知道如何看待下一波浪潮。

● 結(jié)語:

  Derek和我花了6460個單詞完成了Radeon HD4850和Radeon HD4870的評測文章。這篇文章我花了7788個單詞。我所做的只是記錄了那些導(dǎo)致RV770誕生的決定。我們評測的那些產(chǎn)品,無論好壞,都耗費(fèi)了大量的心血。芯片架構(gòu)師的生活是很艱難的,為某個產(chǎn)品嘔心瀝血三年,僅僅因?yàn)橐恍╁e誤決定就招致一些評測網(wǎng)站尖酸刻薄的評論(編者按:突然哪里來的一陣陣罪惡感)。如果我搞糟了一篇評測文章,下周我總是可以改正錯誤。如果一個芯片設(shè)計師設(shè)計了一個數(shù)十億晶體管的GPU,但是在市場上遭致失敗,他/必須要等幾個月或是幾年才有機(jī)會東山再起。我在想芯片設(shè)計公司是否會提供心理咨詢服務(wù)作為員工福利的一部分。

    每一款芯片上市的背后都有數(shù)以千計的故事,無論好壞,它們中的大部分都不為人知。部分原因是我們花了如此多的時間在產(chǎn)品的褒貶上以至于我們很少有時間來講述這些幕后的故事。當(dāng)然有很多公司并不樂意披露他們的消息。Carrell給我這一級別的交流讓我三生有幸,在這一點(diǎn)上,AMD讓我印象深刻。我仍然要謝謝這些人,我所遇到的工程師,以及更多我沒有遇到的人。NVIDIA也許對RV770團(tuán)隊的努力并不樂意,但是我們都受益了。如果你最終買了Radeon HD4800及其衍生產(chǎn)品,你已經(jīng)知道你為什么會充滿感激。如果你買了NVIDIA的產(chǎn)品,有很有可能少花了很多錢。我們常常說競爭對市場而言是好事,但是很少會有像RV770這樣鮮明的案例來證明這一點(diǎn)。那些原來值$300的顯卡現(xiàn)在只賣$200,一款全新的賣$400的顯卡突然間降到了$300。消費(fèi)者贏了,RV770的團(tuán)隊瞄準(zhǔn)了性能級市場,滿足了消費(fèi)者的需求。所有這些都起源于2005年,一些家伙想要掀起一場變革。

    后記:和Chiphell翻譯本文的網(wǎng)友一樣,編輯本人經(jīng)過閱讀本文后感觸很深,在經(jīng)過閱讀本文后這種信念終于得到了肯定!請一路走好吧,勇敢的紅色大軍!■<

1人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注