国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)CPU頻道 PCPOP首頁(yè)      /      CPU     /      評(píng)測(cè)    /    正文

終極指南:2013年手機(jī)CPU的現(xiàn)狀與未來

    在前文中,我們將Cortex A15批得體無完膚,也許你要有疑問:既然A15在手機(jī)上表現(xiàn)如此糟糕,ARM為何還要設(shè)計(jì)出這么一個(gè)核心?答案非常簡(jiǎn)單:ARM高估了半導(dǎo)體工藝的升級(jí)與技術(shù)進(jìn)步速度,Cortex A15實(shí)際上是為20nm工藝所設(shè)計(jì)的核心。

    讓我們把時(shí)間倒回到2008年,TSMC在當(dāng)時(shí)提出了未來5年半導(dǎo)體工藝路線圖。如果一切都與圖中的宣傳精確吻合,我們?cè)?010年就能用上28nm處理器,而在2012年,也就是去年,我們將邁入20nm時(shí)代。按照這個(gè)進(jìn)度,ARM在2013年將核心進(jìn)化至Cortex A15就沒有任何的問題。也許ARM的初衷是借助于20nm工藝良好的性能,可以強(qiáng)行將Cortex A15的實(shí)際功耗壓縮到0.5W以內(nèi),獲得兩倍于Cortex A9的能耗比提升。這點(diǎn)從早期TSMC和ARM的演示文檔中也可以看出來。而且,A15也的確做到了絕對(duì)性能提升兩倍的設(shè)計(jì)目標(biāo)。

TSMC畫的大餅

    只不過,工藝最終沒能按照ARM所設(shè)想的發(fā)展下去。28nm跳票到2012年,20nm還在遙遠(yuǎn)的2014年,而且即便成功量產(chǎn),其可以得到的性能提升也極為有限,一連串的意料之外造成了Cortex A15的尷尬定位。由于工藝的失算,Cortex A9事實(shí)上失去了后繼產(chǎn)品:Cortex A7的能耗比雖然很高,但其性能太弱,甚至不如Cortex A8;Cortex A15雖然絕對(duì)性能翻倍,但是能耗比過低,兩者都無法作為Cortex A9的繼任者。即便ARM通過big.LITTLE技術(shù)將二者捆綁在一起,最終實(shí)現(xiàn)的總體效率也只能基本上和Cortex A9打個(gè)平手,所謂的繼任者更多成了紙面上而不是性能上的。

很明顯,ARM被TSMC這個(gè)隊(duì)友坑慘了。

    有趣的是,在ARM官方面臨產(chǎn)品線問題的時(shí)候,反而是兩家ARM IP的購(gòu)買商——高通和蘋果——給出了比Cortex A15更好的解決方案。它們都規(guī)避了Cortex A15過于臃腫的架構(gòu)設(shè)計(jì),把注意力集中在對(duì)Cortex A9的優(yōu)化和提升上。不約而同的,它們都選擇了保留Cortex A9的前端、擴(kuò)充Cortex A9的后端,區(qū)別是高通的著眼點(diǎn)在于提升指令的理論吞吐量,蘋果的工作重心在提升內(nèi)存表現(xiàn)。當(dāng)然,最終的結(jié)果我們看到了,高通的方案并沒有對(duì)Cortex A9形成實(shí)質(zhì)上的優(yōu)勢(shì),蘋果的方案則很難找到對(duì)比的標(biāo)準(zhǔn),但是至少這兩家的行動(dòng)方向是正確的。

    因此在Cortex A15架構(gòu)推出3年后的2013年,ARM痛定思痛,給出了自己針對(duì)這個(gè)問題的答案,那就是Cortex A12。

    在設(shè)計(jì)規(guī)格上,ARM終于放棄了宏偉龐大的“200%性能提升”,轉(zhuǎn)而只給Cortex A12定下了比Cortex A9快40%這樣一個(gè)目標(biāo)。這是一個(gè)相當(dāng)現(xiàn)實(shí)的目標(biāo),尤其是考慮到Cortex A9的體系架構(gòu)上的確存在一些過時(shí)的限制,讓我們來看Cortex A12是怎么改的。

    首先,如同其他的ARMv7架構(gòu)處理器一樣,Cortex A12提升了二級(jí)緩存的性能,學(xué)習(xí)前輩Cortex A15和A7的先進(jìn)經(jīng)驗(yàn),把二級(jí)緩存整合進(jìn)多核心控制器,所有核心終于可以不用再通過一條可憐的64bit總線訪問自己的緩存,這將大大緩解擁堵現(xiàn)象。其次,Cortex A12把NEON和vFP提升到了第四版,并且和Cortex A15一樣引入了內(nèi)部OoO(亂序執(zhí)行)設(shè)計(jì),指令執(zhí)行時(shí)效率要比A9高很多。最后,A12的外部接口也從64bit AMBA 3升級(jí)到了128bit AMBA 4,帶寬提升一倍有余。

    Cortex A12憑什么降低了功耗?主要是三方面,一方面是最大并發(fā)取指數(shù)從3降低到2,另一方面是大幅度縮減了指令派發(fā)隊(duì)列,最后一方面是大幅度縮減了運(yùn)算單元的數(shù)量。由于指令派發(fā)隊(duì)列的意義在于可以支撐亂序執(zhí)行,它所對(duì)應(yīng)的寄存器資源和硬連接資源是非常龐大的,Cortex A15為所有8組8個(gè)運(yùn)算單元設(shè)計(jì)了完整的8個(gè)獨(dú)立指令隊(duì)列,這無疑消耗了巨大的電力,而Cortex A12把這個(gè)數(shù)字縮減到了3。與此同時(shí),Cortex A12的運(yùn)算單元也減少到3組6個(gè),即整數(shù)、存取和FP/NEON,每一組內(nèi)包含兩個(gè)運(yùn)算單元,共享一個(gè)指令隊(duì)列。

    而Cortex A9就相當(dāng)寒酸了,只有一個(gè)指令隊(duì)列,支撐著2個(gè)整數(shù)ALU、一個(gè)存取單元和FP與NEON。僅僅依靠這樣的改進(jìn),Cortex A12就幾乎可以實(shí)現(xiàn)40%的性能提升,更不要說算上二級(jí)緩存、外部總線、以及更為前端的取指與解碼部分——例如數(shù)據(jù)與指令部分重命名與分派彼此獨(dú)立——的改進(jìn)了。總體來說,Cortex A12是一個(gè)與Cortex A9相比性能提升40%、功耗維持不變的架構(gòu),它單憑一己之力拯救了ARM處理器搖搖欲墜的每瓦特性能,可以說是ARM的救星。A12唯一的問題只有一個(gè)——它最早也要等到2014年中才可能有產(chǎn)品,那時(shí)ARM很可能已經(jīng)被英特爾大卸八塊了。

    如果我們把Cortex A12與高通Krait、蘋果Swift放在一起看,可以發(fā)現(xiàn)一些比較有趣的地方。與ARM不同,高通Krait幾乎保持了Cortex A9的前端設(shè)計(jì),唯一的增強(qiáng)是取指部分的并發(fā)能力提升到3,后端則和Cortex A15一樣堆積了數(shù)量巨大的執(zhí)行器,具體來說是7個(gè)。這樣的架構(gòu)瓶頸來自于連接前端與后端的中間部分,導(dǎo)致Krait在實(shí)際應(yīng)用中根本無法發(fā)揮其3300DMIPS——只比Cortex A15低5.7%——的理論最高性能。至于蘋果Swift,由于缺乏資料與有效的對(duì)比方式,在這里并不能給出太多的分析,但是蘋果的優(yōu)勢(shì)在于硬件與軟件之間可以做到完全的匹配,因此即便蘋果對(duì)Cortex A9進(jìn)行如高通一般的單方面增強(qiáng),也可以依靠自身的操作系統(tǒng)進(jìn)行針對(duì)性的優(yōu)化并將其發(fā)揮出來。因此在這三個(gè)介于Cortex A9和Cortex A15之間的設(shè)計(jì)中,我們認(rèn)為Cortex A12是最為平衡的設(shè)計(jì)。只是——如之前所說,我們恐怕無法在2013年看到它了,甚至在2014年都有可能看不到最終產(chǎn)品的上市。因此Cortex A12是否真的實(shí)現(xiàn)了ARM的設(shè)計(jì)目標(biāo),我們也只能等到2014甚至2015年才能看到結(jié)果。

0人已贊

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注