英特爾45nm新旗艦四核QX9650解析測試
據(jù)了解,SSE4將分為4.1版本及4.2版本,4.1版本將會首次出現(xiàn)于Penryn處理器中,共新增47條指令,主要針對向量繪圖運算、3D游戲加速、視像編碼加速及協(xié)同處理加速動作,包括:
Penryn SSE4 Instruction summary | ||
Instruction Category | Instructions | Benefits |
Packed DWORD Multiplies | PMULLD, PMULDQ | 提升編譯器矢量運算效能 |
Floating Point Dot Product | DPPS, DPPD | 3D立體制作及游戲,支持CG及HLSL等語言 |
Multi-packed sum of absolute diffs& min pos | MPSADBW, PHMINPOSUW | 視頻編碼處理 |
Streaming Load | MOVNTDQA | 視頻編碼處理、繪圖及GPU數(shù)據(jù)分享 |
Floating Point Round | ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD | 視頻編碼處理 、繪圖、影音處理、2D/3D應(yīng)用、多媒體及游戲等 |
Packed Blending | BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDDW | 編譯器矢量運算及影音處理、多媒體、游戲等應(yīng)用 |
Packed Integer Min and Max | PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINDS, PMAXSD | |
Register Insertion/Extraction | INSERTPS, PINSRB, PINSRD, PINSRQ, EXTRACTPS, PEXTRB, PEXTRD, PEXTRW, PEXTRQ | |
Packed Format Conversion | PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ | |
Packed Test & Set | PTEST | |
Packed Compare for Equal | PCMPEQQ | |
Pack DWORD to Unsigned WORD | PACKUSDW | |
● SSE4 :向量、浮點運算專門化 加入串流式負(fù)載指令
在應(yīng)用SSE4指令集后,Penryn增加了2個不同的32Bit向量整數(shù)乘法運算支持,引入了8 位無符號 (Unsigned)最小值及最大值運算,以及16Bit 及32Bit 有符號 (Signed) 及無符號運算,并有效地改善編譯器效率及提高向量化整數(shù)及單精度代碼的運算能力。同時,SSE4 改良插入、提取、尋找、離散、跨步負(fù)載及存儲等動作,令向量運算進(jìn)一步專門化。
SSE4加入了6條浮點型點積運算指令,支持單精度、雙精度浮點運算及浮點產(chǎn)生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即轉(zhuǎn)換其路徑模式,大大減少延誤,這些改變將對游戲及 3D 內(nèi)容制作應(yīng)用有重要意義。
此外,SSE4加入串流式負(fù)載指令,可提高以圖形幀緩沖區(qū)的讀取數(shù)據(jù)頻寬,理論上可獲取完整的快取緩存行,即每次讀取64Bit而非8Bit,并可保持在臨時緩沖區(qū)內(nèi),讓指令最多可帶來8倍的讀取頻寬效能提升,對于視訊處理、成像以及圖形處理器與中央處理器之間的共享數(shù)據(jù)應(yīng)用,有著明顯的效能提升。
◎ 實測SiSoftware Processor Multi-Media

從測試結(jié)果看,多媒體運算能力上QX9650只比QX6850高出一點,優(yōu)勢不是很明顯,普通消費者在使用時并不能體會出區(qū)別,只能使用專門軟件才能區(qū)別開。
◎ Cinebench圖形渲染測試

CINEBENCH RELEASE 10主要考察處理器在進(jìn)行圖形渲染任務(wù)時的性能,并且支持多線程的軟件。此次測試中QX9650比QX6850提高9%,顯示出新款45nm處理器擁有超強的圖像處理器能力
關(guān)注我們


