国产成人福利在线视频播放下载,成人无码www免费视频在线看,放荡的美妇在线播放,大地资源网最新更新,国产成人精品日本亚洲网站

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

挑戰(zhàn)卡皇TITAN!GTX 780 SLI巔峰測試

    泡泡網(wǎng)顯卡頻道6月6日 從2001年開始到現(xiàn)在,NVIDIA和AMD兩大圖形巨頭烽火已逾十年,卡皇之爭最為慘烈,所以每一代旗艦的GPU核心,兩家都不約而同的將晶體管集成數(shù)量推至物理散熱極限的邊緣,因此投入的邊緣成本便成倍增加,旗艦顯卡價格也居高不下。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    就拿發(fā)布不久的GTX TITAN來說吧,它固然代表了單芯旗艦的最高水準,但價格高昂不說,稀有的產(chǎn)量也讓各大賣場一卡難求。作為GTX TITAN的孿生兄弟,GTX 780只是在核心流處理器數(shù)量上有所刪減,卻保留了TITAN無可挑剔設計做工,組建雙卡GTX780SLI更是在性能上傲視群雄!

    SLI技術究竟完善與否?雙卡平臺又有哪些優(yōu)缺點?今天泡泡評測室就為大家提供另一種神機配置方案,奉上NV顯卡的旗艦對決——GTX 780 SLI大戰(zhàn)GTX TITAN!

泰坦的孿生兄弟!NVIDIA GTX 780首測

GeForce GTX 780京東報價點擊進入……

    隨著科學、醫(yī)學、工程和金融各領域?qū)Ω咝阅懿⑿杏嬎阈枨蟮脑黾?,NVIDIA以無比強大的GPU計算架構來不斷創(chuàng)新和滿足這種需求。NVIDIA現(xiàn)有的 Fermi GPU已經(jīng)重新定義和加速了以下領域的高性能計算(HPC)的功能,如地震處理、生化模擬、天氣和氣候建模、信號處理、計算金融、計算機輔助工程、計算流體力學和數(shù)據(jù)分析。NVIDIA的新Kepler GK110 GPU大大提高了并行計算標準,并將會幫助解決世界上面臨的最困難的計算問題。

泰坦的孿生兄弟!NVIDIA GTX 780首測

▲ NVIDIA GeForce GTX 780

泰坦的孿生兄弟!NVIDIA GTX 780首測

▲ GTX 780采用的GK110核心

泰坦的孿生兄弟!NVIDIA GTX 780首測

    通過提供比上一代GPU更強大的處理功能以及優(yōu)化和提高GPU上并行執(zhí)行工作負載的新方法,Kepler GK110簡化了并行程序的創(chuàng)建,將對會對高性能計算引起進一步改革。

    Kepler GK110由71億個晶體管組成,是有史以來架構最復雜的微處理器。GK110新加了許多注重計算性能創(chuàng)新功能,目的是要成為NVIDIA Tesla和HPC市場上的并行處理動力站。

1

Kepler GK110和GK104 

    Kepler GK110會提供超過每秒1萬億次雙精度浮點計算的吞吐量,DGEMM效率大于80%,而之前的Fermi架構的效率是60‐65%。

    除了性能之外,Kepler架構在電源效率方面也有巨大的飛躍,相對于Fermi 的性能/功率比提高了3倍之多!

1

    之前有人說Kepler GK110更適合超級計算和通用計算,其實這是一種誤解。Kepler GK110的以下新功能不僅提高GPU的利用率,簡化了并行程序設計,而且有助于GPU在各種計算環(huán)境中部署,無論是從個人電腦還是超級計算機,GK110都適用:

    Dynamic Parallelism – 能夠讓 GPU 在無需 CPU 介入的情況下,通過專用加速硬件路徑為自己創(chuàng)造新的工作,對結(jié)果同步,并控制這項工作的調(diào)度。這種靈活性是為了適應程序執(zhí)行過程中并行的數(shù)量和形式,編程人員可以處理更多的各種并行工作,更有效的將 GPU 用為計算用途。

    Hyper-Q  – 允許多個CPU核同時在單一GPU上啟動工作,從而大大提高了GPU 的利用率并削減了CPU空閑時間。Hyper‐Q 增加了主機和 Kepler GK110 GPU 之間的連接總數(shù)(工作隊列),允許 32 個并發(fā)、硬件管理的連接(與 Fermi相比,F(xiàn)ermi 只允許單個連接)。

    Grid Management Unit –使 Dynamic Parallelism 能夠使用先進、靈活的 GRID 管理和調(diào)度控制系統(tǒng)。新 GK110 Grid Management Unit (GMU) 管理并按優(yōu)先順序在 GPU上執(zhí)行的 Grid。GMU 可以暫停新 GRID 和等待隊列的調(diào)度,并能中止 GRID,直到其能夠執(zhí)行時為止,這為 Dynamic Parallelism 這樣的強大運行提供了靈活性。

    NVIDIA GPUDirect–NVIDIA GPUDirect 能夠使單個計算機內(nèi)的 GPU 或位于網(wǎng)絡內(nèi)不同服務器內(nèi)的 GPU 直接交換數(shù)據(jù),無需進入CPU系統(tǒng)內(nèi)存。GPUDirect 中的 RDMA 功能允許第三方設備,例如 SSD、NIC、和 IB 適配器,直接訪問相同系統(tǒng)內(nèi)多個 GPU 上的內(nèi)存,大大降低 MPI從GPU內(nèi)存發(fā)送/接收信息的延遲。還降低了系統(tǒng)內(nèi)存帶寬的要求并釋放其他  CUDA 任務使用的 GPU DMA 引擎。

    這里先做簡單介紹,后面本文有詳細的內(nèi)容擴展。除此之外Kepler GK110 還支持其他的GPUDirect功能,包括Peer‐to‐Peer 和 GPUDirect for Video這里就不再贅述了。

    Kepler GK110為NVIDIA Tesla打造,其目標是成為世界上并行計算性能最高的微處理器。GK110 不僅大大超過由 Fermi 提供的原始計算能力,而且非常節(jié)能,顯著減少電力消耗,同時產(chǎn)生的熱量更少。完整 Kepler GK110 實施包括 15 SMX 單元和六個 64 位內(nèi)存控制器。不同的產(chǎn)品將使用GK110 不同的配置。例如,某些產(chǎn)品可能部署 13 或 14 個 SMX。在下面進一步討論的該架構的主要功能,包括:

   1、新 SMX 處理器架構
   2、增強的內(nèi)存子系統(tǒng),在每個層次提供額外的緩存能力,更多的帶寬,且完全進行了重新設計,DRAM I/O 實施的速度大大加快。
   3、貫穿整個設計的硬件支持使其具有新的編程模型功能

1

GK104框架規(guī)格

1

Kepler GK110芯片框圖(GTX 780屏蔽了其中的兩組SMX)

    Kepler GK110 支持新 CUDA Compute Capability 3.5。(有關 CUDA 的簡介請參考附錄 A ‐CUDA 快速回顧)。下表對比了 Fermi 和 Kepler GPU 架構的不同計算能力的參數(shù): 

1

Fermi和Kepler GPU的計算能力

性能/功率比

    Kepler架構的一個主要設計目標是提高電源效率。設計Kepler時,NVIDIA工程師應用從Fermi中積累的經(jīng)驗,以更好地優(yōu)化Kepler、實現(xiàn)高效運行。臺積電的 28nm 制造工藝在降低功耗方面起著重要的作用,但許多 GPU 架構需要修改,以進一步降低功耗,同時保持出色的性能。

    Kepler每一個硬件設備都經(jīng)過設計和擦洗,以提供卓越的性能/ 功率比。出色性能/功率比的非常好的案例是Kepler GK110新流式多處理器 (SMX) 中的設計,與最近Kepler GK104引入的 SMX 單元的許多方面類似,但計算算法包括更多雙精度單位。

    Kepler GK110的新SMX引入幾個架構創(chuàng)新,使其不僅成為有史以來最強大的多處理器,而且更具編程性,更節(jié)能。

1

    SMX: 192個單精度CUDA核、64個雙精度單元、32個特殊功能單元(SFU)和32 個加載/存儲單元(LD/ST)。

SMX 處理核架構

    每個Kepler GK110 SMX單元具有192單精度CUDA核,每個核完全由浮點和整數(shù)算術邏輯單元組成。Kepler完全保留Fermi引入的IEEE 754-2008 標準的單精度和雙精度算術,包括積和熔加(FMA)運算。

    Kepler GK110 SMX 的設計目標之一是大大提高GPU的雙精度性能,因為雙精度算術是許多HPC應用的核心。Kepler GK110 的SMX還保留了特殊功能單元 (SFU)以達到和上一代GPU類似的快速超越運算,所提供的SFU數(shù)量是Fermi GF110 SM的8倍。

    與GK104 SMX單元類似,GK110 SMX單元內(nèi)的核使用主GPU頻率而不是2倍的著色頻率。2x著色頻率在 G80 Tesla 架構的 GPU 中引入,并用于之后所有的 Tesla 和 Fermi‐架構的GPU。在更高時鐘頻率上運行執(zhí)行單元使芯片使用較少量的執(zhí)行單元達到特定目標的吞吐量,這實質(zhì)上是一個面積優(yōu)化,但速度更快的內(nèi)核的時鐘邏輯更耗電。對于Kepler,我們的首要任務是的性能/功率比。雖然我們做了很多面積和功耗方面的優(yōu)化,但是我們更傾向優(yōu)化功耗,甚至以增
加面積成本為代價使大量處理核在能耗少、低GPU頻率情況下運行。

Quad Warp Scheduler

    SMX以32個并行線程為一組的形式調(diào)度進程,這32個并行線程叫做Warp。而每個SMX中擁有四組 Warp Scheduler 和八組 Instruction Dispatch 單元,允許四個Warp同時發(fā)出執(zhí)行。Kepler 的 Quad Warp Scheduler 選擇四個 Warp,在每個循環(huán)中可以指派每 Warp 2 個獨立的指令。與 Fermi 不同,F(xiàn)ermi 不允許雙精度指令和部分其他指令配對,而 Kepler GK110 允許雙精度指令和其他特定沒有注冊文件讀取的指令配對 例如加載/存儲指令、紋理指令以及一些整數(shù)型指令。

1

    每個Kepler SMX 包含4組Warp Scheduler,每組Warp Scheduler包含兩組 Instruction Dispatch單元。單個Warp Scheduler單元如上所示。

    我們努力優(yōu)化SMX Warp Scheduler邏輯中的能源。例如,Kepler和Fermi Scheduler 包含類似的硬件單元來處理調(diào)度功能。其中包括:

a) 記錄長延遲操作(紋理和加載的寄存器
b) Warp 內(nèi)調(diào)度決定(例如在合格的候選 Warp 中挑選出非常好的 Warp 運行)
c) 線程塊級調(diào)度(例如,GigaThread 引擎)

    然而,F(xiàn)ermi的scheduler還包含復雜的硬件以防止數(shù)據(jù)在其本身數(shù)學數(shù)據(jù)路徑中的弊端。多端口寄存器記錄板會紀錄任何沒有有效數(shù)據(jù)的寄存器,依賴檢查塊針對記錄板分析多個完全解碼的 Warp指令中寄存器的使用情況過,確定哪個有資格發(fā)出。

    對于 Kepler ,我們認識到這一信息是確定性的(數(shù)學管道延遲是不變量),因此,編譯器可以提前確定指令何時準備發(fā)出,并在指令中提供此信息。這樣一來,我們就可以用硬件塊替換幾個復雜、耗電的塊,其中硬件塊提取出之前確定的延遲信息并將其用于在 Warp 間調(diào)度階段屏蔽Warp,使其失去資格。

新ISA編碼:每個線程255個寄存器

    可由線程訪問的寄存器的數(shù)量在 GK110 中已經(jīng)翻了兩番,允許線程最多訪問 255 個寄存器。由于增加了每個線程可用的寄存器數(shù)量,F(xiàn)ermi 中承受很大寄存器壓力或泄露行為的代碼的速度能大大的提高。典型的例子是在 QUDA 庫中使用 CUDA 執(zhí)行格點 QCD(量子色動力學)計算?;?QUDA fp64 的算法由于能夠讓每個線程使用更多寄存器并減少的本地內(nèi)存泄漏,所以其性能提高了 5.3 倍。

Shuffle 指令

    為了進一步提高性能,Kepler 采用 Shuffle 指令,它允許線程在 Warp 中共享數(shù)據(jù)。此前,Warp 內(nèi)線程之間的數(shù)據(jù)共享需要存儲和加載操作以通過共享內(nèi)存?zhèn)鬟f數(shù)據(jù)。使用 Shuffle 指令,Warp 可以讀取來自Warp 內(nèi)其他線程中任意排列的值。Shuffle 支持任意索引引用(即任何線程讀取任何其他線程)。有用的 Shuffle 子集包括下一線程(由固定量彌補抵消)和 Warp 中線程間 XOR “蝴蝶”式排列,也稱為 CUDA 性。

    Shuffle 性能優(yōu)于共享內(nèi)存,因此存儲和加載操作能夠一步完成。Shuffle 也可以減少每個線程塊所需共享內(nèi)存的數(shù)量,因為數(shù)據(jù)在 Warp 級交換也不需要放置在共享內(nèi)存中。在 FFT 的情況下,需要共享一個 Warp 內(nèi)的數(shù)據(jù),通過使用 Shuffle 獲得 6%的性能增益。

1

此示例表明某些變量可以在 Kepler 中使用 Shuffle 指令。

原子運算

    原子內(nèi)存運算對并行編程十分重要,允許并發(fā)線程對共享數(shù)據(jù)結(jié)構執(zhí)行正確的讀‐修改‐寫運算。原子運算如 add、min、max 和 compare,swap 在某種意義上也是也是原子運算,如果在沒有其他線程干擾的情況下執(zhí)行讀、修改和寫運算。原子內(nèi)存運算被廣泛用于并行排序、歸約運算、建制數(shù)據(jù)結(jié)構而同時不需要鎖定線程順序執(zhí)行。

    Kepler GK110 全局內(nèi)存原子運算的吞吐量較 Fermi 時代有大幅的提高。普通全局內(nèi)存地址的原子運算吞吐量相對于每頻率一個運算來說提高了 9 倍。獨立的全局地址的原子運算的吞吐量也明顯加快,而且處理地址沖突的邏輯已經(jīng)變得更有效。原子運算通??梢园凑疹愃迫重撦d運算的速度進行處理。此速度的提高使得原子運算足夠快得在內(nèi)核內(nèi)部循環(huán)中使用,消除之前一些算法整合結(jié)
果所需要的單獨的歸約傳遞。Kepler GK110 還擴展了對全局內(nèi)存中 64‐位原子運算的本機支持。除了 atomicAdd、atomicCAS 和 atomicExch(也受 Fermi 和 Kepler GK104 支持)之外,GK110 還支持以下功能:

    atomicMin、atomicMax、atomicAnd、atomicOr、atomicXor

    其他不受本機支持的原子運算(例如 64 位浮點原子運算)可以使用 compare‐and‐swap (CAS) 指令模擬。

紋理改進

    GPU 的專用硬件紋理單元對于需要取樣或過濾圖像數(shù)據(jù)的計算機程序來說是寶貴的資源。Kepler中的紋理吞吐量與 Fermi 相比有明顯提高,每個SMX單元包含16紋理過濾單元,對比Fermi GF110 SM 提高了4倍。

    此外,Kepler改變了管理紋理狀態(tài)的方法。在Fermi時代,為讓GPU引用紋理,必須在固定大小綁定表中分配“槽”才能啟動 Grid。表中槽數(shù)量最終限制程序一次可以讀取多少個獨特的紋理。最終,在 Fermi 中限制程序僅可以同時訪問128紋理。

    Kepler中有無綁定紋理,不需要額外步驟:紋理狀態(tài)已保存為內(nèi)存中的對象,硬件按需獲取這些狀態(tài)對象,綁定表過時。這有效地消除了計算程序引用獨特紋理數(shù)量的任何限制。相反,程序可以在任何時間映射紋理和通紋理處理周圍。

    Kepler的內(nèi)存層次結(jié)構與Fermi類似。Kepler架構支持統(tǒng)一內(nèi)存加載和存儲的請求路徑,每個SMX 多處理器有一個L1緩存。Kepler GK110 還使編譯器指示為只讀數(shù)據(jù)增設一個新的緩存,如下所述。

1

64KB可配置共享內(nèi)存和L1緩存

    在 Kepler GK110 架構(如在上一代 Fermi 架構)中,每個 SMX 有 64 KB 的片上存儲器,可配置為 48 KB 的 共享存儲器和 16 KB 的 L1 緩存,或配置為 16 KB 的共享存儲器和 48 KB 的 L1 緩存。Kepler 目前在配置共享存儲器的分配和 L1 緩存方面的靈活性更大,允許共享存儲器和 L1 緩存之間以 32KB/32KB 劃分。為了支持 SMX 單元增加的吞吐量,用于 64 位或更大負載運算的共享存儲器帶寬相對 Fermi SM 也增加一倍,到每主頻 256B。

48KB只讀‐數(shù)據(jù)緩存

    除 L1 緩存之外,Kepler 為只讀數(shù)據(jù)引入 48 KB 緩存為了函數(shù)的持續(xù)時間。在 Fermi 時代,該緩存只能由紋理單元訪問。專家程序員通常發(fā)現(xiàn)它的優(yōu)勢是通過將數(shù)據(jù)映射為紋理來加載數(shù)據(jù),但這種方法有很多局限性。

    在 Kepler 中,除了大大提高了該緩存的容量之外,還伴隨著紋理功力的提高,我們決定讓緩存為一般負載運算直接訪問 SM 。使用只讀的路徑好處極大,因為它使負載和工作組的影響遠離共享/L1緩存路徑。此外,其他情況下,只讀數(shù)據(jù)緩存更高的標簽帶寬支持全速非對齊內(nèi)存訪問模式。

    該路徑的使用是由編譯器自動管理(通過參數(shù) C99 訪問任何變量或稱為常量的數(shù)據(jù)結(jié)構)。標準關鍵字 “const_restrict” 將被編譯器標記以通過只讀數(shù)據(jù)緩存加載。

改進的L2緩存

    Kepler GK110 GPU 具有 1536KB 的專用 L2 緩存內(nèi)存,是 Fermi 架構中 L2 的 2 倍。L2 緩存是SMX 單元之間主要數(shù)據(jù)統(tǒng)一點,處理所有加載、存儲和紋理請求并提供跨 GPU 之間有效、高速的數(shù)據(jù)共享。Kepler 上的 L2 緩存提供的每時鐘帶寬是 Fermi 中的 2 倍。之前不知道數(shù)據(jù)地址的算法,如物理求解器、光線追蹤以及稀疏矩陣乘法,從高速緩存層次結(jié)構中獲益匪淺。需要多個SM讀取相同數(shù)據(jù)過濾和卷積內(nèi)核也從中受益。

內(nèi)存保護支持

    與 Fermi 相同,Kepler的注冊文件、共享內(nèi)存、L1 緩存、L2 緩存和 DRAM 內(nèi)存受單錯糾正雙錯檢測 (SECDED) ECC 代碼保護。此外,只讀的數(shù)據(jù)緩存‐通過奇偶校驗支持單錯糾正,在奇偶校驗錯誤的情況下,緩存單元自動使失效,迫使從 L2 讀取正確的數(shù)據(jù)。

    ECC 校驗位從 DRAM 獲取必定消耗一定量的帶寬,這會導致啟用 ECC和停用 ECC的運算之間的差異,尤其對于內(nèi)存帶寬敏感的應用程序。基于 Fermi 的經(jīng)驗,Kepler GK110 對 ECC 校驗位獲取處理進行了幾項優(yōu)化。結(jié)果,經(jīng)內(nèi)部的計算應用測試套件測量,開啟和關閉 ECC 的性能三角洲已經(jīng)平均降低 66%。

    在混合 CPU‐GPU 系統(tǒng)中,由于 GPU 的性能/ 功率比提高,使應用程序中大量并行代碼完全在GPU 高效運行,提高了可擴展性和性能。為了加快應用程序的額外并行部分的處理,GPU必須支持更加多樣化的并行工作負載類型。

    Dynamic Parallelism 是 Kepler GK110 引入的新功能,能夠讓 GPU 在無需 CPU 介入的情況下,通過專用加速硬件路徑為自己創(chuàng)造新的工作,對結(jié)果同步,并控制這項工作的調(diào)度。

    在內(nèi)核啟動時,如果問題的規(guī)模和參數(shù)已知,那么 Fermi 在處理大型并行數(shù)據(jù)結(jié)構時效果非常好。所有的工作是從主機 CPU 啟動,會運行到完成,并返回結(jié)果返回到 CPU。結(jié)果將被用來作為最終的解決方案的一部分,或通過 CPU 進行分析,然后向 GPU 發(fā)送額外的處理請求以進行額外處理。

    在 Kepler GK110中,任何一個內(nèi)核都可以啟動另一個內(nèi)核,并創(chuàng)建處理額外的工作所需的必要流程、事件以及管理依賴,而無需主機 CPU 的介入。T 該架構能讓開發(fā)人員更容易創(chuàng)建和優(yōu)化遞歸和數(shù)據(jù)依賴的執(zhí)行模式,并允許更多的程序直接運行在 GPU 上??梢詾槠渌蝿蔗尫畔到y(tǒng)CPU,或可以用功能少的 CPU 配置系統(tǒng)以運行相同的工作負載。

1

    Dynamic Parallelism 允許應用程序中更多的并行代碼直接由 GPU 本身啟動(右側(cè)圖像),而不需要 CPU 的干預(左側(cè)圖像)。

    Dynamic Parallelism 允許更多種并行算法在 GPU 上執(zhí)行,包括不同數(shù)量的并行嵌套循環(huán)、串行控制任務線程的并行隊或或卸載到 GPU 的簡單的串行控制代碼,以便促進應用程序的并行部分的數(shù)據(jù)局部化。

    因為內(nèi)核能夠根據(jù)GPU 中間結(jié)果啟動額外工作負載,程序員現(xiàn)在可以智能處理負載平衡的工作,以集中其大量資源在需要處理能力最大或與解決方案最有關的問題上。

    一個例子是動態(tài)設置數(shù)值模擬的 Grid。 通常 Grid 主要集中在變化最大的地區(qū),需要通過數(shù)據(jù)進行昂貴的前處理。另外,均勻粗 Grid 可以用來防止浪費的 GPU 資源,或均勻細 Grid 可以用來確保捕獲所有功能,但這些選項的風險是在不太被注意的地區(qū)缺少模擬功能或“過度消費”的計算資源。

    有了 Dynamic Parallelism,可以在運行時以數(shù)據(jù)依賴形式動態(tài)確定‐Grid解決方案。以粗 Grid開始,模擬“放大”注意的區(qū)域,同時避免在變化不大區(qū)域中不必要的計算。雖然這可以通過使用一系列的 CPU 啟動的內(nèi)核來完成,但是通過分析數(shù)據(jù)、作為單個模擬內(nèi)核部分啟動額外工作讓 GPU 細化 Grid 本身要簡單的多,消除了 CPU 的中斷以及CPU和GPU之間的數(shù)據(jù)傳輸。

1

    上面的例子說明了在數(shù)值模擬,采用動態(tài)調(diào)整 Grid 的好處。為了滿足峰值的精度要求,固定的分辨率仿真必須運行在整個模擬域過于精細的分辨率上,而多分辨率 Grid 根據(jù)當?shù)氐淖兓癁槊總€區(qū)域應用正確的模擬分辨率。

    原來的一個困難是,GPU始終要優(yōu)化調(diào)度來自多個數(shù)據(jù)流的工作負載。Fermi 結(jié)構支持從單獨數(shù)據(jù)流的16路并發(fā)內(nèi)核啟動,但最終數(shù)據(jù)流都復用相同的硬件工作隊列。這允許虛假的數(shù)據(jù)流內(nèi)依賴,要求在單獨數(shù)據(jù)流內(nèi)的其他內(nèi)核可以執(zhí)行之前就完成一個數(shù)據(jù)流內(nèi)依靠的內(nèi)核。雖然在某種程度上這可以通過使用廣度優(yōu)先啟動順序緩解,但是隨著程序的復雜性的增加,這可以成為越來越難以有效地管理。

    Kepler GK110 使用新 Hyper‐Q 特征改進了這一功能。Hyper‐Q 允許 32 個并發(fā),硬件管理的連接( 對比 Fermi 的單一連接),增加了主機和 GPU 中 CUDA Work Distributor (CWD)邏輯之間的連接總數(shù)(工作隊列)。Hyper‐Q 是一種靈活的解決方案,允許來自多個 CUDA 流、多個消息傳遞接口(MPI)進程,甚至是進程內(nèi)多個線程的單獨連接。以前遇到跨任務虛假串行化任務的應用程序,限制了 GPU 的利用率,而現(xiàn)在無需改變?nèi)魏维F(xiàn)有代碼,性能就能得到 32 倍的大幅度提升。

1

1

Hyper‐Q 允許CPU和GPU之間更多的并發(fā)連接

    每個 CUDA 流在其自己硬件工作隊列管理,優(yōu)化流間的依賴關系,一個流中的運算將不再阻止其他流,使得流能夠同時執(zhí)行,無需特別定制的啟動順序,消除了可能的虛假依賴。Hyper‐Q 在基于 MPI 的并行計算機系統(tǒng)中使用會有明顯的優(yōu)勢。通常在多核 CPU 系統(tǒng)上運行時創(chuàng)建傳統(tǒng)基于 MPI‐的算法,分配給每個 MPI 進程的工作量會相應地調(diào)整。這可能會導致單個MPI 進程沒有足夠的工作完全占據(jù) GPU。雖然一直以來多個 MPI 進程都可以共享 GPU,但是這些進程可能會成為虛假依賴的瓶頸。Hyper‐Q 避免了這些虛假的依賴,大大提高了 MPI 進程間共享 GPU 的效率。

1

    Hyper‐Q 與 CUDA 流一起工作:左側(cè)顯示 Fermi 模式,僅 (C,P) 和 (R,X) 可以同時運行,因為單個硬件工作隊列導致的流內(nèi)依賴。Kepler Hyper‐Q 模式允許所有流使用單獨的工作隊列同時運行。

    Kepler GK110 中的新功能,如 CUDA 內(nèi)核能夠利用 Dynamic Parallelism 在 GPU 上直接啟動工作,需要 Kepler 中 CPU‐to‐GPU 工作流提供比 Fermi 設計增強的功能。Fermi中,線程塊的Grid可由CPU啟動,并將一直運行到完成,通過 CUDA Work Distributor (CWD) 單元創(chuàng)建從主機到SM的簡單單向工作流。Kepler GK110目的是通過GPU有效管理CPU和CUDA創(chuàng)建的工作負載來改進 CPU‐到‐GPU 的工作流。

    我們討論了 Kepler GK110 GPU 允許內(nèi)核直接在GPU上啟動工作的能力,重要的是要理解在Kepler GK110 架構所做的變化,促成了這些新功能。Kepler 中,Grid 可從 CPU 啟動,就和Fermi 的情況一樣,但是新 Grid 還可通過編程由 CUDA 在 Kepler SMX 單元中創(chuàng)建。要管理CUDA 創(chuàng)建的 Grid 和主機生成的 Grid,在 Kepler GK110 中引入新 Grid Management Unit (GMU)。該控制單元管理并優(yōu)先化傳送到 CWD 要發(fā)送到 SMX 單元執(zhí)行的 Grid。

    Kepler 中的 CWD 保留準備好調(diào)度的 Grid,并能調(diào)度 32 個活動的 Grid,這是 Fermi CWD 容量的兩倍。Kepler CWD 通過雙向鏈接進行通信,允許 GMU 暫停新 Grid 的調(diào)度并保留掛起和暫停的 Grid,直到需要。GMU 也有到 Kepler SMX 單元的直接連接,允許 Grid 通過 Dynamic Parallelism 在 GPU 上啟動其他工作,以將新工作傳回到 GMU 進行優(yōu)先化和調(diào)度。如果暫停調(diào)度的額外工作量的內(nèi)核,GMU 將保持其為不活動,知道以來工作完成。

1

    重新設計的 Kepler HOST 到 GPU 的工作流顯示新 Grid Management Unit,允許其管理主動調(diào)度的 Grid、暫停調(diào)度、保留掛起和暫停的 Grid。

NVIDIA GPUDirect

    當處理大量的數(shù)據(jù)時,提高數(shù)據(jù)吞吐量并降低延遲,對于提高計算性能是至關重要的。Kepler GK110 支持NVIDIA GPUDirect 中的 RDMA,目的是通過允許第三方設備,如 IB 適配器、NIC 和 SSD,直接訪問 GPU 內(nèi)存‐來提高性能。使用 CUDA 5.0 時,GPUDirect 提供以下重要功能:

     無需 CPU方面的數(shù)據(jù)緩沖, NIC 和 GPU 之間的直接內(nèi)存存取 (DMA)
     顯著改善 GPU和其他網(wǎng)絡節(jié)點之間的 MPISend/ MPIRecv 效率。
     消除了 CPU 帶寬和延遲的瓶頸
     與各種第三方網(wǎng)絡、捕獲和存儲設備一起工作

    如逆時偏移(用于石油和天然氣勘探地震成像)這樣的應用程序,將大量影像數(shù)據(jù)分布在多個GPU。數(shù)以百計的 GPU 必須合作,以緊縮的數(shù)據(jù),經(jīng)常通信中間結(jié)果 GPUDirect 利用 P2P 和RDMA 功能為服務器內(nèi)或服務器之間“ GPU‐ 到‐GPU” 的通信的情況分配更高的總帶寬。

    Kepler GK110 還支持其他功能 GPUDirect,如 Peer‐to‐Peer 和 GPUDirect for Video。

1

    GPUDirect RDMA 允許網(wǎng)絡適配器這樣的第三方設備訪問GPU內(nèi)存,轉(zhuǎn)換為跨節(jié)點GPU之間直接傳輸。

    GTX TITAN的造型無論從美觀還是效能上都堪稱經(jīng)典,這次GeForce GTX 780依然采用了和它一樣的設計。改進型的渦輪離心式風扇不僅繼承了前輩多卡SLI互相干擾小的優(yōu)點,而且在噪音控制上也非常出色。

2

▲ GTX TITAN

1

▲ GTX 780

    其實這也在情理之中,GTX 690別具匠心的設計深受好評,如果僅僅在一款雙芯火星卡上曇花一現(xiàn)未免太過可惜。看來NVIDIA打算將旗艦卡都采用這種設計。

2

▲ GTX TITAN

1

▲ GTX 780

    改良版的渦輪離心式風扇看起來非常美觀,拆下外殼以后的風扇全貌可以看出,GTX 780和GTX TITAN一模一樣。

2

▲ GTX TITAN

1

▲ GTX 780

    散熱器頗有份量,工藝也非常不錯,至少擰了一二十個螺絲才將其拆下。均熱板底座比普通純銅底座散熱效率更高,和TITAN也是一模一樣。組裝起來渾然一體,拆開以后卻發(fā)現(xiàn)零件眾多,和一般顯卡相比,GTX 780的散熱器構造比較復雜。

2

這是GTX 780的散熱器的核心部件,底座鰭片一體式的鍍鉻散熱模塊。

2

▲ GTX TITAN

1

▲ GTX 780

    PCB結(jié)構緊湊,用料扎實但并沒有華碩的戰(zhàn)神、微星的閃電那么張揚,可以看出GTX TITAN和GTX 780完全一樣。

2

▲ GTX TITAN

1

▲ GTX 780

    其實對于多數(shù)人來,GK110雖然從未正式亮相消費級市場,但并不陌生,NVIDIA之前為高性能服務器設計的優(yōu)異產(chǎn)品Tesla K20X采用的就是這款芯片。
別看它其貌不揚,它可是集成了71億晶體管的真正怪獸。GTX780和GTX TITAN核心標號有所不同,TITAN為GK110-400-A1,GTX 780則是GK110-300-A1。

2

▲ GTX TITAN

1

▲ GTX 780

    除此之外TITAN的核心頻率為837MHz,GTX 780為863MHz,兩者都支持GPU BOOST,TITAN又比GTX 780多了兩組SMX,所以兩者的TDP均為250W,比Tesla高出15W。都是8加6Pin接口,5加1相供電。

2

▲ GTX TITAN

1

    顯存顆粒均為三星出品,編號同樣是K4G20325F0-FC03,但GTX TITAN采用的是samsung 222,正反24個顆粒組成了384bit、6GB容量的顯存規(guī)格,GTX 780采用的是samsung 310,正面12個顆粒組成了384bit、3GB容量的顯存規(guī)格。規(guī)格不變但容量上少了一半,一般來說3GB顯存足夠應付一切游戲,但TITAN在4K以上分辨率應當更具優(yōu)勢。

2

▲ GTX TITAN

1

▲ GTX 780

    和TITAN一樣,GTX 780做工也是一絲不茍,該屏蔽的地方絕不含糊。筆者感覺比之前的公版做工都要更好一些,當然這些都是它應該具備的東西,GTX 780雖然比GTX TITAN售價便宜不少,但也要5000元以上。

2

▲ GTX TITAN

1

▲ GTX 780

    可以看到GTX 780和GTX TITAN背面有明顯區(qū)別,GTX 780PCB背面并沒有顯存顆粒。

2

▲ GTX TITAN

1

▲ GTX 780

    考慮到它的定位,GTX 780和TITAN的長度并不算夸張,空間設計合理的中等大小機箱即可容納。

2

▲ GTX TITAN

1

▲ GTX 780

    接口方面,GTX 780和GTX TITAN也是一樣,NV高端顯卡經(jīng)典的接口組合:DP HDMI 雙DVI的陣型無論是對付多個顯示設備還是多種顯示設備均毫無壓力。

    此次測試的顯卡主要定位高端旗艦,測試時所有游戲中開啟全部特效,包括4X抗鋸齒(AA)和16X各向異性過濾(AF)。雖然很多游戲提供了更高精度的AA,但由于實用價值不高,且沒有可對比性,所以不做測試。

1

    目前也有部分顯示器是(1920x1200),游戲在這種分辨率下的性能表現(xiàn)與1920x1080差不多,F(xiàn)PS稍低一點點,使用這種顯示器的朋友依然可以參考我們的測試成績。

● 測試平臺主板:技嘉G1.Sniper M3

技嘉 Z77 游戲系列主板

    技嘉 G1.Sniper M3是一款采用m-ATX板型設計的高端Z77主板,它結(jié)合了屢獲殊榮的G1.Killer設計理念,目標是給玩家提供強大的性能。無論是內(nèi)建Creative專業(yè)級音效處理器、Sound Core3D高質(zhì)感音效輸出還是支持 cFosSpeed 與網(wǎng)絡加速技術的芯片,都是為了讓玩家能有最棒的娛樂和聯(lián)網(wǎng)游戲體驗。

● 測試平臺電源:Antec HCP1200

Antec HCP1200評測

    安鈦克Antec HCP1200電源在世界超頻大賽中非常常見,通過了80PLUS認證,轉(zhuǎn)換效率高達92.4%,支持4路12V輸出,最高電流72A,支持四卡SLI/交火。平均無故障運行時間為10萬小時。配備一顆8cm靜音風扇,運行噪音極低。

● 測試平臺SSD:OCZ Vetrx3 240GB

OCZ VERTEX4 128G升級新固件對比評測

   OCZ的Vertex系列屬于它的高端固態(tài)硬盤,專門為高端玩家和存儲發(fā)燒友設計。隨著Sandforce控制器大紅大紫,OCZ也將Vertex系列升級到了全新的SF1200方案。如今SATA3.0 6Gbps接口大行其道,OCZ推出了基于SF2200系列主控芯片的Vertex 3固態(tài)硬盤,涵蓋60-480GB容量范圍。

    既然針對平臺不同,測試項目自然也相去甚遠。三大平臺除了PC追求極致性能外,筆記本和平板都受限于電池和移動因素,性能不是很高,因此之前的3Dmark11雖然有三檔可選,依然不能準確衡量移動設備的真實性能。

性能大洗牌!全系列顯卡鏖戰(zhàn)新3DMARK

3DMARK主界面

    而這次Futuremark為移動平臺量身定做了專有測試方案,新一代3DMark三個場景的畫面精細程度以及對配置的要求可謂天差地別。

性能大洗牌!全系列顯卡鏖戰(zhàn)新3DMARK

    Fire Strike、Cloud Gate、Ice Storm三大場景,他們分別對應當前最熱門的三大類型的電腦——臺式電腦、筆記本電腦和平板電腦。

泰坦的孿生兄弟!NVIDIA GTX 780首測

▲ GTX 780 3Dmark Extreme模式得分

泰坦的孿生兄弟!NVIDIA GTX 780首測

▲ GTX 780 SLI 3Dmark Extreme模式得分

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    最新的3DMARK軟件,最嚴苛的Fire Strike Extreme模式中,GTX 780 SLI以6672的成績遙遙領先于其它顯卡,新3DMark SLI效率不錯。

<

3DMark11權威測試!22款DX11顯卡排行

顯卡決戰(zhàn)3DMark11 顯卡決戰(zhàn)3DMark11

    3DMark11的測試重點是實時利用DX11 API更新和渲染復雜的游戲世界,通過六個不同測試環(huán)節(jié)得到一個綜合評分,藉此評判一套PC系統(tǒng)的基準性能水平。

● 3DMark 11的特色與亮點:

1、原生支持DirectX 11:基于原生DX11引擎,全面使用DX11 API的所有新特性,包括曲面細分、計算著色器、多線程。

2、原生支持64bit,保留32bit原生64位編譯程序,獨立的32位、64位可執(zhí)行文件,并支持兼容模式。

3、新測試場景:總計六個測試場景,包括四個圖形測試(其實是兩個場景)、一個物理測試、一個綜合測試,全面衡量GPU、CPU性能。

4、拋棄PhysX,使用Bullet物理引擎:拋棄封閉的NVIDIA PhysX而改用開源的Bullet專業(yè)物理庫,支持碰撞檢測、剛體、軟體,根據(jù)ZLib授權協(xié)議而免費使用。

1

▲ GTX 780 3Dmark 11 Extreme模式得分

泰坦的孿生兄弟!NVIDIA GTX 780首測

▲ GTX 780 SLI 3Dmark Extreme模式得分

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    3Dmark11大量特效堆砌出來的以假亂真的畫面讓GTX770也不能完全流暢運行它,GTX 780以上的顯卡就稍微流暢一些。本次測試中所有顯卡一視同仁開啟Extreme模式,高端級和旗艦級性能差距依舊非常明顯。

    對于現(xiàn)代顯卡測試而言,除了3DMark之外必不可少的項目就是來自俄羅斯的Unigine Heaven(天堂),尤以其高負載、高壓榨而知名?,F(xiàn)在,新一代3DMark發(fā)布之后,Unigine也奉上了全新的顯卡測試程序“Valley”(山谷)。
Valley正是Heaven的開發(fā)團隊一手打造的,可以在最大程度上榨干GPU顯卡資源。這次場景來到了一個優(yōu)美空靈的山谷,群山環(huán)繞,郁郁蔥蔥,白雪皚皚,旭日初升,而且擁有極致的細節(jié),每一片花瓣、每一株小草都清晰可見。

泰坦的孿生兄弟!NVIDIA GTX 780首測

主要技術特點包括:
— 場景面積達6400萬平方米,超高細節(jié)
— 整個場景可以完全自由瀏覽,并支持鳥瞰、漫步模式
— 先進視覺技術:動態(tài)天空、體積云、陽光散射、景深、環(huán)境光遮蔽
— 所有植被、巖石均為實時渲染,而非貼圖
— 用戶可控的動態(tài)天氣
— 支持立體3D、多屏幕
— 極限硬件穩(wěn)定性測試
— 基準測試預設
— 監(jiān)視每一幀畫面對應的GPU溫度和頻率
— 多平臺支持:Windows、Linux、Mac OS X
— 支持命令行自動執(zhí)行
— CSV格式可定制報告

泰坦的孿生兄弟!NVIDIA GTX 780首測

    Unigine Valley分為基礎版、高級版、專業(yè)版三個版本,其中基礎版免費,支持測試預設、自定義設置、GPU監(jiān)視、交互模式,不支持循環(huán)測試(也就是拷機模式)、命令行、CSV報告,對于普通用戶和一般評測足夠用了。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    Unigine Valley的場景面積達6400萬平方米,超高細節(jié),對顯卡渲染提出了很大的考驗,在未來的游戲中,類似的情況將會越來越多。GTX 780可以在極端HD模式下達到58.2FPS,雙卡SLI更是達到99.1FPS,性能遠超GTX TITAN。

    《孤島危機3》支持大量的高端圖形選項以及高分辨率材質(zhì)。在游戲中,PC玩家將能看到一系列的選項,包括了游戲效果、物品細節(jié)、粒子系統(tǒng)、后置處理、著色器、陰影、水體、各向異性過濾、材質(zhì)分辨率、動態(tài)模糊以及自然光。技術主管Marco Corbetta表示之所以《孤島危機2》并不包含這么多的選項,是因為開發(fā)主機板的開發(fā)組實在是搞的太慢了。

DX11最強引擎!主流卡鏖戰(zhàn) Crysis 3

● 實時體積煙云陰影(Real-Time Volumetric Cloud Shadows)

    實時體積煙云陰影(Real-Time Volumetric Cloud Shadows)是把容積云,煙霧和粒子陰影效果結(jié)合起來的一種技術。和之前的類似技術相比,實時體積煙云陰影技術允許動態(tài)生成的煙霧擁有體積并且對光線造成影響,和其他物體的紋理渲染互動變化。

● 像素精度置換貼圖(Pixel Accurate Displacement Mapping)

    像素精度置換貼圖(Pixel Accurate Displacement Mapping)可以讓CryEngine 3引擎無需借助DX11的細分曲面技術即可一次渲染出大量沒有明顯棱角的多邊形。此前crytek曾透露過正在考慮在主機上實現(xiàn)類似PC上需要DX11硬件才能實現(xiàn)的細分曲面效果,看來此言非虛,新型的位移貼圖技術來模擬細分曲面的效果。雖然實現(xiàn)原理完全不同,但效果看起來毫不遜色。

顯卡危機!畫質(zhì)最強游戲 Crysis3評測

極度精細逼真,完全嵌合的植被(Tessellated Vegetation)

● 實時區(qū)域光照(Real-Time Area Lights)

    實時區(qū)域光照(Real-Time Area Lights)從單純的模擬點光源照射及投影進化到區(qū)域光照的實現(xiàn),以及可變半陰影(即投影隨著距離的拉長出現(xiàn)模糊效果),更準確的模擬真實環(huán)境的光照特性。

● 布料植被綜合模擬(Integrated Cloth & Vegetation Simulation)

    布料植被綜合模擬(Integrated Cloth & Vegetation Simulation)其實在孤島危機1代中植被已經(jīng)有了非常不錯的物理效果,會因為人物經(jīng)過而擺動,但是這次crytek更加強化了這方面的效果,還有就是加入了對布料材質(zhì)的物理模擬,這方面之前只有nvidia的physx做得比較好。

● 動態(tài)體積水反射(Dynamic Water Volume Caustics)

顯卡危機!畫質(zhì)最強游戲 Crysis3評測

    動態(tài)體積水反射(Dynamic Water Volume Caustics)孤島危機1和2基本上在水的表現(xiàn)上集中在海水,很少有湖泊和類似大面積積水潭的場景,而這次crytek實現(xiàn)了超遠視野的水面動態(tài)反射。動態(tài)體積水反射可以說是孤島危機2中的本地實時反射的一個延伸,是結(jié)合靜態(tài)環(huán)境采樣和動態(tài)效果的新的水面反射技術。

顯卡危機!畫質(zhì)最強游戲 Crysis3評測

絕密細分的蟾蜍驚艷絕倫,完全可以以假亂真!

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    作為新一代DX11游戲的畫質(zhì)標桿,孤島危機3相比上一代對顯卡提出了更高的要求,而在這款代表著最尖端畫質(zhì)的游戲中,雙核心的優(yōu)化做的非常出色,我們可以看到GTX 780 SLI幾乎達到了兩倍的GTX 780的性能!

    這些年我們看到了不少形態(tài)各異的勞拉,從豐乳肥臀的動作游戲主角到喜歡探索亞特蘭蒂斯文明的睿智貴族。不過我們從未見過這樣的勞拉。Crystal Dynamics的《古墓麗影9》讓我們看到了一個參加初次探險的年輕勞拉,她遭遇海難被困在刀槍林立的小島上,必須將自己的智謀和求生欲望提升到極限。

1

    劇情介紹:故事從年少時期的勞拉開始,勞拉所乘坐的“堅忍號”仿佛是被宿命所呼喚,在日本海的魔鬼海遭遇到了臺風,不幸擱淺。勞拉也被迫到島上開始自己的求生經(jīng)歷。

1

    古墓麗影9的游戲畫面較之前代上升了不少,游戲要求也提高了不少。

1

    這是我們開啟不同畫質(zhì)的游戲截圖對比,可以看出“高”特效的畫質(zhì)已經(jīng)非常不錯了。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    古墓麗影9對A卡的優(yōu)化非常到位,當然最新的N卡驅(qū)動進行了優(yōu)化以后,N卡游戲性能也得到大幅提升。在Benchmark測試中,即使是2560X1600分辨率+“最高”畫質(zhì)下,GTX 780依然可以流暢運行,和TITAN的性能差距很小,而雙卡SLI則是遙遙領先。

  由EA DICE工作室開發(fā)的《戰(zhàn)地3》采用了最新的“寒霜2”引擎,完美支持DirectX 11,并且擁有強大的物理效果,最大的亮點還是光照系統(tǒng),其渲染的場景已近乎亂真的地步,視覺效果堪稱絕贊。游戲還支持即時晝夜系統(tǒng),為玩家營造一個親臨現(xiàn)場的真實環(huán)境。

索泰2GB顯卡測試

    寒霜2引擎最大的特點便是支持大規(guī)模的破壞效果。由于考慮到游戲的畫面表現(xiàn)以及開發(fā)成本,DICE放棄了以只支持DX9的WINDOWS XP操作系統(tǒng)。另外由于該引擎基于DX11研發(fā),向下兼容DX10,因而游戲只能運行于WINDOWS VISTA以上的的操作系統(tǒng)。

索泰2GB顯卡測試

    在《戰(zhàn)地3》中,“寒霜引擎2”內(nèi)置的破壞系統(tǒng)已經(jīng)被提升至3.0版本,對于本作中的一些高層建筑來說,新版的破壞系統(tǒng)將發(fā)揮出電影《2012》那般的災難效果,突如其來的建筑倒塌將震撼每一位玩家的眼球。

索泰2GB顯卡測試

  《戰(zhàn)地3》采用了ANT引擎制作人物的動作效果。在此之前,ANT引擎已在EA Sports旗下的《FIFA》等游戲中得到應用,不過在FPS游戲中使用尚屬首次。相較于Havok等物理引擎,用ANT引擎可以花費較少的精力制作出逼真的效果。舉例來說,戰(zhàn)士在下蹲時會先低頭俯身、放低槍口,而不是像以前的游戲那樣頭、身、槍如木偶般同時發(fā)生位移。此外,ANT引擎也可以讓電腦AI的行動更加合理。但這款大作目前并不能良好的兼容120Hz3D以及紅藍3D模式。 

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

   寒霜2引擎大作戰(zhàn)地三,是為數(shù)不多的畫面可以挑戰(zhàn)Crysis的游戲大作,而對核心和顯存的要求已經(jīng)超越了Crysis!越是要求變態(tài)的游戲,旗艦級顯卡就越喜歡,這款游戲中,GTX 780和TITAN的差距也是非常小!

    游戲介紹:《地鐵2033》(Metro 2033)是俄羅斯工作室4A Games開發(fā)的一款新作,也是DX11游戲的新成員。該游戲的核心引擎是號稱自主全新研發(fā)的4A Engine,支持當今幾乎所有畫質(zhì)技術,比如高分辨率紋理、GPU PhysX物理加速、硬件曲面細分、形態(tài)學抗鋸齒(MLAA)、并行計算景深、屏幕環(huán)境光遮蔽(SSAO)、次表面散射、視差貼圖、物體動態(tài)模糊等等。

華麗背后的陷阱!A/N DX11顯卡再碰撞

開啟景深,模擬鏡頭感

    畫面設置:《地鐵2033》雖然支持PhysX,但對CPU軟件加速支持的也很好,因此使用A卡玩游戲時并不會因PhysX效果而拖累性能。該游戲由于加入了太多的尖端技術導致要求非常BT,以至于我們都不敢開啟抗鋸齒進行測試,只是將游戲內(nèi)置的效果調(diào)至最高。游戲自帶Benchmark,這段畫戰(zhàn)斗場景并不是很宏大,但已經(jīng)讓高端顯卡不堪重負了。

    測試說明:如果說是CRYSIS發(fā)動了DX10時代的顯卡危機,那地鐵2033無疑是DX11時代的顯卡殺手!地鐵2033幾乎支持當時可以采用的所有新技術,在畫面雕琢上大肆鋪張,全然不顧顯卡們的感受,和CRYSIS如出一轍。然而CRYSIS靠著特效的堆積和不錯的優(yōu)化,其驚艷絕倫的畫面和DX9C游戲拉開了距離,終究賺足了眼球;而地鐵則沒有這么好運了,畫面固然不差,BUG卻是很多,招來了大量的非議。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    地鐵2033,一款銷量慘淡,游戲性一般但因為其對顯卡硬件的變態(tài)要求而家喻戶曉的游戲。這款游戲GTX 780和TITAN在極端模式下無法達到30FPS,只有GTX 780 SLI才能完美運行!

DX9/10/11三大戰(zhàn)役!A/N旗艦性能對決

    游戲引擎開發(fā)商BitSquid與游戲開發(fā)商Fatshark近日聯(lián)合公布了一個展示DX11強大技術的DEMO。這個名為《StoneGiant》(石巨人)的DEMO,可以讓玩家來測試自己PC顯卡的DX11性能。BitSquid Tech即將提供PC平臺的引擎,并且大概在今年第三季度將提供PS3和Xbox 360等其他平臺的引擎。

核心顯存誰重要?GTX460SE性能全測試 核心顯存誰重要?GTX460SE性能全測試

    畫面設置:StoneGiant是一款技術演示Demo,畫面做的非常精美,進入之后可以選擇開啟關閉Tessellation以及DOF(DX11級別景深)進行測試,這兩項技術都十分消耗資源,尤其是同時打開時。其中Tessellation技術對畫質(zhì)的改善最為明顯,測試時默認開啟Tessellation、打開DOF進行測試。

    測試方法:自帶Benchmark。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    GTX780或者GTX TITAN對付這款比較老的BENCHMARK顯然毫無壓力,GTX 780 SLI成績依然表現(xiàn)搶眼。

    《Aliens vs. Predator》同時登陸PC、X360和PS3,其中PC版因為支持DX11里的細分曲面(Tessellation)、高清環(huán)境光遮蔽(HDAO)、計算著色器后期處理、真實陰影等技術而備受關注,是AMD大力推行的游戲之一,但是這樣的主題難免讓本作有很多不和諧的地方,暴力血腥場面必然不會少!發(fā)行商世嘉在2009年11月就曾明志,表示不會為了通過審查而放棄電子娛樂產(chǎn)品發(fā)行商的責任,因為游戲要維持“異形大戰(zhàn)鐵血戰(zhàn)士”這一中心主題,無論畫面、玩法還是故事線都不能偏離。

超頻風暴來襲 鐳風HD6850 Xstorm評測

    畫面設置AVP原始版本并不支持AA,但升級至1.1版本之后,MSAA選項出現(xiàn)在了DX11增強特效當中,當然還支持Tessellation、HDAO、DirectCompute等招牌。該游戲要求不算太高,所以筆者直接將特效調(diào)至最高進行測試。

    測試方法:游戲帶Benchmark,其中測試畫面頗代表意義,很好的體現(xiàn)了Tessellation異形身體以及HDAO等高級特效,希望這些特效能讓系統(tǒng)發(fā)揮所有潛力。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

   幾乎所有游戲都無法和GTX 780雙卡SLI相抗衡,這款當初要求變態(tài)的游戲,現(xiàn)在速度也達到了88.5FPS!

  在互聯(lián)網(wǎng)時代的今天,網(wǎng)絡日益融入人們的生活,愛網(wǎng)、用網(wǎng)成為時尚,上網(wǎng)絡玩游戲成為青年喜愛的娛樂方式之一。軍事游戲在國外一些軍隊已發(fā)展多年、形成體系,并廣泛應用于教育、訓練。我軍軍事游戲目前尚處于起步階段,基層部隊日常娛樂多以小型益智類棋牌游戲為主,形式和功能都比較單一。

1

    一些部隊開展網(wǎng)上軍事游戲?qū)?,使用的也大都是國外軍事游戲的漢化版,游戲內(nèi)容和體現(xiàn)的價值理念、軍事思想,與我軍有很大差異,長期使用不利于部隊教育訓練,甚至可能誤導官兵。新研發(fā)的軍事游戲《光榮使命》擁有完全自主知識產(chǎn)權,填補了我軍軍事游戲的空白。

12

  在總部有關部門指導下,南京軍區(qū)抽調(diào)骨干力量展開研發(fā)工作。歷時半年,研究分析了34款主流軍事游戲,先后派出6個專題小組,召開30多場座談會,調(diào)研摸清官兵的興趣愛好和現(xiàn)實需求,并在部隊政工網(wǎng)開設“游戲開發(fā)論壇”,發(fā)動官兵建言獻策。他們經(jīng)考察了20多家游戲企業(yè),最終選定與無錫巨人網(wǎng)絡公司進行合作研發(fā)。

    正式研發(fā)階段,南京軍區(qū)專門組成軍事指導組,指導游戲設置,配合動作捕捉;聘請國內(nèi)知名游戲公司技術人員擔任顧問,參與項目評審,幫助解決技術難題。經(jīng)過兩年半的摸索實踐,2011年4月初完成了測試版本,進一步測試、修改后,6月20日完成了正式版本,被行業(yè)專家稱為“軍事游戲的一個突破,游戲產(chǎn)業(yè)的一個創(chuàng)舉”。 

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    光榮使命不僅是第一款支持DX11的國產(chǎn)游戲,同時也是支持PhysX物理加速的游戲。在這款游戲的Benchmark測試中,GK110和加強版GK104核心還是有不小的優(yōu)勢。

  《狙擊精英》是2005年Reblion推出的一款以二戰(zhàn)為背景的狙擊游戲作品,一經(jīng)推出后就獲得英國獨立游戲開發(fā)者協(xié)會的“非常好的PC/主機游戲”大獎,《狙擊精英V2》則是這款作品的續(xù)作,據(jù)游戲開發(fā)商稱續(xù)作繼續(xù)秉承了游戲潛入類狙擊的風格,較初代來說更加注重槍擊后的真實感,“我們保證,新游戲?qū)⑹亲钫鎸嵉亩?zhàn)狙擊類游戲。不僅僅在武器彈道上,還有在開槍之前那種緊張的氣氛,都會很真實的表現(xiàn)出來?!盧ebellion的首席執(zhí)行官杰森·科林斯雷(Jason Kingsley)如是說。

12

  游戲的畫面在整體上相當?shù)牟诲e,無論是從整體的質(zhì)感,還是畫面的流暢性看都達到了很高的水準,在光源的處理上也非常的到位。同時,游戲依舊延續(xù)了初代精益求精的場景設計的理念,比如城市巷戰(zhàn)地圖中的斷壁殘垣以及黑煙沖天、山洞地圖中充滿著神秘氣息的導彈基地等都給筆者留下了深刻的印像。

12

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    這款游戲支持超級采樣AA,特效全開以后對顯卡的要求達到了驚人的地步,甚至超越了素有顯卡殺手之稱的地鐵2033,所以我們本次測試并沒有開啟超級采樣,僅僅開啟了4XMSAA,這樣畫面流暢多了。

    《失落的星球2》的游戲舞臺是前作故事發(fā)生后十幾年之后經(jīng)過溫暖化改變的EDN-3rd,這里將新增叢林等新場景,主人公也并非前作那樣為一人,而是以“雪賊”們不同的視點展開故事。

第二代DX11架構!HD6870/6850全面評測

電源多大才夠用旗艦級顯卡功耗全測試

    畫面設置:與前作相同,《失落的星球2》采用CAPCOM公司原創(chuàng)引擎MT Framework的最新版VER.2.0進行開發(fā),游戲世界的表現(xiàn)將更加細致和美麗。而不僅僅是畫面上的進化,本作將會在前作玩家要求基礎上追加大量全新要素,新場景、新角色、新武器等自不必說,角色的動作也比前作更加豐富多彩。

    測試方法:游戲自帶Benchmark,開啟全特效+4AA選擇B場景的BOSS戰(zhàn),非常激烈過癮。

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    這款游戲非常老了,對顯卡的要求也不算太高,所以參測的數(shù)款顯卡成績并沒有完全拉開,GTX 780 SLI也不能發(fā)揮全部的實力。

    我們的功耗測試方法是直接統(tǒng)計整套平臺的總功耗,既簡單、又直觀。測試儀器為微型電力監(jiān)測儀,它通過實時監(jiān)控輸入電源的電壓和電流計算出當前的功率,這樣得到的數(shù)值就是包括CPU、主板、內(nèi)存、硬盤、顯卡、電源以及線路損耗在內(nèi)的主機總功率(不包括顯示器)。

G80禁錮的右半部分

    待機為windows7桌面下獲得的最小值;滿載是以1680X1050模式運行Furmark時的最大值,F(xiàn)urmark能夠讓顯卡穩(wěn)定的以100%滿負載模式運行,測得的功耗值比一般的游戲要高一些。

顯卡空閑整機功耗測試(顯示器除外)

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

顯卡滿載整機功耗測試(顯示器除外)

TITAN慘遭秒殺!GTX 780 SLI巔峰測試

    待機功耗TITAN的表現(xiàn)不盡如人意,而GTX 780整機(不包含顯示器)只有76W,即使雙卡SLI,也只有87W,所以在閑置狀態(tài),GTX 780 SLI比單卡GTX TITAN還要省電。滿載工以后GTX 780 SLI功耗達到了554W,比TITAN高出將近一倍。所以想要組建雙卡SLI平臺的朋友一定要配備足額電源,筆者建議至少700W以上!

    Kepler架構終極形態(tài)GK110又一次提高了游戲行業(yè)的標準,在單臺計算機上進行設計和渲染,GK110核心的工作站可以實時編輯更多圖層與特效,查看更大的地震數(shù)據(jù)集并與之互動同時不會因數(shù)據(jù)堵塞而令系統(tǒng)失去響應,以GPU為核心的計算模式再次被發(fā)揚光大。

NVIDIAGeForce GTX780顯卡

     Kepler GK110架構有很多創(chuàng)新,如SMX、Dynamic Parallelism 和 Hyper‐Q等等,這些功能不僅使混合計算大大簡化,同時也簡化了編程接口,有望催生出更優(yōu)秀的軟件,適用于更廣泛的應用。

    多顯卡并行機制的歷史最早可以追溯到1998年,當時Voodoo 2所具有的“SLI交錯互連技術”可以讓兩塊Voodoo 2顯卡連接起來并行運作,獲得近乎翻倍的3D效能。如此一來,其他競爭者就望塵莫及。而經(jīng)過多年的發(fā)展演化,NVIDIA的SLI技術已經(jīng)趨于成熟,從測試結(jié)果來看,最新的主流3D游戲均可以完美支持SLI,游戲性能可以提升80%甚至更多。

● GTX 780 SLI對比 GTX TITAN 的優(yōu)勢:

1. 外觀做工設計GTX 780是GTX TITAN的孿生兄弟;
2. 雙卡SLI游戲性能大幅超越GTX TITAN,性價比高;
3. 市場鋪貨充足,有多個品牌公版、非公版可供選擇。

● GTX 780 SLI對比 GTX TITAN 的劣勢:

1. TDP功耗高很多;
2. 兩塊成本比GTX TITAN高一些。
3. 對主板、電源有一定 要求,對機箱散熱風道也比較挑剔。

    事實上從測試結(jié)果可以看出,一代單芯卡皇在競爭對手面前毫無懼色,卻完敗給了它衍生出的次高端雙卡GTX 780 SLI,這究竟是戲劇的演化還是宿命的終結(jié)?而且我們應該知道,GTX780所使用的PCB和GTX TITAN幾乎一樣,通過刷BIOS開核的成功率也非常高,如果它開啟全部2688個流處理器的話,那么本來強勢的性能將會再上一層樓!

泰坦的孿生兄弟!NVIDIA GTX 780首測

GeForce GTX 780京東報價點擊進入……■<

0人已贊

關注我們

泡泡網(wǎng)

手機掃碼關注