由來
多顯卡并行機制的歷史最早可以追溯到1997年,當時的顯卡市場可以說是3Dfx一家獨大,該公司在1996年下半年所推出的Voodoo加速卡成為發(fā)燒友瘋狂追捧的一代經(jīng)典產品。1998年初,3Dfx推出了它們的第二代3D圖形卡產品—Voodoo 2,當時Voodoo 2擁有90Mps的像素填充率,具備Z-Buffering、Anti-Aliasing、單周期雙紋理等當時最先進的3D特性,大幅超越其上一代產品,其他對手更是被遠遠甩在了后頭。不過,最令發(fā)燒友瘋狂的是Voodoo 2所具有的“SLI交錯互連技術”,這項技術可以讓兩塊Voodoo 2顯卡連接起來并行運作,獲得近乎翻倍的3D效能。如此一來,其他競爭者更是望塵莫及。
Sli的運行
我們知道,CPU的并行運作是通過指令并行執(zhí)行獲得的,但對顯卡來說情況有所區(qū)別。顯卡最終生成的是所渲染的3D畫面,這項工作包含大量的指令,而如何將工作均等分配就成為問題,3Dfx選擇了按畫面幀線進行渲染的方式。SLI技術將一幅渲染的畫面分為一條條掃描幀線(Scanline),若Voodoo 2采用雙顯卡運行模式,那么就由一個顯卡負責渲染畫面的奇數(shù)幀線部分,另一塊顯卡渲染偶數(shù)幀線,然后將同時渲染完畢的幀線進行合并后寫入到幀緩沖中,接下來顯示器就可以顯示出一個完整的渲染畫面。不難看出,SLI技術讓渲染工作被平均分擔,每塊顯卡只需要完成1/2的工作量。理論上說,渲染效率自然也可以提高1倍,這就是雙顯卡并行大幅提升效能的奧秘所在。SLI在技術上極為成功,而發(fā)燒友們對Voodoo 2也抱有莫大的熱情。在當時,你如果希望在1080p的“高分辨率”下流暢地玩3D游戲,唯一的解決方案就是使用兩塊Voodoo 2顯卡并讓它們工作在SLI模式下。
原理
在Voodoo 2之后的Voodoo 3,3Dfx沒有效仿這個SLI雙顯卡技術,但在Voodoo 4/5/6時代,3Dfx重新恢復了SLI,但應用的形式已有所區(qū)別。Voodoo 2倡導雙顯卡并行運作,兩塊顯卡插在PCI槽里再用專用的線纜連接起來,但這并非必需的,單個Voodoo 2顯卡也可以獨自工作,只是速度較慢而已。2000年春,3Dfx推出VSA100圖形芯片,當時nVIDIA已經(jīng)壓過3Dfx成為領先者,為了奪回自己的領導地位,3Dfx讓SLI技術重裝上陣。VSA100可支持單芯片、雙芯片和四芯片并行運作,單芯片版本就是Voodoo 4,雙芯片顯卡為Voodoo 5 5500,而四芯片顯卡則是著名的Voodoo 5 6000。此時,SLI技術演變?yōu)閱物@卡多圖形芯片的形式,不需占用兩個插槽,但內部的工作機制并沒有發(fā)生多大的變化,依然是通過劃分渲染幀的方式各自執(zhí)行,然后在幀緩沖中統(tǒng)一合成。出于眾所周知的原因,這些顯卡都沒獲得廣泛認可,3Dfx也從衰落走向死亡。2001年初,nVIDIA收購了3Dfx,SLI技術也隨之成為了歷史,盡管nVIDIA掌握了3Dfx的所有技術,但它并沒有將之發(fā)揚光大,而是繼續(xù)按照自己的道路走下去,收購3Dfx的目的也許只是消滅一個競爭對手而已。
在這之后,我們看到了nVIDIA順利一統(tǒng)江湖,接著就是ATi逐漸發(fā)起挑戰(zhàn),GeForce和Radeon是人們最常掛在嘴邊的名詞,至于3Dfx和它的SLI已經(jīng)逐漸被人淡忘了,即便偶爾有人談起,也多是說那是一個策略糟糕的企業(yè)和一項昂貴不切實際的技術。在顯卡的歷史中,除了Voodoo 2之外沒有哪一項多顯卡、多芯片技術曾獲得成功,雖然ATi嘗試過,新生的XGI也勇闖該領域,然而事實證明這個方案并不受用戶們的歡迎。不過,誰也沒有想到nVIDIA重新拾起3Dfx的SLI技術。2004年6月29日,nVIDIA大張旗鼓發(fā)布了“SLI Multi-GPU技術”,并將該技術引入最新發(fā)布的GeForce 6800和Quadro FX4000系列顯卡上。沿用“SLI”這個名稱或多或少讓人聯(lián)想到3Dfx,nVIDIA想要的也許正是這個效果,它更希望被用戶認為是3Dfx技術的一脈相承。但如果我們深入分析,便會發(fā)現(xiàn)它與3Dfx的SLI技術沒有多少相同的地方,基本上就是一套nVIDIA新搞出來的多顯卡方案。
nVIDIA的SLI技術與早先3dfx的SLI雖然縮寫相同,其實已經(jīng)是全新的技術,不但工作原理不同,甚至名稱都不相同,3dfx的SLI(Scan Line Interleave,雙掃描線交錯技術)是將畫面分為一條條掃描幀線(Scanline),兩塊顯卡對奇數(shù)幀線和偶數(shù)幀線分別渲染,然后將同時渲染完畢的幀線進行合并后寫入到幀緩沖中,接下來顯示器就可以顯示出一幅完整的畫面。而nVIDIA的SLI則有兩種渲染模式:分割幀渲染模式(Scissor Frame Rendering,SFR)和交替幀渲染模式(Alternate Frame Rendering,AFR),分割幀渲染模式是將每幀畫面劃分為上下兩個部分,主顯卡完成上部分畫面渲染,副顯卡則完成下半部分的畫面渲染,然后副顯卡將渲染完畢的畫面?zhèn)鬏斀o主顯卡,主顯卡再將它與自己渲染的上半部分畫面合成為一幅完整的畫面;而交替幀渲染模式則是一塊顯卡負責渲染奇數(shù)幀畫面,而另外一塊顯卡則負責渲染偶數(shù)幀畫面,二者交替渲染,在這種模式下,兩塊顯卡實際上都是渲染的完整的畫面,此時并不需要連接顯示器的主顯卡做畫面合成工作。
在SLI狀態(tài)下,特別是在分割幀渲染模式下,兩塊顯卡并不是對等的,在運行工作中,一塊顯卡做為主卡(Master),另一塊做為副卡(Slave),其中主卡負責任務指派、渲染、后期合成、輸出等運算和控制工作,而副卡只是接收來自主卡的任務進行相關處理,然后將結果傳回主卡進行合成然后輸出到顯示器。由于主顯卡除了要完成自己的渲染任務之外,還要額外擔負副顯卡所傳回信號的合成工作,所以其工作量要比副顯卡大得多。另外,在SLI模式下,就只能連接一臺顯示器,并不能支持多頭顯示。
發(fā)展
SLI技術也在不斷的發(fā)展,最初對平臺硬件有許多限制,例如必須使用完全一樣的顯卡(同一個廠家同一個型號的顯卡,甚至顯卡BIOS也必須相同),而且在兩塊顯卡之間還必須使用SLI橋接器,支持SLI的也只有Geforce 6800 Ultra/6800 GT和6600GT三款顯示芯片等等。2006年以來組建SLI則可以使用不同廠家的采用相同顯示芯片的顯卡,低速顯卡可以不必使用SLI橋接器的時代已經(jīng)過去,從2008年至今,所有的英偉達顯卡想要實現(xiàn)SLI技術都必須通過橋接器進行連接,導致該現(xiàn)象的原因在于游戲質量的提升,顯卡性能的加強都對總線帶寬有更大的需求額,只有通過橋接器交換數(shù)據(jù),才不會造成總線的超負荷。,支持SLI的顯示芯片也擴大到了所有GTX系列,不過,由于各個主板的兩個PCI-E插槽的間距不是固定的,因此不同主板的SLI橋接器一般是不能替換的(中高端主板的PCI-E接口間距一般相同,也就是可以替換)。
實際性能
SLI技術理論上能把圖形處理能力提高一倍,在實際應用中,除了極少數(shù)測試之外,在實際游戲中圖形性能只能提高80%左右,在某些情況下甚至根本沒有性能提高,而能良好支持SLI的游戲還不太多。當然,隨著驅動程序的完善,SLI的實用性逐步提高。因為不支持SLI的游戲往往一張顯卡就足以應付,對系統(tǒng)性能高的游戲/程序則往往支持SLI。
使用兩塊顯卡組成 SLI配置時,這些利用 GPU 的游戲最高可實現(xiàn) 2 倍的大幅性能提升。 大多數(shù)當今最火爆的游戲以及新一代游戲均屬這一類型。 然而,一些應用程序 (通常是年代較老的應用程序) 還是會受到 GPU 處理能力以外的其它因素限制。
最常見的限制便是 CPU。 如果一款應用程序受限于 CPU,那么無論怎樣增強圖形動力也不會提升應用程序的性能。 在 1024x768 這樣的低分辨率且不開其它功能的情況下,這種現(xiàn)象最為常見。 啟用抗鋸齒以及各向異性過濾或切換至更高分辨率通??梢詫⑻幚砣蝿諒?CPU 移交給 GPU 處理。
主板芯片組根據(jù)其對兩塊顯卡實際提供的PCI Express Lanes,支持SLI的方式也不盡相同,有采用PCI Express X16加PCI Express X4的,也有采用雙PCI Express X8的,nVIDIA自己的nForce Pro 2200+nForce Pro 2050以及nForce4 SLI X16和nForce4 SLI X16 IE則實現(xiàn)了真正的雙PCI Express X16的SLI。
Hybrid SLI
在最新的MCP78中提供了hybrid SLI功能,即為獨立顯卡和集成顯卡的SLI。有兩種SLI方式。電源模式和性能模式
電源模式:當整合主板和高檔NVIDIA顯卡組成SLI時,在2D模式下使用集成顯卡,在3D模式下使用獨立顯卡。這樣可以起到省電的效果。
性能模式:當整合主板和低檔NVIDIA顯卡如Geforce8400或者Geforce8450組成SLI時,可以是兩張顯卡同時參與渲染而大幅提升圖形性能。
內容來自百科網(wǎng)