關(guān)注五金圈

微信掃一掃
關(guān)注五金圈

當(dāng)前位置:首頁(yè) » 五金頭條 » 高端訪談

AI芯片:16核心GPU原理剖析

2018-08-23 10:42:07來(lái)源:OFweek 已被 482 人閱讀      0人評(píng)論

內(nèi)容摘要:文章摘要:

       隨著AI市場(chǎng)的興起舍哄,近年來(lái)各業(yè)界精英在GPU上持續(xù)發(fā)力捉片,不斷推出全新的產(chǎn)品。新產(chǎn)品在計(jì)算能力提升的同時(shí),其芯片面積也已經(jīng)屢創(chuàng)新高,甚至逼近了制程和成本的平衡極限。前不久,一款超級(jí)計(jì)算機(jī)的發(fā)布杯巨,讓人嘩然蚤告,人們震驚的是其擁有16顆Volta GPU所展現(xiàn)的強(qiáng)大的計(jì)算能力,16核GPU可提供高達(dá)2PFLOPS的深度學(xué)習(xí)計(jì)算能力服爷,成為目前AI業(yè)界的最強(qiáng)者杜恰。


  這16顆Tesla V100的GPU連接在一起,并發(fā)揮出如此強(qiáng)大的計(jì)算能力的的核心當(dāng)屬NVlink 2和NVSwitch仍源。


  1心褐、NVlink


  隨著開(kāi)發(fā)人員在人工智能(AI)計(jì)算等應(yīng)用領(lǐng)域中越來(lái)越依賴并行結(jié)構(gòu),各行各業(yè)中的多GPU 和多CPU系統(tǒng)愈發(fā)普及笼踩。其中包括采用PCIe系統(tǒng)互聯(lián)技術(shù)的4GPU和8GPU系統(tǒng)配置來(lái)解決非常復(fù)雜的重大難題逗爹。然而,在多 GPU系統(tǒng)層面嚎于,PCIe帶寬逐漸成為瓶頸掘而,這就需要更快速和更具擴(kuò)展性的多處理器互聯(lián)技術(shù)。


  a于购、更快速袍睡、更具可擴(kuò)展性的互聯(lián)技術(shù)


  NVlink技術(shù)可以提供更高帶寬與更多鏈路,并可提升多GPU和多GPU/CPU系統(tǒng)配置的可擴(kuò)展性肋僧,因而可以解決這種互聯(lián)問(wèn)題斑胜。通過(guò)提高可擴(kuò)展性控淡,進(jìn)而實(shí)現(xiàn)超快速的深度學(xué)習(xí)訓(xùn)練。


  NVlink技術(shù)首先將每個(gè)方向的信號(hào)發(fā)送速率從20GB/每秒增加到25GB/每秒止潘。含此技術(shù)的產(chǎn)品可用于GPU至CPU或GPU至GPU的通信掺炭。


  b、3層控制層覆山,能更大限度提高系統(tǒng)吞吐量


  NVlink控制器由3層組成竹伸,即物理層(PHY)、數(shù)據(jù)鏈路層(DL)以及交易層(TL)簇宽。下圖展示了P100 NVlink 1.0的各層和鏈路:

 

 

      P100搭載的NVlink 1.0勋篓,每個(gè)P100有4個(gè)NVlink通道,每個(gè)擁有40GB/s的雙向帶寬魏割,每個(gè)P100可以最大達(dá)到160GB/s帶寬譬嚣。


  V100搭載的NVlink 2.0,每個(gè)V100增加了50%的NVlink通道達(dá)到6個(gè)钞它,信號(hào)速度提升28%使得每個(gè)通道達(dá)到50G的雙向帶寬拜银,因而每個(gè)V100可以最大達(dá)到300GB/s的帶寬。


  下圖是HGX-1/DGX-1使用的8個(gè)V100的混合立方網(wǎng)格拓?fù)浣Y(jié)構(gòu)遭垛,雖然V100有6個(gè)NVlink通道尼桶,但是實(shí)際上因?yàn)闊o(wú)法做到全連接,2個(gè)GPU間最多只能有2個(gè)NVlink通道100G/s的雙向帶寬锯仪。而GPU與CPU間通信仍然使用PCIe總線泵督。CPU間通信使用QPI總線。這個(gè)拓?fù)潆m然有一定局限性庶喜,但依然大幅提升了同一CPU Node和跨CPU Node的GPU間通信帶寬小腊。

 

 

 

     2、NVSwitch


  a久窟、拓?fù)鋽U(kuò)展實(shí)現(xiàn)完全連接的NVlink


  類似于PCIe使用PCIe Switch用于拓?fù)涞臄U(kuò)展秩冈,使用NVSwitch實(shí)現(xiàn)了NVlink的全連接。NVSwitch作為首款節(jié)點(diǎn)交換架構(gòu)斥扛,可支持單個(gè)服務(wù)器節(jié)點(diǎn)中16個(gè)全互聯(lián)的GPU入问,并可使全部8個(gè)GPU對(duì)分別以 300GB/s 的驚人速度進(jìn)行同時(shí)通信。這16個(gè)全互聯(lián)的GPU(32G顯存V100)還可作為單個(gè)大型加速器稀颁,擁有 0.5TB統(tǒng)一顯存空間和2PetaFLOPS 計(jì)算性能队他。


  由于PCIe 帶寬日益成為多GPU系統(tǒng)級(jí)別的瓶頸,深度學(xué)習(xí)工作負(fù)載的快速增長(zhǎng)使得對(duì)更快速峻村、更可擴(kuò)展的互連的需求逐漸增加麸折。


  NVlink實(shí)現(xiàn)了很大的進(jìn)步,可以在單個(gè)服務(wù)器中支持八個(gè)GPU粘昨,并且可提升性能垢啼,使之超越 PCIe窜锯。但是,要將深度學(xué)習(xí)性能提升到一個(gè)更高水平芭析,將需要使用GPU 架構(gòu)锚扎,該架構(gòu)在一臺(tái)服務(wù)器上支持更多的GPU以及GPU之間的全帶寬連接。


  b馁启、首款節(jié)點(diǎn)交換架構(gòu)驾孔,加速深度學(xué)習(xí)和高性能計(jì)算


  NVIDIA NVSwitch 是首款節(jié)點(diǎn)交換架構(gòu),可支持單個(gè)服務(wù)器節(jié)點(diǎn)中16個(gè)全互聯(lián)的GPU惯疙,并可使全部8個(gè)GPU 對(duì)分別以300GB/s 的驚人速度進(jìn)行同時(shí)通信翠勉。這16個(gè)全互聯(lián)的GPU還可作為單個(gè)大型加速器,擁有0.5TB統(tǒng)一顯存空間和2PetaFLOPS計(jì)算性能霉颠。


  NVIDIA NVlink將采用相同配置的服務(wù)器性能提高31%对碌。使用NVSwitch的DGX-2則能夠達(dá)到2倍以上的深度學(xué)習(xí)和高性能計(jì)算的加速。 

TAG:
免責(zé)聲明:凡注明來(lái)源本網(wǎng)的所有作品蒿偎,均為本網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品朽们,歡迎轉(zhuǎn)載,注明出處诉位。非本網(wǎng)作品均來(lái)自互聯(lián)網(wǎng)骑脱,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)苍糠。
0條 [查看全部]  相關(guān)評(píng)論

閱讀推薦

為了銷量寝优,英國(guó)百貨公司搞智能家居展廳

建筑五金起始于打鐵鋪、銅匠店及錫匠店等手工作坊枫耳。中國(guó)在唐代就有了制釘?shù)淖鞣环Ψ墒止ご蛑漆敗㈤T閂迁杨、鎖钻心、門環(huán)等。但因古代建筑多采用木質(zhì)和石質(zhì)結(jié)構(gòu)铅协,建筑五金在過(guò)去幾千年中發(fā)展很慢捷沸。

為了銷量,英國(guó)百貨公司搞智能家居展廳

凈化藍(lán)天 第二輪中央生態(tài)環(huán)境保護(hù)督察即將啟動(dòng)

為了銷量说墨,英國(guó)百貨公司搞智能家居展廳

這一年里,多少智能鎖人為了那個(gè)不知道方向的“錢景”苍柏,擠得頭皮破血流也要進(jìn)來(lái)分一杯羹尼斧;多少智能鎖人抱著“夢(mèng)想還是要有的,萬(wàn)一實(shí)現(xiàn)了呢”的心態(tài)试吁,誓死也要在智能鎖行業(yè)干出一番事業(yè)棺棵;又有多少智能鎖人懷揣著對(duì)鎖具無(wú)法割愛(ài)的情懷,即便知道前方是萬(wàn)丈深淵熄捍,亦或是刀山火海烛恤,也要忍著痛往前奔跑……

為了銷量,英國(guó)百貨公司搞智能家居展廳

文章摘要:總結(jié)2018年的上半年治唤,中國(guó)家居業(yè)的這些“關(guān)鍵詞”值得重視與深思棒动。

為了銷量船惨,英國(guó)百貨公司搞智能家居展廳

近期,浙江省桐廬正華文化用品有限公司缕陕、溫州嘉然恒文具有限公司等21家企業(yè)陸續(xù)向省質(zhì)監(jiān)局主動(dòng)提交了召回計(jì)劃粱锐,決定對(duì)其生產(chǎn)的共

 
QQ在線咨詢
 
日韩精品久久久毛片一区二区,欧美日韩丝袜中文字幕在线,春暖花开日韩精品,国内自拍第十六页日韩在线观看网站