99绯色精品久久久一区二区三区,亚洲深深色噜噜狠狠爱网站,国产成人麻豆精品午夜福利在线

多GPU的使用和模型并行的力量

2023-06-30瀏覽：來(lái)源：深圳拓普龍科技有限公司

人工智能的世界正在以極快的速度發(fā)展，眨眼，你就會(huì)錯(cuò)過(guò)下一個(gè)進(jìn)步。隨著模型規(guī)模越來(lái)越大，研究人員和開(kāi)發(fā)人員不斷尋求提高 AI 模型效率和性能的方法。實(shí)現(xiàn)這一目標(biāo)的最簡(jiǎn)單方法之一是使用多個(gè)圖形處理單元 (GPU) 或張量處理單元（TPU，下一期將詳細(xì)介紹）進(jìn)行 AI 訓(xùn)練和推理。

打開(kāi)錢(qián)包門(mén) Hal：多 GPU 的使用和模型并行的力量(圖1)

HP z8 G5 Fury 上的 DNN 培訓(xùn)

建立在我們的人工智能在實(shí)驗(yàn)室的最后一部分，我們深入研究并實(shí)際動(dòng)手研究了在我們的 HP Z8 G5 Fury 工作站中從使用單個(gè) GPU 過(guò)渡到使用兩個(gè)，最終四個(gè)這些強(qiáng)大的卡的好處，特別關(guān)注 PyTorch 模型并行性.

模型并行的力量

在我們深入細(xì)節(jié)之前，了解并行性的概念至關(guān)重要。在 AI 的上下文中，并行性是指同時(shí)運(yùn)行多個(gè)計(jì)算的過(guò)程。這在需要處理大量數(shù)據(jù)的 AI 訓(xùn)練和推理中特別有用。 PyTorch 是我們?cè)趯?shí)驗(yàn)室中使用的開(kāi)源機(jī)器學(xué)習(xí)庫(kù)，它提供模型并行性，允許跨多個(gè) GPU 分布 AI 模型。這會(huì)導(dǎo)致更快的訓(xùn)練時(shí)間、更高效的推理以及運(yùn)行更大、更復(fù)雜模型的能力。

確保禁用 SLI 至關(guān)重要

擴(kuò)大規(guī)模的好處

單 GPU

從單個(gè) GPU 開(kāi)始，此設(shè)置為 AI 訓(xùn)練和推理提供了堅(jiān)實(shí)的基礎(chǔ)。在用于開(kāi)發(fā)的工作站中運(yùn)行單個(gè)現(xiàn)代（甚至是幾代以前的）GPU 對(duì)于 POC 階段來(lái)說(shuō)綽綽有余。它能夠處理合理數(shù)量的數(shù)據(jù)，并且可以為較小的 AI 模型提供令人滿(mǎn)意的結(jié)果。然而，隨著模型的復(fù)雜性和規(guī)模的增加，單個(gè) GPU 可能很快難以跟上，從而導(dǎo)致更長(zhǎng)的訓(xùn)練時(shí)間和更慢的推理。

打開(kāi)錢(qián)包門(mén) Hal：多 GPU 的使用和模型并行的力量(圖3)

單 GPU 利用率

兩個(gè) GPU

切換到一對(duì) GPU 可以顯著提高 AI 模型的性能。想一想：兩倍的處理能力可以顯著縮短訓(xùn)練時(shí)間，為更快的迭代和快速獲得結(jié)果鋪平道路。

推理階段也受益，變得更加高效并且能夠同時(shí)處理更大的數(shù)據(jù)批次。在這樣的環(huán)境中，PyTorch 的模型并行性開(kāi)始發(fā)揮作用。它有效地分配了兩個(gè)單元之間的工作量，最大限度地利用它們。這是確保每件硬件都承載其重量以實(shí)現(xiàn)高效 AI 操作的明智方法。

3 倍的樂(lè)趣，NVIDIA A6000

四個(gè)GPU

擴(kuò)展到四個(gè) GPU 可將多 GPU 利用率的優(yōu)勢(shì)提升到另一個(gè)層次。憑借四倍的處理能力，人工智能模型可以以前所未有的速度進(jìn)行訓(xùn)練和推理。此設(shè)置特別有利于需要大量計(jì)算資源的大型復(fù)雜模型。 PyTorch 的模型并行性可以將模型分布在所有四個(gè)單元中，確保最佳利用率和性能。

打開(kāi)錢(qián)包門(mén) Hal：多 GPU 的使用和模型并行的力量(圖5)

在工作站中，應(yīng)用手動(dòng)風(fēng)扇和時(shí)鐘值也可以提高訓(xùn)練性能。

實(shí)驗(yàn)室實(shí)施

從一個(gè)單獨(dú)的單元發(fā)展為兩個(gè) GPU，并最終發(fā)展為用于 AI 訓(xùn)練和推理的四重 GPU 可以釋放出相當(dāng)大的優(yōu)勢(shì)。由于 PyTorch 的模型并行性，這些優(yōu)勢(shì)可以得到最佳利用，從而產(chǎn)生更快、更高效的 AI 模型。

打開(kāi)錢(qián)包門(mén) Hal：多 GPU 的使用和模型并行的力量(圖6)

反復(fù)試驗(yàn)，耐心是 AI/ML/DL 培訓(xùn)的關(guān)鍵。

隨著我們對(duì)更復(fù)雜、更強(qiáng)大的 AI 的渴望不斷膨脹，采用多個(gè) GPU 的重要性無(wú)疑會(huì)增加。未來(lái)，我們將展示隨著您添加更多處理能力和跨系統(tǒng)分布所帶來(lái)的復(fù)雜性改進(jìn)。

適用于大型語(yǔ)言模型的 HPE GreenLake 為更多組織帶來(lái)人工智能

返回列表

超越傳統(tǒng)超算！我國(guó)超導(dǎo)量子計(jì)算機(jī)“祖沖之三號(hào)”驚艷亮相

新聞動(dòng)態(tài)