關(guān)注企業(yè)最新資訊和產(chǎn)品動(dòng)態(tài)
人工智能的世界正在以極快的速度發(fā)展,眨眼,你就會(huì)錯(cuò)過(guò)下一個(gè)進(jìn)步。 隨著模型規(guī)模越來(lái)越大,研究人員和開(kāi)發(fā)人員不斷尋求提高 AI 模型效率和性能的方法。 實(shí)現(xiàn)這一目標(biāo)的最簡(jiǎn)單方法之一是使用多個(gè)圖形處理單元 (GPU) 或張量處理單元(TPU,下一期將詳細(xì)介紹)進(jìn)行 AI 訓(xùn)練和推理。
HP z8 G5 Fury 上的 DNN 培訓(xùn)
建立在我們的 人工智能在實(shí)驗(yàn)室的最后一部分,我們深入研究并實(shí)際動(dòng)手研究了在我們的 HP Z8 G5 Fury 工作站中從使用單個(gè) GPU 過(guò)渡到使用兩個(gè),最終四個(gè)這些強(qiáng)大的卡的好處,特別關(guān)注 PyTorch 模型并行性.
在我們深入細(xì)節(jié)之前,了解并行性的概念至關(guān)重要。 在 AI 的上下文中,并行性是指同時(shí)運(yùn)行多個(gè)計(jì)算的過(guò)程。 這在需要處理大量數(shù)據(jù)的 AI 訓(xùn)練和推理中特別有用。 PyTorch 是我們?cè)趯?shí)驗(yàn)室中使用的開(kāi)源機(jī)器學(xué)習(xí)庫(kù),它提供模型并行性,允許跨多個(gè) GPU 分布 AI 模型。 這會(huì)導(dǎo)致更快的訓(xùn)練時(shí)間、更高效的推理以及運(yùn)行更大、更復(fù)雜模型的能力。
確保禁用 SLI 至關(guān)重要
從單個(gè) GPU 開(kāi)始,此設(shè)置為 AI 訓(xùn)練和推理提供了堅(jiān)實(shí)的基礎(chǔ)。 在用于開(kāi)發(fā)的工作站中運(yùn)行單個(gè)現(xiàn)代(甚至是幾代以前的)GPU 對(duì)于 POC 階段來(lái)說(shuō)綽綽有余。 它能夠處理合理數(shù)量的數(shù)據(jù),并且可以為較小的 AI 模型提供令人滿(mǎn)意的結(jié)果。 然而,隨著模型的復(fù)雜性和規(guī)模的增加,單個(gè) GPU 可能很快難以跟上,從而導(dǎo)致更長(zhǎng)的訓(xùn)練時(shí)間和更慢的推理。
單 GPU 利用率
切換到一對(duì) GPU 可以顯著提高 AI 模型的性能。 想一想:兩倍的處理能力可以顯著縮短訓(xùn)練時(shí)間,為更快的迭代和快速獲得結(jié)果鋪平道路。
推理階段也受益,變得更加高效并且能夠同時(shí)處理更大的數(shù)據(jù)批次。 在這樣的環(huán)境中,PyTorch 的模型并行性開(kāi)始發(fā)揮作用。 它有效地分配了兩個(gè)單元之間的工作量,最大限度地利用它們。 這是確保每件硬件都承載其重量以實(shí)現(xiàn)高效 AI 操作的明智方法。
3 倍的樂(lè)趣,NVIDIA A6000
擴(kuò)展到四個(gè) GPU 可將多 GPU 利用率的優(yōu)勢(shì)提升到另一個(gè)層次。 憑借四倍的處理能力,人工智能模型可以以前所未有的速度進(jìn)行訓(xùn)練和推理。 此設(shè)置特別有利于需要大量計(jì)算資源的大型復(fù)雜模型。 PyTorch 的模型并行性可以將模型分布在所有四個(gè)單元中,確保最佳利用率和性能。
在工作站中,應(yīng)用手動(dòng)風(fēng)扇和時(shí)鐘值也可以提高訓(xùn)練性能。
從一個(gè)單獨(dú)的單元發(fā)展為兩個(gè) GPU,并最終發(fā)展為用于 AI 訓(xùn)練和推理的四重 GPU 可以釋放出相當(dāng)大的優(yōu)勢(shì)。 由于 PyTorch 的模型并行性,這些優(yōu)勢(shì)可以得到最佳利用,從而產(chǎn)生更快、更高效的 AI 模型。
反復(fù)試驗(yàn),耐心是 AI/ML/DL 培訓(xùn)的關(guān)鍵。
隨著我們對(duì)更復(fù)雜、更強(qiáng)大的 AI 的渴望不斷膨脹,采用多個(gè) GPU 的重要性無(wú)疑會(huì)增加。 未來(lái),我們將展示隨著您添加更多處理能力和跨系統(tǒng)分布所帶來(lái)的復(fù)雜性改進(jìn)。
?2023深圳拓普龍科技有限公司 版權(quán)所有 粵ICP備09130463號(hào)-1
13008895219 產(chǎn)品經(jīng)理
19924502528 何經(jīng)理
13378406071 李工
13008895219 雷先生