a级片网址,www.一级毛片,日批国产,中文字幕日韩精品有码视频,黄色毛片免费网站,久久久精品午夜免费不卡,天堂福利视频

您當(dāng)前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

VMware Bitfusion 工作原理

2020-08-13 11:08:28   作者:   來源:CTI論壇   評論:0  點擊:


  Bitfusion 要解決的是以下問題:
  有些團隊在利用機器學(xué)習(xí)進(jìn)行研究時沒有 GPU 可以用來加速學(xué)習(xí)速度;
  而另一些團隊已經(jīng)擁有了 GPU,但是他們沒有完全利用 GPU 的處理能力,很多 GPU 資源在白白閑置。
  Bitfusion 把 GPU 資源集中起來,組成 GPU 資源池,然后共享給大家使用,這個方案分為兩部分:
  • Bitfusion 服務(wù)器:把 GPU 安裝在 vSphere 服務(wù)器上 (要求 vSphere 7 以上版本),然后在上面運行 Bitfusion Server (以 OVA 格式提供的 virtual appliance),Bitfusion Server 可以把物理 GPU 資源虛擬化,共享給多個用戶使用。
  • Bitfusion 客戶機:Bitfusion Client 是運行在其他 vSphere 服務(wù)器上的 Linux 虛機 (要求 vSphere 6.7 以上版本), 機器學(xué)習(xí) ML (Machine Learning) 工作負(fù)載運行在這些虛擬機上,Bitfusion 會把它們對于GPU 的服務(wù)請求通過網(wǎng)絡(luò)傳輸給 Bitfusion Server,計算完成后再返回結(jié)果。對于 ML 工作負(fù)載來說,遠(yuǎn)程 GPU 是完全透明的,它就像是在使用本地的 GPU 硬件。
  Bitfusion 共享 GPU 方案架構(gòu)
  Bitfusion 把機器學(xué)習(xí)對于本地 GPU 的訪問轉(zhuǎn)換成遠(yuǎn)程 GPU 訪問,它是怎么識別這些 GPU 調(diào)用的?它對機器學(xué)習(xí)應(yīng)用有什么要求嗎?Bitfusion 對于機器學(xué)習(xí)的基本要求就是必須使用 CUDA 架構(gòu),只有機器學(xué)習(xí)應(yīng)用和 GPU 都使用 CUDA 架構(gòu)才能被 Bitfusion 支持。
  Bitfusion工作原理
  CUDA 的全稱是 Compute Unified Device Architecture,它是由 NVIDIA 提供的通用并行計算架構(gòu),該架構(gòu)使開發(fā)人員能夠快速地開發(fā)利用 GPU 的軟件,通過充分利用 GPU 所提供的上千個處理單元來快速解決復(fù)雜計算問題。NVIDIA 為開發(fā)人員提供了 CUDA 工具包,其中包括在 GPU 加速庫、編譯器、開發(fā)工具和 CUDA 運行時。
  目前主流的 GPU 廠商有 NVIDIA、AMD 和 Intel,NVIDIA 當(dāng)然支持自家的 CUDA,Intel 也提供了對于 CUDA 的支持;AMD 則另外搞了一套標(biāo)準(zhǔn) HIP (Heterogeneous Computing Interface for Portability,可移植異構(gòu)計算接口),提供了一個工具 Hipify 來將 CUDA 代碼轉(zhuǎn)換成 HIP。
  使用 TensorFlow 框架開發(fā)的機器學(xué)習(xí)軟件運行堆棧如下圖所示,其中 CuDNN (CUDA Deep Neural Network) 是 NVIDIA 為深度神經(jīng)網(wǎng)絡(luò)開發(fā)的 GPU 加速庫。
  在整個軟件堆棧中,Bitfusion 在 CUDA driver 這個層面上截獲了所有的 CUDA 服務(wù)訪問,然后把這些服務(wù)請求和數(shù)據(jù)通過網(wǎng)絡(luò)傳遞給 Bitfusion Server,在服務(wù)器這一端再把這些服務(wù)請求交給真正的 CUDA driver 來處理,這就是 Bitfusion 的基本工作原理,如下圖所示。我們可以看到 Bitfusion Client 的軟件堆棧中插入了一個 CUDA driver 的代理,通過這個代理來把服務(wù)請求轉(zhuǎn)發(fā)給 Bitfusion Server 上的 CUDA 下層服務(wù)堆棧。GPU 輔助的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)完成之后,結(jié)果再逆向通過這個堆棧返回機器學(xué)習(xí)應(yīng)用 ML App。
  GPU分區(qū)
  在實現(xiàn) CUDA 堆棧功能的基礎(chǔ)上,Bitfusion 還支持對于 GPU 的靈活劃分。對于很多機器學(xué)習(xí)應(yīng)用來講,它們的計算量不需要用到整塊 GPU,只需要部分計算能力就行了。同時,把一塊物理 GPU 劃分成多個分區(qū)分配給多個用戶使用,就可以實現(xiàn) GPU 共享。
  NVIDIA 自己的 vGPU 解放方案也可以實現(xiàn) GPU 的分區(qū),通過分配 GPU 內(nèi)存來控制對于 GPU 計算資源的使用,分配的比例有全部、二分一、四分之一等,各個 vGPU 的大小必須一致,比較死板。
  相比之下 Bitfusion 的分區(qū)方案就靈活多了,可以根據(jù)用戶需求任意劃分分區(qū),分區(qū)大小不需要一致。特別適合于機器學(xué)習(xí)這種應(yīng)用場景,不同的機器學(xué)習(xí)應(yīng)用需要的 GPU 算力是不一樣的,分配一塊合適的分區(qū)有助于避免 GPU 資源的浪費。同時,由于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練通常是一個需要反復(fù)調(diào)整參數(shù)持續(xù)改進(jìn)的過程,獨占整個 GPU 會造成極大的資源浪費,Bitfusion 的 GPU 分區(qū)功能特別適合這種應(yīng)用場景。
  Bitfusion 的 GPU 分區(qū)方案具有以下特點:
  • 分區(qū)可以是任意大。築itfusion 可以指定任意大小的分區(qū),例如 1%;如前所述,這特別適用于開發(fā)測試等試驗性的應(yīng)用場景。
  • GPU 獨立性:各個 GPU 分區(qū)相互獨立,各自運行不同的 AI 框架和模型,絕對不會相互影響。
  • 大小可動態(tài)調(diào)整:GPU 分區(qū)可以動態(tài)調(diào)整大小,例如從同一塊物理 GPU 分出的兩塊分區(qū)分別為 45% 和 55%,55% 的 GPU 分區(qū)可以進(jìn)一步拆分成更小的兩塊 35% 和 20%,而不會影響另一塊 45% 分區(qū) 上工作負(fù)載的正常運行。
  • 支持多個物理 GPU:從不同物理 GPU 中分出來的多個 GPU 分區(qū)能夠以多個 GPU 的形式分配給同一個用戶和工作負(fù)載,這既可以提高整個 GPU 資源池的利用率,也有助于開發(fā)和調(diào)試多 GPU 工作負(fù)載應(yīng)用。
  總結(jié)
  Bitfusion 的工作原理決定了其應(yīng)用場景,想要使用 Bitfusion 來共享 GPU 加速機器學(xué)習(xí)必須滿足以下條件:
  • GPU 支持 CUDA 架構(gòu)并且支持 vSphere 7
  • 機器學(xué)習(xí)應(yīng)用的 Linux 虛機必須在 vSphere 平臺上運行 (vSphere 6.7 以上版本)
  • 提請大家注意,Bitfusion 并不適用于 VDI 應(yīng)用場景,如果你想共享 GPU 加速 3D 設(shè)計渲染的話,NVIDIA 的 vGPU 是更合適的解決方案。Bitfusion 目前只支持 GPU 虛擬化共享,將來還有計劃支持其他硬件加速設(shè)備  FPGA 和 ASIC 的虛擬化和共享。
  • Bitfusion 的工作原理決定了它有一些額外的資源消耗,主要是客戶端和服務(wù)器之間的網(wǎng)絡(luò)傳輸開銷。這些額外的開銷對于GPU的利用率會有一些怎樣的損耗呢?我們將在下一期的“Bitfusion性能評估”中來回答這些問題。
  延伸閱讀
  將 VMware vSphere / vSAN 軟件與 Intel 的最新硬件平臺技術(shù)相結(jié)合,可以為用戶交付最佳的超融合架構(gòu)平臺,幫助用戶簡化數(shù)據(jù)中心管理,降低采購和運維成本,輕松應(yīng)對企業(yè)在數(shù)字化轉(zhuǎn)型中面對的各種挑戰(zhàn),是現(xiàn)代應(yīng)用的理想運行平臺:
  • VMware vSAN 是最佳的存儲方案平臺,具有管理簡便、高性能、低成本、易擴展的特點,在 vSAN 平臺上可以支持任何類型的應(yīng)用。
  • Intel 至強處理器提供最強計算能力,基于傲騰 (Optane) 和 3D NAND 技術(shù)的固態(tài)盤是理想的高速緩存,以太網(wǎng)融合網(wǎng)卡提供穩(wěn)定的網(wǎng)絡(luò)帶寬和低網(wǎng)絡(luò)延遲。
 
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

專題

CTI論壇會員企業(yè)

如东县| 柘城县| 吴旗县| 吉隆县| 惠东县| 长岭县| 鄯善县| 南投市| 科技| 科尔| 星子县| 德钦县| 炎陵县| 岐山县| 密云县| 明光市| 湖北省| 岳普湖县| 梁平县| 麻江县| 乐亭县| 新龙县| 巴林左旗| 宜都市| 灌云县| 柳江县| 鄂托克前旗| 英山县| 台中市| 清镇市| 托克逊县| 健康| 偃师市| 穆棱市| 金阳县| 宜兰县| 迁西县| 和龙市| 灵山县| 偏关县| 遂川县|