近日,360將自主研發(fā)的全球首個基于云原生的圖神經網(wǎng)絡訓練控制器“DGL Operator”進行了開源。
DGL Operator是由360智能工程部AI平臺團隊開發(fā)并維護的一個基于云原生技術棧、DGL圖神經網(wǎng)絡算法框架的多機訓練控制器。開發(fā)者利用DGL Operator可以自動創(chuàng)建、配置和管理復雜的DGL分布式訓練工作,簡化開發(fā)分布式訓練的準備工作,并賦能大規(guī)模圖訓練場景。
360介紹,過去以“天”為單位計算的圖神經網(wǎng)絡(“GNN”)模型準備和構建時間,通過DGL Operator可以實現(xiàn)“分鐘級”上云,快速獲得想要的算法模型。該訓練控制器的開源,從工業(yè)應用層面給GNN分布式訓練提供了另外一種可能,基于云原生技術棧打通了從大規(guī)模圖訓練的實驗嘗試,到工業(yè)應用之間的關鍵鏈路,彌補了模型訓練關鍵環(huán)節(jié)的空白。