近日,360將自主研發(fā)的全球首個基于云原生的圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練控制器“DGL Operator”進(jìn)行了開源。
DGL Operator是由360智能工程部AI平臺團(tuán)隊(duì)開發(fā)并維護(hù)的一個基于云原生技術(shù)棧、DGL圖神經(jīng)網(wǎng)絡(luò)算法框架的多機(jī)訓(xùn)練控制器。開發(fā)者利用DGL Operator可以自動創(chuàng)建、配置和管理復(fù)雜的DGL分布式訓(xùn)練工作,簡化開發(fā)分布式訓(xùn)練的準(zhǔn)備工作,并賦能大規(guī)模圖訓(xùn)練場景。
360介紹,過去以“天”為單位計(jì)算的圖神經(jīng)網(wǎng)絡(luò)(“GNN”)模型準(zhǔn)備和構(gòu)建時(shí)間,通過DGL Operator可以實(shí)現(xiàn)“分鐘級”上云,快速獲得想要的算法模型。該訓(xùn)練控制器的開源,從工業(yè)應(yīng)用層面給GNN分布式訓(xùn)練提供了另外一種可能,基于云原生技術(shù)棧打通了從大規(guī)模圖訓(xùn)練的實(shí)驗(yàn)嘗試,到工業(yè)應(yīng)用之間的關(guān)鍵鏈路,彌補(bǔ)了模型訓(xùn)練關(guān)鍵環(huán)節(jié)的空白。