国产成在线观看免费视频_久久九九久精品国产日韩经典_亚洲AV无码成H人动漫网站_YY亚洲人成电影网站色

創澤機器人
CHUANGZE ROBOT
當前位置:首頁 > 新聞資訊 > 機器人開發 > 讓大規模深度學習訓練線性加速、性能無損,基于BMUF的Adam優化器并行化實踐

讓大規模深度學習訓練線性加速、性能無損,基于BMUF的Adam優化器并行化實踐

來源:AI科技大本營     編輯:創澤   時間:2020/5/29   主題:其他 [加盟]

作(zuo)為一(yi)種(zhong)自適應(ying)步(bu)(bu)長(chang)隨(sui)機(ji)梯度優化器,自2014年提出以來(lai),Adam 算(suan)法便以其卓越的性能風(feng)靡(mi)深度學習領域(yu)。為了提高應(ying)用于訓(xun)練大規模任務時的效率,該算(suan)法通常與同步(bu)(bu)隨(sui)機(ji)梯度(Synchronous Stochastic Gradient,SSG)技術相結(jie)合,采用數據并行(data parallel)的方式在多臺機(ji)器上執行。在本文中,我們稱(cheng)這一(yi)方法為 Sync-Adam。

本質上來(lai)講,Sync-Adam 通過將一個(ge) minibatch 內樣本(ben)的梯(ti)度計算分布到(dao)多(duo)臺機器上達到(dao)加(jia)(jia)速(su)目的,因此(ci)通信十分頻(pin)繁,并(bing)且隨著并(bing)行(xing)機器數(shu)目增多(duo),minibatch 內樣本(ben)的數(shu)量(liang)也成比(bi)例增加(jia)(jia),這種(zhong)情況下(xia),通常會損害最(zui)終得到(dao)的模型的性能(neng)。為解決基于 SSG 的 Adam 算法(fa)可擴(kuo)展(zhan)性差(cha)的難題,我們把目光投向了逐區塊模型更新濾(lv)波(Blockwise Model-Update Filtering, BMUF)框架(jia)。

BMUF 是一種(zhong)通信高效(xiao)的(de)通用(yong)分(fen)布(bu)式優化算(suan)法(fa)框(kuang)架,于(yu)(yu)2016年由微軟亞(ya)洲研(yan)究(jiu)院語音組的(de)研(yan)究(jiu)人員提(ti)出并發表。該算(suan)法(fa)在多個(ge)并行(xing)工作(zuo)機之間(jian)周期性同(tong)步(bu)模(mo)型(xing)更(geng)新(xin)信息(xi),并與(yu)歷(li)史更(geng)新(xin)信息(xi)相結合提(ti)升全(quan)局模(mo)型(xing)性能。與(yu)基(ji)于(yu)(yu) SSG 的(de)算(suan)法(fa)相比,BMUF 具有通信頻率較低、訓練(lian)幾(ji)乎(hu)線(xian)性加速(su)、模(mo)型(xing)性能基(ji)本無損的(de)特點。這一算(suan)法(fa)已(yi)經(jing)在工業界廣泛用(yong)于(yu)(yu)大(da)規(gui)模(mo)深度學習(xi)模(mo)型(xing)的(de)訓練(lian)。

本(ben)文中(zhong)(zhong)(zhong)(zhong),我們采用(yong) BMUF 框架并(bing)(bing)行(xing)化 Adam 算(suan)法,并(bing)(bing)在微軟大規(gui)模(mo)(mo) OCR 和(he)語(yu)音產品數據集上進行(xing)了測(ce)試。實驗結果(guo)(guo)表明(ming),在大規(gui)模(mo)(mo) OCR 任(ren)務中(zhong)(zhong)(zhong)(zhong),BMUF-Adam 在多達64機(ji)的并(bing)(bing)行(xing)訓練中(zhong)(zhong)(zhong)(zhong)幾乎實現了線性(xing)加速的同時(shi),基本(ben)沒有模(mo)(mo)型性(xing)能損(sun)失,在32機(ji)大詞匯量連續語(yu)音識別任(ren)務中(zhong)(zhong)(zhong)(zhong)也(ye)獲(huo)得了類似(si)效果(guo)(guo)。

接下(xia)來我們(men)探(tan)討如何采(cai)用 BMUF 框(kuang)架(jia)賦能 Adam 算法,在大規模深(shen)度學習任務上成就不凡(fan)。


在(zai)基于 BMUF 的訓(xun)練(lian)框(kuang)架下,假設我(wo)們總共有 N 個并(bing)行(xing)工(gong)(gong)(gong)作機(ji)(ji),一(yi)個工(gong)(gong)(gong)作機(ji)(ji)可(ke)(ke)以是(shi)一(yi)塊或(huo)多塊 GPU 卡(ka),也可(ke)(ke)以是(shi)一(yi)個計算(suan)節(jie)點。給定一(yi)個包含(han) Nτ 個 minibatch 的訓(xun)練(lian)數據(ju)子集,首(shou)先(xian)我(wo)們將(jiang)這(zhe)(zhe)些數據(ju)均勻(yun)分(fen)布到 N 個并(bing)行(xing)工(gong)(gong)(gong)作機(ji)(ji),每(mei)臺工(gong)(gong)(gong)作機(ji)(ji)獲得 τ 個 minibatch。從一(yi)個共同的初(chu)始模(mo)型(xing)(xing) θ_(t-τ)^((init)) 開(kai)始,N 個工(gong)(gong)(gong)作機(ji)(ji)獨(du)立(li)更(geng)新各(ge)自的局部模(mo)型(xing)(xing) τ 步,得到 {θ_(t,1),θ_(t,2),…,θ_(t,N)},對局部模(mo)型(xing)(xing)取平(ping)均得到 θ ̅_t。這(zhe)(zhe)一(yi)過程稱之為(wei)數據(ju)塊內并(bing)行(xing)優(you)化(Intra-Block Parallel Optimization, IBPO)。與直接將(jiang) θ ̅_t 作為(wei)全(quan)局模(mo)型(xing)(xing)不(bu)同,BMUF 技術將(jiang)歷史更(geng)新信息(xi)與當(dang)前更(geng)新信息(xi)結合,得到全(quan)局模(mo)型(xing)(xing):






基于深度學習和傳統算法的人體姿態估計,技術細節都講清楚了

人體姿態估計便是計算機視覺領域現有的熱點問題,其主要任務是讓機器自動地檢測場景中的人“在哪里”和理解人在“干什么”

傳統目標檢測算法對比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標檢測算法優缺點對比及使用場合比較

基于深度學習目標檢測模型優缺點對比

深度學習模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

如何更高效地壓縮時序數據?基于深度強化學習的探索

大型商用時序數據壓縮的特性,提出了一種新的算法,分享用深度強化學習進行數據壓縮的研究探索

滴滴機器學習平臺調度系統的演進與K8s二次開發

滴滴機器學習場景下的 k8s 落地實踐與二次開發的技術實踐與經驗,包括平臺穩定性、易用性、利用率、平臺 k8s 版本升級與二次開發等內容

人工智能和機器學習之間的差異及其重要性

機器學習就是通過經驗來尋找它學習的模式,而人工智能是利用經驗來獲取知識和技能,并將這些知識應用于新的環境

面向動態記憶和學習功能的神經電晶體可塑性研究

神經形態結構融合學習和記憶功能領域的研究主要集中在人工突觸的可塑性方面,同時神經元膜的固有可塑性在神經形態信息處理的實現中也很重要

CVPOS自助收銀的挑戰以及商品識別算法工程落地方法和經驗

針對結算收銀場景中商品識別的難點,從商品識別落地中的模型選擇、數據挑選與標注、前端和云端部署、模型改進等方面,進行了深入講解

內容流量管理的關鍵技術:多任務保量優化算法實踐

通過分析其中的關鍵問題,建立了新熱內容曝光敏感模型,并最終給出一種曝光資源約束下的多目標優化保量框架與算法

百變應用場景下,優酷基于圖執行引擎的算法服務框架筑造之路

優酷推薦業務,算法應用場景眾多,需求靈活多變,需要一套通用業務框架,支持運行時的算法流程的裝配,提升算法服務場景搭建的效率

餓了么推薦算法的演進及在線學習實踐

餓了么算法專家劉金介紹推薦業務背景,包括推薦產品形態及算法優化目標;然后是算法的演進路線;最后重點介紹在線學習是如何在餓了么推薦領域實踐的

拯救渣畫質,馬賽克圖秒變高清,杜克大學提出AI新算法

杜克大學的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉換成計算機生成的圖像,其細節比之前任何時候都更加精細、逼真
資料獲取
機器人開發
== 最新資訊(xun) ==
ChatGPT:又一個“人形機器人”主題
ChatGPT快速流行,重構 AI 商業
中國機器視覺產業方面的政策
中國機器視覺產業聚焦于中國東部沿海地區(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發《機器人+應用行動實
全球人工智能企業市值/估值 TOP20
創澤智能機器人集團股份有限公司第十一期上
諧波減速器和RV減速器比較
機器人減速器:諧波減速器和RV減速器
人形機器人技術難點 高精尖技術的綜合
機器人大規模商用面臨的痛點有四個方面
青島市機器人產業概況:機器人企業多布局在
六大機器人產業集群的特點
機械臂-高度非線性強耦合的復雜系統
== 機(ji)器人推(tui)薦(jian) ==
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)


機器人公司 機器人應用 智能醫療 物聯網 機器人排名 機器人企業 教育機器人 機器人開發 獨角獸 消毒機器人品牌 消毒機器人
版權所有 創澤智能機器人集團股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728