以細節砥礪品德 公牛防過充USB插座先在顏值上爭第一
2016-04-27
樂視二代手機首銷兩小時現貨百萬臺售罄
2016-04-27
Show all

優圖野生智能范疇再創佳績兩篇學術論文被IJCAI任命

基於騰訊優圖團隊和廈門大學紀榮嶸傳授團隊在深度互助項目中所產出的學術論文基於全局偏差重構的深度卷積神經收集緊縮辦法(Towards Convolutional Neural Networks CompressionviaGlobal Error Reconstruction)和面向跨模態哈希的監視矩陣分化辦法(Supervised Matrix Factorization for Cross-modality Hashing)兩篇論文同時被野生智能范疇的頂級集會IJCAI任命為長文,這是繼客歲11月所撰寫的論文被另外一國際頂級學術集會AAAI 2016接收後,優圖在野生智能范疇創下的又一佳績。IJCAI(International Joint Conference on Artificial Intelligence)始於1969年,每兩年一次,涵蓋瞭天然說話處置、機械進修、野生智能實際與架構、機械人科學等范疇。集會具有很高的學術程度和影響力,遭到學術界和傢當界的高度存眷,是以IJCAI和ICCV、CVPR、ICML、AAAI等集會被中國盤算機學會(CCF)認定為級別最高的A類集會。本屆集會中,騰訊優圖的兩篇學術論文同時登科,解釋瞭團隊在野生智能范疇又邁向瞭新的高度。

騰訊優圖與廈門大學紀榮嶸團隊從2015歲首年月開端親密的高校互助,不但專註於算法的深度進修及研討,同時也努力於將先輩的野生智能技巧運用到騰訊的產物中。此次互助的學術論文恰是兩邊獲得的又一沖破,主題涵蓋瞭機械進修當前研討的兩大熱點范疇:深度進修范疇與信息檢索范疇。

Paper 1 :【深度進修范疇】基於全局偏差重構的深度卷積神經收集緊縮辦法

>項目配景

跟著深度進修技巧在挪動端智能營業運用中的慢慢放開,雲端辦事的方法愈來愈依附用戶上傳的大批數據,好比當地照片分類治理。是以辦事質量受限於收集情況、背景辦事才能、用戶隱私等身分。一個辦理的思緒是把雲真個深度進修放得手機當地運轉,但是雲真個深度收集模子每每過於宏大,動輒上百兆,晦氣於SDK的當地安排。是以,若何把宏大的深度模子舉行瘦身並裝進手機當地運轉,讓更多用戶充足享用技巧提高的盈餘,成為擺在優圖深度進修研討職員眼前的一大挑釁。

深度進修收集的挪動端當地運轉離沒有開兩個身分,運轉情況與收集模子。為此,優圖深度進修團隊一方面經由過程自立立異搭建瞭深度進修在手機真個運轉情況 MiniCNN框架,具有玲瓏、內存占用低、模子兼容性高級特色(當前正在每天P圖、手機管傢等產物中落地)。另外一方面,優圖在挪動端深度收集緊縮的履歷,經由過程和廈大紀榮嶸傳授團隊深刻互助,配合摸索出收集模子緊縮的學術界和傢當界的立異算法計劃,並獲得瞭豐富的技巧結果。這標記著優圖已具有瞭將深度進修收集運轉於挪動真個技巧才能。

>技巧立異

業界風行的模子緊縮計劃平日為: 基於SVD的low-rank近似算法大略地對卷積收集模子中的全銜接層舉行緊縮,以大幅削減模子參數范圍。但是經由過程這類基於layer-wise初始化的緊縮必將會形成大批偏差累計。優圖深度進修團隊與廈大互助同伴一路經由賡續測驗考試和優化,立異性地提出瞭Global Error Reconstruction (GER)算法,削減此類偏差累計,進步緊縮收集精確率。試驗成果表現GER算法可以或許獲得較好的rate-distortion,該算法能緊縮業界著名的收集AlexNet和VGG模子(NIPS 2012,ICLR2015) 靠近15倍而掉精確率。

>運用場景

該技巧可普遍用於以深度卷積收集(CNN)為焦點的挪動端辦事當前已運用於挪動端圖片分類模子,優化緊縮比在10:1以上,將來也可運用於人臉檢測/辨認模子、聲紋辨識模子等各項須要手機端當地運轉的場景中。本來動輒上百兆的模子經由瘦死後釀成瞭十幾兆乃至幾兆,使得後果更好的大收集模子在手機當地運轉成為大概。

Paper2 :【信息檢索范疇】面向跨模態哈希的監視矩陣分化辦法

>項目配景

跟著信息技巧的成長,互聯網中的信息情勢從以往的文本為主導,開端向以文本、圖片、視頻、聲音等多種數據情勢復合湧現改變,若何充足應用這些異構的信息成為一個研討的熱門和難點。優圖在哼唱辨認的研發中就碰到瞭midi、人聲、原聲三種有很大差別的信息,並基於此研發瞭哈希排序算法(OEH+DTW)揭櫫在瞭AAAI2016上。在此基本上,本年優圖和廈門大學持續互助,從哼唱辨認進一步拓展,研發瞭基於異構數據的檢索辦法,可以或許充足應用筆墨、聲音等信息加強檢索的後果

> 技巧立異

傳統的跨模態檢索辦法,特別以哈希算法為主的檢索辦法,平日須要較高的時光龐雜度來獵取相幹的哈希碼字和相幹的編碼函數。在比較與剖析傳統的跨模態哈希算法的基本上,本論文提出瞭一種監視矩陣分化哈希算法,立異在於將協同矩陣分化、譜圖實際和最優投影辦法有用地聯合在一路,以摸索跨模態搜刮的題目。其焦點思惟是采取監視信息構建成標簽類似度圖來束縛協同矩陣分化和哈希函數進修,同時也獲得練習集的哈希碼本。在維基百科等多模態數據集的搜刮考證性試驗中,提出的辦法能夠以較快的練習速率獲得異常使人滿足的檢索效能。是以,其能夠很好地運用於異構數據搜刮等現實題目中。

> 運用場景:

本論文提出的基於大范圍數據的跨模態哈希辦法能夠用於改良傳統音樂檢索體系。傳統音樂檢索體系大抵分為兩類,一類是以基於常識圖譜的文本檢索的情勢(馬上用戶提交歌曲名、歌手名等作為檢索癥結詞經由過程數據庫婚配返回檢索成果),另外一類是基於音樂內容的音樂檢索情勢(比方Q Q音樂的哼唱搜刮)。本文提出的跨模態哈希算法能夠發掘音樂數據中多種模態數據之間的聯系關系性,讓音樂的分歧模態之間互補信息,將傳統的兩類音樂檢索方法融會以進步用戶音樂檢索的精確率,同時也能夠完成基於用戶的本性化音樂推舉等運用功效。

騰訊優圖團隊建立於2012年,是騰訊旗下專門研討機械進修,野生智能的團隊。團隊專註在用戶UGC內容(如人臉、圖片、語音、視頻等偏向)上的機械進修、數據發掘等范疇睜開技巧研發與營業落地,並已具有數十項搶先的圖象技巧和千億范圍圖象大數據盤算才能,為公司跨越五十個營業供給圖象技巧支撐,並在微眾銀行、QQ、QQ空間、QQ音樂、水印相機、每天P圖等明星產物勝利落地。

>> 檢察更多類似文章

Comments are closed.