搜索右侧

您現在的位置:華發首頁>新 聞 > 專 題 > 科技 >

遷移學習,人工智能技術的「明天」

更新時間:2019-02-19 16:49來源:網絡作者:@Mary人氣:1361581

遷移學習,人工智能技術的「明天」

圖:人工智能(AI)是近年來世界範圍內最熱門的科學技術之一

近年,人工智能(AI)在世界範圍內掀起一股浪潮,許多國家將人工智能技術的發展提到了國家戰略的高度,國內外一些有名的科技公司都開始在這方面投入大量的資源進行研發和應用。其中在國外比較具有代表性的有谷歌、微軟和Facebook等,內地的百度、阿里巴巴、騰訊等互聯網公司也紛紛對人工智能領域的技術研發和應用進行布局。

「人工智能」一詞並不是一個新的概念,早在上個世紀的五十年代,對這個領域的探索就已經開始了。當時的科學家們提出了「要用人工智能來模擬人類的智慧」這一大膽的目標。在這之後,人工智能這一領域便迎來了自己的第一個「黃金時代」,此後,這一領域又反反覆覆出現過幾次發展的高潮與低谷。有人將這一段對人工智能領域探索的歷史稱為「喧囂與渴望、挫折與失望交替出現的時代」。

從深度學習到遷移學習

近年,由於神經網絡深度學習在算法上的突破,使得眾多基礎人工智能水平得到很大的提升。人工智能的各種相關領域藉着深度學習有了更高層次的發展。就目前來說,深度學習方法對圖像視覺領域的問題解決有着相當不錯的效果,可是這種方法並不能對所有問題都適用。

一些有延遲反饋的相關問題,比如機器人的運動路徑規劃問題。還有前段時間那隻下圍棋贏了世界冠軍柯潔的「阿爾法狗」,就是用深度學習和強化學習兩種方法相結合去開發的。還有一些小規模數據問題,深度學習的模型依賴大規模的數據去訓練,可是現實生活中並不是每一類需要解決的問題我們都能獲得相應的大量數據,這一類問題我們僅靠深度學習方法就沒辦法很好地解決,而處理這一類小規模數據問題的最好方法就是本文的介紹對象—遷移學習。

遷移學習可優化的領域

計算機視覺:

基於不同的CNN架構,深度學習在多種計算機視覺任務上的應用取得了相當大的成功。遷移學習在視覺這一領域可以幫助我們在風格遷移和人臉識別等目標任務中利用現有的當前最先進模型,雖然目標領域的任務可能不同,不過可以將現有優秀模型的可取之處遷移到目標任務當中。

自然語言處理:

對自然語言處理而言,其本身的進展就不如計算機視覺那樣成熟,文本數據給深度學習提出了各種各樣的挑戰。使用遷移學習中預先訓練的方法以及加入文檔嵌入層,可以在數據量較小時也可以取得很優秀的效果。通過從源領域遷移知識,可將其應用到情感分析和文本分類等任務當中。

音頻處理:

類似於自然語言處理和視覺,遷移學習也在提升優化基於深度學習的音頻數據任務模型中取得了不錯的效果。

何謂遷移學習

前百度首席科學家、史丹福大學教授吳恩達(Andrew Ng)在一次採訪中曾說到過:「遷移學習將會是繼監督學習之後的下一個機器學習商業成功的驅動力」。吳恩達教授之所以會認為遷移學習是未來最有活力的機器學習領域,就是因為遷移學習能夠解決現有方法無法解決的問題。遷移學習(Transfer Learning),也可以叫做領域適配(Domain Adaptation),就是指將從源領域學習到的東西應用到目標領域上,當然源領域與目標領域之間有一些差異,比如兩個領域的數據的分布不同等。簡單地說就是遷移學習可以從現有的數據中遷移學習的東西,用在將來的任務當中。把從別的領域學習到的知識應用到新的環境中。由此可以明顯的感覺到,這樣的人工智能是更加符合人類對「人工智能」的期望。

當前階段,遷移學習方法一般用來解決的問題有兩類,分別是前文提到的小規模數據問題和個性化問題。當遇到小規模數據問題,我們沒有辦法使用足夠的數據基於深度學習方法訓練出一個可以很好解決問題的模型,遷移學習這時候的解決方法就是找一個有些許關聯(當然也有差異)的另一個已有足夠數據的問題,利用這個問題的數據,去建立一個模型,再結合兩個問題的關聯,就可以將這個模型遷移到我們所需要解決的問題上。

第二個是個性化問題,比如我們每個人都希望自己的一些電子設備(比如手機)能夠記住自己的一些習慣,這樣就不用每次都去設定它,通過遷移學習我們就可以將一個通用的用戶使用手機的習慣模型遷移到個性化數據當中。

遷移學習的具體應用場景

醫療影像分析:

在醫學影像分析任務中,醫學圖像訓練數據的標註需要先驗的醫學知識,適合標註此類數據的人群稀少,從而導致訓練數據嚴重稀缺,深度學習將不再適用。可以將遷移學習應用到醫學圖像的語義映射中,利用圖像識別的結果幫助醫生對患者進行診斷,從而減輕醫生的工作負擔,促進醫療實現轉型。

藝術風格遷移:

藝術風格遷移是一個頗具歷史性的話題,多少藝術家為了模仿名家的作品風煞費苦心,遷移學習卻可以輕鬆做到這一點。比如我們可以將從梵高的畫中學習到的「知識」應用到新的圖像中,一隻梵高風格的貓就被「畫」出來了。

語音識別:

語音識別一直是人工智能領域的重要問題,因為人們如何評價「智能」這個屬性,很大一方面就是從機器與人類的交互性上去度量。針對英語自動識別模型(ASR)就曾在遷移學習方法下,被成功應用到提升法語等其他語言識別的模型下,給目標任務帶來大幅表現提升。

自動駕駛模型訓練:

在自動駕駛的任務當中,需要大量的經驗數據訓練模型。可是直接在實際場景中進行採集數據非常費事費力,成本很高,而且有很大的危險性。所以現在許多公司直接使用仿真模擬器訓練模型,之後再把學到的「知識」用於實際測試當中,並不斷優化。

遷移學習的分類

根據我們從源領域到目的領域所遷移的具體內容,目前可以把遷移學習分為四大類,分別是基於實例的遷移學習(Instance-based Transfer Learning),基於特徵的遷移學習(Feature-based Transfer Learning),基於參數的遷移學習(Parameter-based Transfer Learning)和基於關係知識的遷移學習(Relational-Knowledge-based Transfer Learning)。

基於實例的遷移學習

該方法的基本思想是根據一個確定的相似度匹配原則從源領域中尋找和目的領域相似度較高的實例(Instance),將這些篩選出的實例遷移到目的領域中去幫助目的領域模型的訓練,從而就可以幫助解決目的領域數據樣本不足,標籤不足等問題。一般的方法是對實例進行加權處理,在訓練過程總對更加重要的實例加權,對沒那麼重要的實例進行降權,從而讓最終訓練結果更好。

基於特徵的遷移學習

該方法指的是在特徵空間進行遷移,這種方式一般需要將源領域和目的領域的特徵投影到同一個特徵空間,然後從源領域學習一個好的特徵,將學到的通過特徵形式進行編碼傳到目的領域,從而提升目的領域的學習效果。

基於參數的遷移學習

該方法要求源領域和目標領域的任務之間共享相同的模型參數,或者服從相同的先驗分布。從而將已經學到的參數相關知識遷移。

基於關係知識的遷移學習

該方法假設源領域和目的領域的數據之間的聯繫是相同的,通過在源領域和目的領域的關係模型之間建立一個映射模型從而達到遷移的目的。

挑戰與展望

遷移學習作為人工智能領域的方向,說明人工智能領域將會往更加「智能化」的方向發展,將會為人類解決更多的問題。不過就目前來說,遷移學習仍然是一個新興領域,目前主要是學術界在進行算法的研究,在業界的實際應用落地方面還需進一步的發展。

就遷移學習技術特點,以及目前的發展現狀,我們可以推測,遷移學習未來可能的發展方向有以下幾種:(1)跨領域的遷移學習。(2)遷移學習與多種深度學習方法相結合。(3)利用遷移學習處理數據之間的偏差。(4)將遷移學習應用到非平穩環境的大數據分析平台。

總之,遷移學習代表了人工智能的「明天」,一定會成為人工智能領域發展的又一個重要推動力。

【華發網根據大公報採編】

(來源:网络)

  • 凡本網註明"来源:華發網繁體版的所有作品,版權均屬於華發網繁體版,轉載請必須註明來自華發網繁體版,https://china168.org。違反者本網將追究相關法律責任。
  • 本網轉載並註明自其它來源的作品,目的在於傳遞更多信息,並不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網註明的作品來源,並自負版權等法律責任。
  • 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

  • 1演習後發現榴彈短少 台軍全面清查演習後發現榴彈短少 台軍全面清查

    據中通社報道:台軍「漢光演習」結束後,陸軍第八軍團下轄裝甲旅日前清點彈藥時,發現40毫米榴彈練習彈數量與清冊不符。軍方22日回應,已成立專案小組清查中,並將檢討究責,防範類似事件重演。 [詳細]

  • 2「九章」量子神算 秒解億年難題「九章」量子神算 秒解億年難題

    記者4日從中國科學技術大學獲悉,該校潘建偉、陸朝陽等組成的研究團隊與中科院上海微系統所、國家並行計算機工程技術研究中心合作,構建了76個光子的量子計算原型機(港稱量子電腦原型機)「九章」,求解數學算法高斯玻色取樣只需200秒,而目前世界最快的超級[詳細]

  • 3 哪些核心技術, 還在“卡脖子”? 哪些核心技術, 還在“卡脖子”?

    劉亞東認為,缺乏科學武裝、缺乏工匠精神、缺乏持之以恆的情懷,成為阻礙中國攻克一些核心技術的共性原因。 “我國科技創新已進入跟跑、並跑、領跑‘三跑並存’的新階段。其中,2016年,全國投入研究與試驗發展經費15676.7億元,超過歐盟15國的平均水準2.0[詳細]

  • 4軍售化整為零 美賣台36戰車軍售化整為零 美賣台36戰車

    據外媒報道,美國國防部證實,將出售36輛AAV7A1型兩棲突擊車,這項總額為8360萬美元(約6.55億港元)的訂單由英國航太系統公司負責,預計2020年7月完成。兩岸學者表示,華府以小規模的個案方式處理軍售,是想降低中國大陸的強烈反應,但對台軍售違背中美三個聯[詳細]

  • 5穗智能機器人產業達600億穗智能機器人產業達600億

    據報道,記者7月1日從中國計算機學會廣州青年計算機科技論壇十五周年暨「智勝未來、智造廣州」專題論壇獲悉,目前廣州智能裝備及機器人產業規模已近500億元人民幣(約為593億港元),機器人生產量居全國第二。而廣州亦正在建設「國際科技產業創新中心」,打造[詳細]

  • 6科大校友研平價潛拍機 透視海底科大校友研平價潛拍機 透視海底

    海洋世界深不見底,吸引不少海洋愛好者去潛去拍去發現,但市面上的潛拍機價格高達八萬元且大多作工業用途。香港科技大學碩士校友組成的團隊研發出主打大眾市場的潛拍機,售價只是1.6萬港元,可深潛水底五十米,電池續航達四小時。[詳細]

  • 7「鵲橋」中繼星順利進入地月軌道「鵲橋」中繼星順利進入地月軌道

    據新華社報道:5月21日,探月工程嫦娥四號任務「鵲橋」中繼星在西昌衛星發射中心發射升空。14日11時06分,「鵲橋」中繼星成功進入環繞距月球約6.5萬公里的Halo使命軌道。這是世界首顆運行於地月L2點的通信衛星,將為2018年底人類首次窺探月背而發射的嫦娥四號[詳細]

  • 85G到來將催生更多智慧生活應用場景5G到來將催生更多智慧生活應用場景

    ​作為全球最大的移動互聯網市場,中國預計將在2025年將成為全球最大的5G市場。24日舉辦的粵港澳大灣區金融科技發展高峰論壇暨第七屆港股100強頒獎典禮上,眾多嘉賓看好5G商用市場,認為5G的到來將催生更多智慧生活的應用場景。 [詳細]

  • 9貝索斯送人上太空 旅費156萬起貝索斯送人上太空 旅費156萬起

    ​據英國路透社報道:亞馬遜(Amazon)兼太空探索公司藍色起源(Blue Origin)創辦人貝索斯2019年擬實行首次送人上太空的計劃,據兩位知情人士透露,該火箭公司計劃向乘客收取約20萬至30萬美元(約156萬至234萬港元)的太空旅費。[詳細]

  • 10機場App升呢 行李拎得即知機場App升呢 行李拎得即知

    ■林天福(右)介紹流動自助登機櫃位iCUSS。 香港文匯報記者莫雪芝 攝新功能程式下月有售可多次重用 不必一過關撲去輸送帶苦等機場智能化已是大勢所趨,在香港機場行李輸送帶苦候行李抵達一直為旅客所詬病。為提升旅客[詳細]

  • 11C919大型客機第三架機首飛成功C919大型客機第三架機首飛成功

    ​28日,記者從商飛公司獲悉,當日12時45分,C919大型客機103架機平安降落上海浦東國際機場,圓滿完成第一次飛行,標誌着目前共三架C919飛機進入試飛狀態。 [詳細]

  • 12中國首艘載人潛水器支持母船下水中國首艘載人潛水器支持母船下水

    ​據新華社報道:中船重工武船集團為中國大洋礦產資源研究開發協會打造「深海一號」8日在武漢順利下水。這是中國自主研製的第一艘載人潛水器支持母船,為中國大洋調查再添一利器。[詳細]




圖說新聞

更多>>
「九章」量子神算 秒解億年難題

「九章」量子神算 秒解億年難題


返回首頁