搜索右侧

您現在的位置:華發首頁>新 聞 > 專 題 > 科技 >

全能選手/國產AI新貴「小初」 智力媲美人類

更新時間:2021-07-13 15:06來源:網絡作者:@Mary人氣:3480

全能選手/國產AI新貴「小初」 智力媲美人類

圖:7月8日,2021世界人工智能大會開幕,超過300家企業的眾多前沿人工智能技術與產品集中亮相。\新華社

從檢索圖像、描述視頻,到吟詩作賦、續寫文章,再到識別語音、雙語翻譯,虛擬人「小初」日前亮相2021世界人工智能大會,賦詩讚美天宮,解說火箭視頻,意會太空遨遊,展示了圖、文、音三種模態的智能轉換和生成。這得益於一個名為「紫東太初」的跨模態通用人工智能平台。該平台由中國科學院自動化研究所研發,基於國產化基礎軟硬件,僅採用一個大模型,有效地提升機器的理解和生成能力,讓AI接近人類智力。

「小初,請以天宮為主題作首詩吧?」「天宮生殿開成,萬花垂露照初。稠雲不掩國志,飛天當觸明霞。」「你能看懂這個視頻嗎?」「視頻中,火箭正在發射。」「小初,圖片中航天員正在幹什麼?」

「航天員正穿着航天服站在機械臂上遨遊太空。」……7月9日,在2021世界人工智能大會(WAIC2021)上,中國科學院自動化研究所所長徐波發布了自動化所研發的跨模態通用人工智能平台──「紫東太初」。

圖文音全場景應用 自動學習

「紫東太初」平台是跨模態通用人工智能平台,以多模態大模型為核心,基於全棧國產化基礎軟硬件平台,可支撐全場景AI應用。「所謂跨模態是指它可以理解語音、文字和圖片等多種模態信息;所謂全棧國產化是指這個平台的底層算力、模型、框架等都是自主研發的。」徐波解釋道。

多種模態預訓練模型被廣泛認為是從限定領域的弱人工智能邁向通用人工智能路徑的探索。依託面向超大規模的高效分布式訓練框架,自動化所構建了具有業界領先性能的中文預訓練模型、語音預訓練模型、視覺預訓練模型,並開拓性地通過跨模態語義關聯實現了視覺、文本、語音三種模態統一表示,構建了三模態預訓練大模型,賦予跨模態通用人工智能平台多種核心能力。

徐波介紹,「紫東太初」兼具跨模態理解和生成能力。與單模態和圖片、文字兩種模態相比,「紫東太初」採用一個大模型就可以靈活支撐圖片、文字以及語音的全場景AI應用,具有了在無監督情況下多任務聯合學習、並快速遷移到不同領域數據的強大能力。

「引入語音模態後的多模態預訓練模型,可實現共性圖片、語音和文字的空間表徵和利用,並突破性地直接實現三模態的統一表示。」徐波說,特別值得強調的是,該平台首次讓「以圖生音」和「以音生圖」成為現實,對更廣泛、更多樣的下游任務提供模型基礎支撐,讓AI能夠在視頻配音、語音播報、標題摘要、海報創作等更多場景實現應用。

改變單一範式 探AI研發新路徑

「『紫東太初』跨模態通用人工智能平台包括三大關鍵技術和六大核心能力。」徐波說,三大關鍵技術分別是多模態理解與生成多任務統一建模、面向國產化軟硬件的高效訓練與部署、多模態預訓練模型架構設計與優化。六大核心能力則體現為多模態統一表示與語義關聯、跨模態內容轉化與生成、預訓練模型網絡架構設計、標註受限自監督模型學習、模型適配與分布式訓練、模型輕量化與推理加速。徐波表示,「大數據+大模型+多模態」將改變當前單一模型對應單一任務的人工智能研發範式,多模態大模型將成為不同領域的共性平台技術,是邁向通用人工智能路徑的探索,具有廣闊的應用前景。


(來源:网络)

  • 凡本網註明"来源:華發網繁體版的所有作品,版權均屬於華發網繁體版,轉載請必須註明來自華發網繁體版,https://china168.org。違反者本網將追究相關法律責任。
  • 本網轉載並註明自其它來源的作品,目的在於傳遞更多信息,並不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網註明的作品來源,並自負版權等法律責任。
  • 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

  • 1演習後發現榴彈短少 台軍全面清查演習後發現榴彈短少 台軍全面清查

    據中通社報道:台軍「漢光演習」結束後,陸軍第八軍團下轄裝甲旅日前清點彈藥時,發現40毫米榴彈練習彈數量與清冊不符。軍方22日回應,已成立專案小組清查中,並將檢討究責,防範類似事件重演。 [詳細]

  • 2「九章」量子神算 秒解億年難題「九章」量子神算 秒解億年難題

    記者4日從中國科學技術大學獲悉,該校潘建偉、陸朝陽等組成的研究團隊與中科院上海微系統所、國家並行計算機工程技術研究中心合作,構建了76個光子的量子計算原型機(港稱量子電腦原型機)「九章」,求解數學算法高斯玻色取樣只需200秒,而目前世界最快的超級[詳細]

  • 3 哪些核心技術, 還在“卡脖子”? 哪些核心技術, 還在“卡脖子”?

    劉亞東認為,缺乏科學武裝、缺乏工匠精神、缺乏持之以恆的情懷,成為阻礙中國攻克一些核心技術的共性原因。 “我國科技創新已進入跟跑、並跑、領跑‘三跑並存’的新階段。其中,2016年,全國投入研究與試驗發展經費15676.7億元,超過歐盟15國的平均水準2.0[詳細]

  • 4軍售化整為零 美賣台36戰車軍售化整為零 美賣台36戰車

    據外媒報道,美國國防部證實,將出售36輛AAV7A1型兩棲突擊車,這項總額為8360萬美元(約6.55億港元)的訂單由英國航太系統公司負責,預計2020年7月完成。兩岸學者表示,華府以小規模的個案方式處理軍售,是想降低中國大陸的強烈反應,但對台軍售違背中美三個聯[詳細]

  • 5穗智能機器人產業達600億穗智能機器人產業達600億

    據報道,記者7月1日從中國計算機學會廣州青年計算機科技論壇十五周年暨「智勝未來、智造廣州」專題論壇獲悉,目前廣州智能裝備及機器人產業規模已近500億元人民幣(約為593億港元),機器人生產量居全國第二。而廣州亦正在建設「國際科技產業創新中心」,打造[詳細]

  • 6科大校友研平價潛拍機 透視海底科大校友研平價潛拍機 透視海底

    海洋世界深不見底,吸引不少海洋愛好者去潛去拍去發現,但市面上的潛拍機價格高達八萬元且大多作工業用途。香港科技大學碩士校友組成的團隊研發出主打大眾市場的潛拍機,售價只是1.6萬港元,可深潛水底五十米,電池續航達四小時。[詳細]

  • 7「鵲橋」中繼星順利進入地月軌道「鵲橋」中繼星順利進入地月軌道

    據新華社報道:5月21日,探月工程嫦娥四號任務「鵲橋」中繼星在西昌衛星發射中心發射升空。14日11時06分,「鵲橋」中繼星成功進入環繞距月球約6.5萬公里的Halo使命軌道。這是世界首顆運行於地月L2點的通信衛星,將為2018年底人類首次窺探月背而發射的嫦娥四號[詳細]

  • 85G到來將催生更多智慧生活應用場景5G到來將催生更多智慧生活應用場景

    ​作為全球最大的移動互聯網市場,中國預計將在2025年將成為全球最大的5G市場。24日舉辦的粵港澳大灣區金融科技發展高峰論壇暨第七屆港股100強頒獎典禮上,眾多嘉賓看好5G商用市場,認為5G的到來將催生更多智慧生活的應用場景。 [詳細]

  • 9貝索斯送人上太空 旅費156萬起貝索斯送人上太空 旅費156萬起

    ​據英國路透社報道:亞馬遜(Amazon)兼太空探索公司藍色起源(Blue Origin)創辦人貝索斯2019年擬實行首次送人上太空的計劃,據兩位知情人士透露,該火箭公司計劃向乘客收取約20萬至30萬美元(約156萬至234萬港元)的太空旅費。[詳細]

  • 10機場App升呢 行李拎得即知機場App升呢 行李拎得即知

    ■林天福(右)介紹流動自助登機櫃位iCUSS。 香港文匯報記者莫雪芝 攝新功能程式下月有售可多次重用 不必一過關撲去輸送帶苦等機場智能化已是大勢所趨,在香港機場行李輸送帶苦候行李抵達一直為旅客所詬病。為提升旅客[詳細]

  • 11C919大型客機第三架機首飛成功C919大型客機第三架機首飛成功

    ​28日,記者從商飛公司獲悉,當日12時45分,C919大型客機103架機平安降落上海浦東國際機場,圓滿完成第一次飛行,標誌着目前共三架C919飛機進入試飛狀態。 [詳細]

  • 12中國首艘載人潛水器支持母船下水中國首艘載人潛水器支持母船下水

    ​據新華社報道:中船重工武船集團為中國大洋礦產資源研究開發協會打造「深海一號」8日在武漢順利下水。這是中國自主研製的第一艘載人潛水器支持母船,為中國大洋調查再添一利器。[詳細]




圖說新聞

更多>>
「九章」量子神算 秒解億年難題

「九章」量子神算 秒解億年難題


返回首頁