計算機視覺是個技術活
- 更新時間:2016-12-15 10:28來源:網絡作者:@aiman人氣:32922
迄今為止,影像是容量最大的信息載體。幾千年前,人類發明了文字,記錄了語音;二百年前,人類制造了相機,保存了圖片;直到最近幾十年,人類才發明了動態圖片,也就是影像、視頻。
計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
作為一個科學學科,計算機視覺研究相關的理論和技術,試圖建立能夠從圖像或者多維數據中獲取‘信息’的人工智能系統。這裏所指的信息指Shannon定義的,可以用來幫助做一個“決定”的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中“感知”的科學。
作為一個工程學科,計算機視覺尋求基於相關理論與模型來建立計算機視覺系統。這類系統的組成部分包括:
程序控制(例如工業機器人和無人駕駛汽車)
事件監測(例如圖像監測)
信息組織(例如圖像數據庫和圖像序列的索引建立)
物體與環境建模(例如工業檢查,醫學圖像分析和拓撲建模)
交感互動(例如人機互動的輸入設備)
計算機視覺同樣可以被看作是生物視覺的一個補充。在生物視覺領域中,人類和各種動物的視覺都得到了研究,從而建立了這些視覺系統感知信息過程中所使用的物理模型。另一方面,在計算機視覺中,靠軟件和硬件實現的人工智能系統得到了研究與描述。生物視覺與計算機視覺進行的學科間交流為彼此都帶來了巨大價值。
計算機視覺包含如下一些分支:畫面重建,事件監測,目標跟蹤,目標識別,機器學習,索引建立,圖像恢複等。
計算機視覺既是工程領域,也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科,它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等。
視覺是各個應用領域,如制造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。由於它的重要性,一些先進國家,例如美國把對計算機視覺的研究列為對經濟和科學有廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grandchallenge)。計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。作為一門學科,計算機視覺開始於60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的。現在計算機視覺已成為一門不同於人工智能、圖象處理、模式識別等相關領域的成熟學科。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。
但是人類要想完全提取、“讀懂”影像中的信息,不是一件容易事。看電影時,你盯著男女主角談情說愛,注意到背後的房子是什么顏色了嗎?我們總是一心二用,看電視時玩手機又會錯過多少信息呢?爆炸的信息以影像的形式被儲存時,人類還有能力整理、檢索這些信息么?
一直以來,計算科學家一直在為建立世界上最精確的計算機視覺系統孜孜不倦地努力著,但取得進展的過程卻一直如馬拉松競賽般漫長而艱辛。救世主是時候出場了。
計算機視覺要做的很簡單,讓設備擁有“眼睛”和“大腦”,像人一樣看懂世界。眼睛好辦,有攝像頭,可是機器沒有大腦,這就麻煩了。上世紀60年代,研究人員就開始嘗試給機器裝“大腦”。有了計算機越來越強大的運算能力做基礎,也可以支撐各種先進的深度學習算法了。
計算機視覺一直是人工智能領域裏最活躍的部分,指紋識別、掌紋識別、 人臉識別都屬於其應用。
但它一直有兩個流派。十幾年前主流的觀點是,憑借著原有的二維攝像頭和強大的算法,就能完整還原真實世界。格靈深瞳聯合創始人、CTO趙勇,和他當時在布朗大學的導師就不這么看,“現實世界是三維的,使用二維攝像頭怎么可能展示真實的世界呢?”因此,二維攝像頭基礎上完成的視覺分析,也會大打折扣。
趙勇的離經叛道,讓他在十年後成為格靈深瞳創始人。回國創業之前,趙勇在穀歌研究院擔任過高級研究員(Google research SeniorScientist)。Google X是全球最酷的實驗室,Google Glass、無人駕駛汽車、長生不老計劃都在這裏,趙勇曾是最早提出GoogleGlass計劃的三人之一。
格靈深瞳的CEO何搏飛和趙勇完全是兩個世界的人。
2013年4月,blackhawk前總經理何搏飛離職,回中國尋找創業夥伴。同時,趙勇也在穀歌內部尋找合夥人,有兩名工程師一度非常熱情加入其中,但最終反悔。
兩個失落的人在投資人徐小平的撮合下,在北京北四環破舊的一棟居民樓裏見面了。科學家與商人從下午聊到淩晨2點。科學家給出了80個計算機視覺可以應用的領域,商人想在這裏試試做第一個將計算機視覺商業化的公司。
最初他們想到了將線下的零售“電商化”,讓傳統零售像阿裏、京東那樣擁有用戶行為數據。但這需要大量的訓練數據完善算法,趙勇和何搏飛要尋找人最多、影像最多的領域。
天安門廣場人最多,攝像頭也最多,每天產生的監控視頻數據,刻成光盤摞起來,比埃菲爾鐵塔還高。這些數據被用於安防,全球 50%
的硬盤都用來存儲監控視頻了。而且安防領域好賺錢,何搏飛給出的數據是,去年中國智能手機的銷售額是 3200 億,而安防設備的銷售額則達到了 4000 億。
視頻監控一直以來的兩大難題是看不見、找不著。裝有幾百個攝像頭的區域,最多只有幾十個監控屏幕輪番播放,監控人員往往看不到異常畫面;過後從海量視頻中尋找到需要的畫面又很難。
計算機視覺正好可以解決。格靈深瞳通過三維攝像頭和視覺感知技術,可以跟蹤人物運動軌跡、檢測動作姿態,發現異常主動預警、報告,保障安保人員“看得到”。同時,可以把個人的行動軌跡作為時間線,進行監測、跟蹤、搜索,真正做到“找得到”。
大市場加海量的數據庫,似乎短期內格靈深瞳已經可以高枕無憂了。不過,天有不測風雲。一項關鍵傳感器是由PrimeSense生產的,2013年11月PrimeSense被蘋果收購,其對外授權的技術都會在 2015 年終止。
當晚,聽到消息的趙、何二人都蒙了。“我們第一時間想到的是囤貨,還得安撫員工”,何搏飛如是回憶,“那個時候,我開始覺得我和趙勇是在一起的”。後來,他們找到了新的替代傳感器。
格靈深瞳找到了一個千億級市場。今年 10 月,這套安防產品已經布局了,四大國有銀行中的三大首批試點。
按何的說法,這么優質的計算機視覺技術局限於安防大材小用,所以他們要以安防產品為基礎做開放平台。
其實,安防市場也不好做。傳統的安防公司已經占據了大部分市場份額,格靈深瞳作為創業公司進入很難。安防市場又相對封閉,拿到了天安門廣場的全部訂單,其它廣場還是得一個一個談。另外,安防的產業鏈條長,從傳感器、存儲器的采購到元件的集成,闖入者格靈深瞳在供應鏈上沒有太多積累。
格靈深瞳真正的強項是識別算法。最佳做法是把安防識別的方案整合出來,做成模塊化方案,開放給廠商,做一個“封閉的系統,開放的產品”,既不用與安防廠商競爭,又能獲得海量的數據。試想下,未來如果全國大部分的監控屏幕的背後,都有格靈深瞳的安防識別系統,即使人們都不知道格靈深瞳這個品牌,又有什么關系呢?
這是第一步。下一步格靈深瞳要做“封閉的系統,開放的平台”,進一步將計算機識別技術模塊化,開放API接口。趙勇當時想到了80個可能應用的領域,但計算機視覺的應用很可能有八千甚至八萬種,以眾包的方式開放技術,就能孕育出來更多有趣、有意義的項目與產品。格靈深瞳要做的,就只有不斷升級自己的技術,最終做成一個“開放的系統,開放的平台”。
不過,要做開放平台,也沒有那么容易。首先自己技術要夠好,能夠抽象出模塊化的東西,才能開放API接口。
從成立至今,外界不少人質疑過格靈深瞳的技術。作為CEO,何搏飛也清楚這一點,坦言現在的技術還需要持續優化。
格靈深瞳的技術有四個方向:肢體識別(包括手部動作識別)、人臉識別、個體軌跡識別、人與人之間的關系與互動。現階段個體軌跡識別已經做成了完整的產品,並被運用在了銀行安防領域。手部、肢體識別,預計明年春節後也能成熟。在公共場所,人臉識別並不適用,1%的誤識率也許意味著上萬人被誤認為壞人,現階段還沒有很好的解決方案,仍然在研究當中。人與人之間的關系與互動,則是格靈深瞳未來最想解決的問題,人在網上形成的數據都已經很有價值了,那人在世界上形成的關系數據的價值就難以想象了。
這四個方向都很熱門。比如人臉識別,Face++就做得小有名氣。BAT也在嘗試,但沒有對外披露細節。
開放平台,還得讓開發者足夠放心。在國內,BAT做,開發者自然信賴。但由一家才創辦兩年的公司來做,就難以服眾。這也是格靈深瞳先從安防入手,做封閉系統的原因吧。畢竟,蘋果每次發布新產品、新功能,也會提前找到靠譜的開發者,讓消費者能第一時間體驗這些新特性。
這些都還是圍繞著人展開的。技術成熟了,格靈深瞳還可以做車。車是人行為的延展,舉個簡單的例子,司機的心情就會影響司機的開車行為。關於汽車識別,格靈深瞳內部已經醞釀了好長時間,在剛剛結束的董事會上,才定下來去做這個方向,具體如何操作,還在探索。
汽車是第一個真正意義上的機器人,汽車相關的市場也是一個大市場,當人的出行方式改變,人的行為就會發生很大改變。從人延展到車,這其中的想象意義就很難簡單的衡量、評價了。這方面,趙勇的師兄,也是Mobileye創始人,已經邁出了成功的一步。
而在中國,人工的成本越來越高,機器的成本越來越低。也許有一天,我們就會像日本一樣,汽車廉價,但打車就要付較高的成本了。當這兩條成本線相交時,即使不考慮商業模式,也能看到經濟價值了。
第一次聽到有投資人想要給他們數千億美元B輪融資,我和我的小夥伴們都驚呆了。資本的寒冬即將到來,這樣的聲音不絕於耳。不少做技術的公司,鮮有投資人問津。成立不到兩年的格靈深瞳,就有可能跨進10億美元俱樂部了。這也難怪,計算機視覺是個技術活。利用資本的力量,聚攏最優秀的計算機視覺大牛,人就是最大的競爭壁壘,後入局者很難有超越的可能了。
不過,何搏飛告訴36氪,他們現在並不急著拿錢。創業就像是一場馬拉松,節奏很關鍵。有人擔心口渴,早期拼命喝水,最終可能也不會有好的成績。資源也許同樣重要。格靈深瞳已經在做物理世界人與人的關系了,未來如果能打通虛擬世界的關系,這其中的想象空間就很大了。而最終,格靈深瞳想做一家偉大的人工智能的公司。
要成為一家偉大的人工智能公司,就要在廣度上影響到盡可能多的人,在深度上對單獨的個體產生足夠的影響與價值。Google、蘋果、百度、阿裏、騰訊都是這樣的公司。只是現在的互聯網已經很難再出現這樣的公司了。互聯網這一波的技術革命已經在要走完曆程,新的技術革命即將開始了。
關於技術革命,ChrisDixon有這樣一個觀點,技術革命一般要經曆兩個主要階段:安裝階段和部署階段。每一次革命均發端於金融泡沫,從而(不合理地)推動了新技術的快速“安裝”;然後泡沫破裂,緊接著是恢複期;之後,隨著新技術更廣泛地“部署”到其他行業及社會,進入到很長一段時間的生產力增長期。最終這輪革命走完曆程,新的技術革命又開始了。
安裝階段是打基礎,部署階段則是在基數之上做各類實際應用。安裝階段向部署階段轉化的過程中,會湧現出大量的創業活動。比方說,在汽車革命的安裝階段,其中的活動是造車。而在部署階段,活動則轉移到了應用層:高速公路體系,運輸、城鎮化、大賣場等。我們最熟悉的信息技術領域,安裝階段大家做的是信息網絡的核心技術設施,比如芯片、網關、TCP/IP協議,成就了思科、IBM、Intel、微軟;部署階段則是搜索(Google)、社交(Facebook)、電商(Amazon)。
如果下一次信息技術的革命是人工智能的話,那么現在格靈深瞳做的就是人工智能技術的核心技術設施。上一波的核心技術設施建設過程中,湧現出了一批像思科一樣的大公司。現今,Google、Facebook、Amazon我們如數家珍,思科更多的是以一個大公司的形象存在我們的記憶力,但這並不能代表它不偉大,它也依然是一家數千億美元市值的公司。我們今天互聯網的一切,很大程度上就是得益於思科這樣的公司。
根據 36氪(北京)等采編【版權所有,文章觀點不代表華發網官方立場】
- 凡本網註明"来源:華發網繁體版的所有作品,版權均屬於華發網繁體版,轉載請必須註明來自華發網繁體版,https://china168.org。違反者本網將追究相關法律責任。
- 本網轉載並註明自其它來源的作品,目的在於傳遞更多信息,並不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網註明的作品來源,並自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
- 1台灣青年大陸尋找出路,已是一種大趨勢
一大早,台灣青年劉惠菁便趕到四川省德陽市一家商場,進行無線充電設備的選址考察,趁著“五一”小長假測試下產品的性能。進駐德陽“海峽兩岸青年創業基地”不到一個月,劉惠菁的創業團隊便完成了公司人員組建、產品[詳細]
- 2“孵化器+資本+產業”,高新區產業轉型升級的新引擎
做項目路演,找合作夥伴,尋天使投資。昨天,廈門創新創業園芝麻開門創客彙迎來一批從美國矽穀來的“海歸”。這是由中國首家到美國矽穀投資置業建立的高科技園區——瀚海矽穀科技園舉辦的“瀚海矽穀項目中國行”廈門[詳細]
- 3無人便利店再次成為夏日的“熱風”
作為零售行業最具朝氣的業態,便利店一直是這兩年低迷的傳統零售環境下熱議的話題和資本追逐的目標。而“無人便利店”概念不同於往常,阿裏巴巴、宗慶後、創新工場……傳統零售企業、電商巨頭、資本和創業者的介入讓[詳細]
- 4自貿試驗區大膽嘗試,開放紅利越來越大
日前,國務院印發《關於做好自由貿易試驗區第四批改革試點經驗複制推廣工作的通知》,對自由貿易試驗區第四批改革試點經驗在全國范圍內的複制推廣工作進行部署,更好地服務全國改革開放大局,持續釋放改革開放紅利。 [詳細]
- 5只有順應趨勢的互聯網產品才能成長
曾有人認為,作為Twitter的模仿者,微博也會像Twitter一樣遭遇失敗。但事實證明,微博已經迎來“第二春”,也成為各大廣告主青睞的對象。相比之下,Twitter卻使勁渾身解數也依然無法討好廣告主,甚至淪落到“賣身”也[詳細]
- 6強化行業信用體系,規范網約車行業健康發展
近期,出租汽車行業改革再次成為熱門話題。一方面,美團、攜程、高德等各類市場主體紛紛進入,市場呈現蓬勃發展景象;另一方面,也出現了過度補貼競爭、非法營運等市場亂象,特別是乘客安全事件引發了關於網約車安全問題的廣泛討論。 [詳細]
- 7我國的高爾夫運動已經迎來新的發展階段
備受高爾夫愛好者和行業精英期待的中國高博會首次登陸上海,作為高博會唯一的金融服務機構,利得金融服務集團也隆重登場,為全國的高爾夫愛好者開啟一年一度高爾夫運動嘉年華。近些年,中國經濟快速增長,帶動了一大[詳細]
- 8未來三到五年皮革時尚產業的規模還會擴大,但結構會發生巨變
海寧艾瑪皮革時裝有限公司董事長周傑從2012年開始創建自己的公司,幾年運作下來,他發現一個趨勢越來越明顯:款式越來越多、單款產量越來越低。 “去年公司開發了不下1000個款式,產量最多的一個款式也沒超過2000[詳細]
- 9“趕上了好時代,趕上了黨的好政策”
5月11日上午,中國青年創客·融資機構交流會在成都市郫都區菁蓉鎮舉行。作為2017成都全球創新創業交易會重大活動之一,本次會議邀請了知名投融資機構、創業企業等相關負責人參會,並開展主題分享、項目路演等活動,搭[詳細]
- 10共用單車格局形成倒閉潮和併購潮開始出現
隨著移動通信技術與互聯網技術的飛速進步,人們認知水平和創新能力的不斷提升與突破,智能終端(手機、平板電腦等)也不斷推陳出新,移動互聯網各類產業發展方興未艾。各種創新理念、產品與服務也如雨後春筍一般層出不窮,令人目不暇接,傳統產業與互聯網結合越[詳細]
- 11科技源於夢想,孩子是科技發展的未來
由於近兩年國家對教育行業的高度重視、雲計算等相關技術的應用和推廣,我國的創客教育市場正處於異常火熱的狀態,但實際操作中,相較於歐美的成熟,日韓的領先,國內創客教育在課程體系設置、教師能力、教學設備等方[詳細]
- 12“凡是搞金融,都要持牌經營、納入監管、立足於服務實體經濟”
近日,央行行長周小川在央行官網發文稱,要堅持金融是特許經營行業,不得無證經營或超范圍經營。這是數月之內,周小川再次公開談及金融機構的牌照問題。此外,他還在文章中直指有些互聯網企業“以普惠金融為名,行龐[詳細]
- 和氣生財6/李家超:推廣禮貌服務 提升香港魅力
- 行政長官李家超將赴北京述職
- 吸引力足/寧德時代來港落戶 設國際總部及研發中心
- 免簽生效 到中國經商旅遊更方便
- 特區政府斥美打「法案牌」干預港事務
- 高鐵載客量超越疫前 短途增幅大
- 民進黨處心積慮搞「台獨教育」
- 市區「輕微僭建」 研申報後暫緩執法
- 情牽兩岸/創業台青深耕國漫IP 傳播中華文化
- 施政報告前瞻/設中醫藥專員 建數碼化中藥平台
- 兩岸京劇一脈傳 好戲連「台」見情深
- 投資信心提振 恒指連升六日共千點