切換到寬版
  • 214閱讀
  • 0回復

高文院士:城市大腦易患自閉癥,數字視網膜是良方 [復制鏈接]

上一主題 下一主題
 
博彩時時彩

      在11月19日的世界人工智能融合發展大會主論壇上,高文作了主題為智能交通與數字視網膜的報告,為到場觀眾分享了數字視網膜的原理及其在智能交通領域的應用。
      

      
      11月19-20日,以“動能煥新·智慧融合”為主題的世界人工智能融合發展大會在山東濟南隆重召開。在11月19日上午的主論壇上,中國工程院院士、新一代人工智能產業技術創新戰略聯盟理事長高文作了主題為智能交通與數字視網膜的報告,為到場觀眾分享了數字視網膜的原理及其在智能交通領域的應用。85%到90%的城市數據是監控視頻數據,超大數據量卻有著超低價值密度;基于當前的城市大腦架構,城市大腦容易患“自閉癥”和“癲癇”。高文指出,借助數字視網膜的三個特征,我們不僅能優化城市大腦,還能為智能交通提供更好的解決方案。以下是高文的報告原文,億歐在不改變嘉賓原意的基礎上,進行了編輯。
      
      今天我和大家分享如何利用傳感和計算系統做好智能交通。我的演講分為三個部分:第一,什么叫數字視網膜?它是為了利用視覺云計算解決當前系統的問題才提出的。第二,數字視網膜在智能交通中的運用,最后是總結。
      
      傳統城市大腦架構帶來的問題:超大數據量,超低價值密度
      
      如果要借助系統把視頻里的內容協調起來,需要要解決三個問題:為什么,怎么做以及具體的概念是什么。不管是數字視網膜還是圖像、視頻處理都經過了長期的演化路徑。以前處理能力不強的時候,攝像頭或者傳感器和處理器挨得很近。隨著攝像頭價格降低以及云計算的出現,二者才拉開距離。
      
      一個城市有若干個分存儲器,一個總中心,最后所有的決策分析都要在總中心來做。但是數據是從最末端的每個攝像頭匯總到分中心,最后到指揮中心。數據是如何傳輸的?以前,攝像頭拍的東西直接送回,需要的帶寬太寬,費用太高,所以用編碼器壓縮后送回,然后存到分中心。送到總中心后,需要進行解碼,提取出有用的特征,再進行分析和識別。以前用手工特征和基于手工特征的分析識別系統來做特征提取和分析識別,現在基本都用深度神經網絡來做。
      
      絕大多數城市大腦運用這樣的分層組織架構,只要有足夠的算力是沒有問題的。中間是云,從最底層的存儲到中間有一個數據交換的平臺,再上面是算法平臺,最上面是服務平臺。存儲直接連接前端傳感器接收的東西,比如攝像頭拍攝的內容。但這種系統的效率卻較為低下。什么原因呢?現在的攝像頭拍下內容壓縮后,會送到云端進行解碼,再進行特征提取和分析,這種做法很難做到實時。
      
      為什么公安、交通等攝像機網絡很難實時?現在系統加了很多智能攝像頭,攝像頭本身可以識別車牌或人臉再把結果送返,但是這種架構其實是并不對的,因為這樣做解決了小問題,卻帶來更多大問題。大規模的攝像機網絡數據非常大,但它并不是大數據。這些攝像頭拍下來的東西,很難形成對整個城市的規劃改進有幫助的數據。數據最長存三個月,有的可能存兩個星期,就被覆蓋掉了,這是非常浪費的事情。
      
      第二個問題。數據也是一種生產資料,當你有足夠的數據,你就有了財富。但是城市監控的視頻數據例外,因為在現有的體系下,很難把價值發揮出來。現在城市里的數據85%-90%是監控視頻數據,但是真正對城市管理做出貢獻的這部分數據基本發揮不了作用。超大數據量,卻有著超低價值密度。
      
      怎么讓它更有價值呢?我們要想出一些可以應用在攝像頭上的技術,把有用的數據抽取出來,送到云里,將來在云里可以處理,也可以長期存儲。要想做到這一點,首先看架構和我們想達到的目的到底有沒有矛盾。矛盾就是現在攝像頭干的活要么太多了,要么太少了。不做特征提取的攝像頭幾乎對形成大數據沒做貢獻,直接識別人臉貢獻量并不大。
      
      城市大腦系統最容易犯 “自閉癥”和“癲癇癥”
      
      監控視頻有兩種用法,一種是由人親自看,另一種是用機器分析。現在機器分析做演示挺好,但是常規的也用機器分析,如果前端不支持,完全靠云,需要的大量的算力。我們眼睛效率非常高,有沒有辦法讓計算機識別學一學生物系統的眼睛?
      
      眼睛通過視網膜獲取光學信號,視網膜里有兩種比較關鍵的細胞,感光細胞和錐狀細胞。我們平時看東西都是通過這些細胞把信號收集來,傳到大腦去。眼睛視網膜的和最后傳到大腦里的細胞數存在差值,眼睛視網膜細胞數是后面腦區接收的數量的126倍。也就是說,視網膜上有126個細胞,最后匯總到連接到腦的一個神經元上。人的視覺系統,在傳達信息時經過若干層,每傳一層信息就進行縮減,一直傳到腦神經的連接地方。這就給我們一個很好的啟發:脊椎動物視網膜設計得非常巧妙,這種結構對視覺認知非常有幫助。
      
      城市大腦反而比較像病態的人的視覺系統。從神經系統解釋自閉癥和癲癇癥的根源,自閉癥就是人一生下來,末端神經和腦端的神經幾乎全連接,神經系統所有的連接都相似且都連著。嬰兒接受外界刺激、學習的過程,實際把全連接的網絡進行了增強和剪裁,有些連接變得越來越粗,有些連接慢慢就萎縮掉。一個正常的孩子,該衰減的衰減,該增強的增強,最后是正常的。如果小孩在發育的時候沒有經常進行剪裁,這個孩子長大以后就會犯自閉癥。
      
      現在我們的城市大腦系統,沒有進行任何信息的提取,每個攝像頭在系統里同等重要,這是一個“自閉癥系統”。如果有的攝像頭特別重要,比如有的攝像頭能識別出車牌號,這些連接就太粗壯,系統很容易變成“癲癇癥系統”。現有的城市大腦系統最容易犯的兩種病,就是“自閉癥”或者“癲癇癥”。因此,我們需要有一個系統,像人的視覺系統一樣,把信息匯總以后,縮減以后再往上送。
      
      數字視網膜的三個本質特征
      
      數字視網膜有八個最主要的特性,我匯總成三個本質特征。
      
      第一個特征叫做全局統一的時空ID。每個攝像頭只要送信息回來,馬上就知道時間和物理地點。
      
      第二個特征,視網膜本身要有高效視頻編碼的能力,高效特征編碼的能力和聯合優化的能力。現在有很多視頻編碼的標準,像AVS標準,MPEG4等。特征編碼,有CDVS標準,CDVA標準等。如果在一個碼流里,同時要監控視頻編碼和特征編碼的話,要有一個辦法讓它們可以聯合優化。
      
      第三個本質特征,就是模型可更新,注意可調節,軟件可定義。我們現在都是用神經網絡模型做特征提取,隨著時間推移可能會有新的算法出來,需要把模型升級。而以前的攝像頭,芯片做成以后,算法無法升級。注意可調節,同一個畫面里的東西,我們可以賦予它感興趣區域這樣一個功能。軟件可定義,可以通過軟件升級來實現。
      
      不像傳統的攝像頭有一個流,視頻壓縮流或者識別結果流。新的數字視網膜實際有三個流,包括視頻編碼流,特征編碼流,模型編碼流。當然這三個流各有分工,有的在前端實時控制調節,有的是通過云端反饋進行調節和控制的。數字視網膜到底怎么用?主要通過腦眼合一的方式。來自終端的信息經過數字視網膜的處理,送到云端的,全都是用這三個流進來,有的流可以用來看,有的流可以由機器自動處理,而且是可以升級、有注意的。
      
      在深圳,我們專門造了一個鵬程云腦做數字交通,能夠建立開源生態,視頻編碼標準是其中的一塊重要的使能技術,而且視頻編碼已經有可以采用的芯片。現在聯盟也在做一些基于剛才說的標準的大的應用標準。關于模型,甚至模型的滲透壓縮,我們也正在進行標準化的工作。
      
      數字視網膜的第一款芯片很快就會發布,這個芯片大小如一塊錢硬幣,三個本質特征,八個功能全都包含在里面。這款芯片目前已經進入開發階段,將來可能會直接進入各種智能交通的系統,支撐數字視網膜的應用。我們也在建立數字視網膜的生態,并通過產業聯盟推進。
      
      最后總結一下,數字視網膜有三個特征:全局統一的時空ID;包括高效的視頻編碼,高效的特征編碼,聯合優化等多層次的視網膜表達的特征;包括模型可更新,注意可調節,軟件可定義的聯合特征。我們的一些使能技術已經做得非常不錯,加上硬件和云,可以為智能交通提供一些優化解決方案。
      
      
快速回復
限80 字節
如果您在寫長篇帖子又不馬上發表,建議存為草稿
 
上一個 下一個
      平特肖公式规律