1、視聯網是什么?
2030年,全球帶攝像頭終端數量將達到130億臺,視頻流量將成為網絡流量中的主體,視頻物聯市場已成為新的增長引擎和競爭高地。隨著ChatGPT發布,AI技術出現革命性提升,視頻物聯在AI技術的加持下,全新的應用場景將大量涌現,比如智慧家庭、城市大腦、車路協同等等,而視頻、物聯、AI的進一步跨域融通,也面臨一些挑戰:
算力協同,視頻數據處理需要大量算力支持,單點算力受摩爾定律制約,難以滿足快速增長的智能化應用的計算需求,需要云網算力協同,比如車路協同場景,終端設備算力有限,需要將智能分析卸載到邊緣節點進行計算。
多媒體傳輸,在智能監控、語音社交、視頻社交、游戲語音和互動直播等領域,對多媒體傳輸時延的要求越來越高,需要低時延、高速、安全、實時的多媒體傳輸,受互聯網環境限制,優化提升空間有限。
泛在連接,人類社會傳播的文字、語音、圖像等信息從未像今天這樣呈指數級的增長,一方面信息大量過載,一方面因缺乏互通,使信息孤島問題日益嚴重。隨著數字化推進,需要強化多維感知、萬物智聯。
視聯網是在5G和寬帶網基礎上,通過云網融合能力升級,接入視頻、攝像頭實現物聯網可視化,打造以內容密度更高、更易接受的視頻為主要信息載體的新型互聯網絡,支撐高速增長的視頻、物聯、AI需求。
中國移動智慧家庭運營中心經多年技術積累,基于AIoTel物聯網多媒體通信能力、泛安防監控能力、場景化AI能力3大核心能力,攻關視聯網關鍵技術,構建視聯網能力平臺,孵化移動看家、和家智話2類全網業務,以和家親APP為智家服務入口,創新探索多類信息服務場景,打造1+2+3+X泛家庭信息服務體系(如圖1),支撐泛家庭市場高質量發展。目前基于視聯網能力,接入智能終端數達千萬級規模,用戶規模、云存儲規模位居業界第一。
圖1 1+2+3+X泛家庭信息服務體系
2、視聯網技術架構
視聯網為了突破大規模視頻物聯在感知、傳輸、存儲、算力等方面的技術挑戰,視聯網的技術架構一般包括基礎設施、平臺能力、平臺服務和能力開放。通過構建包括端、管、云、智、安等環節的關鍵能力,對智能感知技術、音視頻編解碼、多媒體傳輸、云原生、云邊端協同、全鏈路安全保障等技術進行深度融合,向上為平臺服務提供能力支撐。平臺服務為客戶提供全面、豐富的視頻物聯服務,并通過能力開放服務對外輸出視聯網能力。技術架構如圖2所示。
圖2 視聯網技術架構圖
為支撐超大規模視頻物聯服務,視聯網的部署架構(如圖3所示)通常采用“1+N+31+X”的四級部署架構,第一級的業務中心,用于運行核心的業務系統,承載重要用戶數據,采用同城雙活和異地熱備的兩級容災模式,保障核心業務系統可靠運行;第二級的能力中心,用于終端接入、用戶接入的實時調度,采用分大區模式進行區域化管理;第三級的省級節點提供視頻轉發、直播、存儲、計算等服務,將全網業務劃分到每個省,實現數據不出省、降低跨省主干網帶寬消耗,同時可滿足視頻物聯專業項目的數據安全性要求;第四級的邊緣節點按需建設,將存儲、算力下沉到地市、縣區級別,提供邊緣推流、存儲、計算服務,能顯著降低視頻傳輸時延,提高存儲和視頻AI推理的效率。“1+N+31+X”部署架構具備就近接入、二級容災、存智一體的特點,為視聯網提供低時延、高速率、強安全、強計算的使用體驗。
圖3 視聯網部署架構圖
3、視聯網關鍵技術之:智能感知
智能感知是視聯網在最末端(端側)的技術體系,圍繞智能、接入、多模態等方面關鍵技術進行攻關,實現一個多維融合、立體豐富的感知平面。
1?? 多傳感融合:煙感、氣感、門磁和攝像頭等各類智能終端都可視為傳感器,將多個傳感器的特征進行互聯,實現多模特征的時空融合,支撐上層應用制定更精確的決策。通過提取多個視聯終端的特征數據(如圖4所示),在邊緣節點進行智能分析,進行特征級融合,通過云端聯動不同設備的事件,例如:在煙氣感觸發告警時,聯動監控設備拍攝煙氣感的監控范圍,進行精準監控。
圖4 多傳感器融合原理圖
2?? 腦啟發編碼:基于人類大腦視桿、視錐細胞對2D信息的處理機制(如圖5所示),區別于傳統視頻編碼技術,對視頻圖像進行腦啟發編碼,提高像素編碼的壓縮上限。目前大規模設備的視頻采集具有極大的信息冗余,同時搭載算力芯片的智能設備具有一定的AI檢測識別能力,能夠對數據進行預處理提取關鍵信息,通過腦啟發編碼技術,大大降低傳輸帶寬并緩解了云端運算的壓力。
圖5 人腦處理機制示意圖
4、總結
以上我們介紹了視聯網的技術背景及其面臨的技術挑戰,視聯網技術架構通過構建端、管、云、智、安等環節的關鍵能力,向上支持平臺服務,并通過能力開放支撐高速增長的視頻、物聯、AI需求,中國移動智慧家庭運營中心基于視聯網能力,接入智能終端數達千萬級規模,用戶規模、云存儲規模位居業界第一,落地超大規模視聯網應用。