人工智能的進步正在主導主流對話。AI的應用似乎是無限的——它會改變我們的世界以及我們與之互動的方式也就不足為奇了。與許多其他行業一樣,這尤其適用于增強現實。
人工智能模型已經被用于構建身臨其境的增強現實體驗——尤其是在移動設備應用程序上。增強現實和人工智能領域正在共同努力,創造直觀、獨特的體驗,更徹底地融合現實世界和數字世界。AI和AR開發的下一個前沿領域是將先進的AI功能應用到消費類AR眼鏡中,以擴大沉浸式參與的可能性。
生成式AI將加速3D世界的創建,并為佩戴者創造屬于自己的現實創造無限可能
生成式AI的特點是算法、語言模型方面的進步,以及可用于運行必要計算以映射物理世界并與之交互的增強處理能力。
迄今為止,AR眼鏡中的3D模型存在局限性,因為它們本質上是手動的。然而,生成式AI會非常快速且自主地創建這些。AR眼鏡中的生成式AI將有助于更快地構建3D模型,從而釋放AR的全部潛力。這種覆蓋物理世界的數字世界的創建將更快、更完整和身臨其境,而無需大量的手工勞動。
生成式AI還將改變用戶體驗以及我們與物理空間的交互方式。借助支持生成式AI的AR眼鏡,佩戴者可以真正將他們的想象力轉移到現實世界中。無需編碼,佩戴者可以使用語音識別通過AR眼鏡“說出”他們想要的圖像和3D對象。他們可以說:“想象一下,有一只海豚在房間里游來游去”——然后它就會出現在他們面前。這種沉浸式體驗對于娛樂、工作和其他方面來說幾乎是無限的。
采用生成式AI的AR眼鏡也將改變游戲世界,創造更加身臨其境和個性化的游戲體驗。例如,使用ChatGPT,可以更輕松地創建更逼真的角色并添加新的任務或游戲世界。它還可以用于通過分析玩家行為來改善游戲體驗,并實時讓游戲對玩家來說更容易或更具挑戰性,自主定制體驗。
人工智能支持的語音+書面文本翻譯將減少語言障礙
自動語音識別(ASR)使用神經網絡視聽語音識別(一種依靠圖像處理來提取文本的算法)。這可以將書面文本(例如國外菜單上的文本)實時翻譯成您的母語。
當應用于AR眼鏡時,它可以在有人說另一種語言時提供您母語的實時字幕——所有這些都在您的AR眼鏡的框架內。這消除了試圖用當地語言交流的游客和商務人士的挫敗感,從而營造了一個更具交流性和協作性的世界。
文本識別和翻譯將AI光學字符識別(OCR)技術與DeepL等文本到文本翻譯引擎相結合。諸如Stable Diffusion之類的AI引擎還可以通過動畫或其他有助于傳達復雜或詳細概念的視覺輔助來增強人們的交流。這加深了用戶的參與度:一副采用這種AI的AR眼鏡可以實時展示與用戶在面板或演示中在他們面前所說的內容相關的相應圖像或視頻。谷歌最近嘲笑開發具有此功能的AR眼鏡。
它還使聾人社區能夠通過立即將音頻轉換為顯示在佩戴者眼前的字幕來參與日常對話,而無需唇讀或眼神交流。
人工智能正在醫療保健、教育和許多其他領域發揮作用。很快我們就會擁有智能AR眼鏡,就像流行的科幻小說一樣,它將把人們帶入增強現實或虛擬現實環境,在這種環境中,AI可以快速映射房間和說話者的位置,無論任何一方身在何處,都可以實現無縫且不那么繁瑣的虛擬通信。
AI幫助AR眼鏡輕松檢測和標記現實世界中的物體——加深參與度。
對象檢測中的卷積神經網絡(CNN)算法目前在移動設備中用于估計場景中對象的位置和范圍。一旦它檢測到一個物體,AR軟件就可以將文本疊加到它上面或在物理世界中生成另一個物體,并在兩者之間創建交互。轉移到現實世界中的對象有很多應用,包括指導、導航、飲食和營養等等。
例如,當佩戴一副具有這些AI功能的AR眼鏡時,用戶可以走在任何城市的街道上,并在觀看時實時了解任何地標。AR眼鏡可以通過佩戴者的鏡架識別、標記和提供有關城市及其地標的信息。隨著物體識別技術的改進,任何食物和份量的卡路里、蛋白質、脂肪和膽固醇等營養數據都將可用。與此同時,產品上簡單的二維碼將為用戶聯想到營養細節。
在純粹的物體檢測之外,面部識別軟件也越來越普遍地用于人員檢測。隨著越來越多的航班使用該技術來確認乘客的身份,面部識別已經在航空業起飛——增加了額外的安全層并加快了登機過程。當面部識別應用于AR眼鏡時,可以為任何地方的佩戴者提供識別能力。例如,在不久的將來,借助AR眼鏡,你可能能夠在社交媒體上與其他人會面并即時接收他們的背景信息,然后再決定是否要與他們“交朋友”或聯系。
支持AI的AR眼鏡正在改變我們的生活,它們的視覺效果和功能將不斷提高。在我們日益互聯的世界中,他們正在簡化任務并打破僅在幾年前被認為是不可逾越的障礙。人工智能的進步如此之快,以至于在接下來的10年里,人工智能將取得比之前50年更多的進步。無論是政府、企業還是個人環境,人工智能都將很快與AR眼鏡融合,融合我們的物理環境和數字環境。