人工智能(AI)和深度學習無處不在,如今它們具有重塑城市景觀的潛力。分析景觀圖像的深度學習模型可以幫助城市規劃者可視化重建計劃,以提高美觀度并防止代價高昂的錯誤。然而,為了使這些模型有效,它們需要準確地識別和分類圖像中的元素,這是一個稱為實例分割的挑戰。這一挑戰是由于缺乏合適的訓練數據造成的,因為生成準確的“地面實況”圖像標簽涉及勞動密集型的手動分割。然而,最近發表的一篇論文表明,一個團隊可能找到了答案。
通過人工智能生成創新的合成數據
大阪大學的研究人員通過利用基于人工智能的計算機模擬,來訓練需要大量數據的模型,設計了解決該問題的方法。他們的方法包括創建一個真實的城市3D模型來生成地面實況分割。然后,圖像到圖像模型根據地面實況數據生成逼真的圖像。此過程會產生類似于實際城市的逼真圖像數據集,并配有精確生成的地面實況標簽,從而無需手動分割。
雖然合成數據以前已用于深度學習,但他們的方法有所不同,通過城市結構模擬為現實世界模型創建足夠的訓練數據。通過按程序生成現實城市的3D模型并使用游戲引擎創建分割圖像,他們可以訓練生成對抗網絡將形狀轉換為具有現實城市紋理的圖像,從而生成街景圖像。
優勢及未來前景
這種方法消除了對實際建筑物的公開可用數據集的必要性,并且能夠分離單個對象,即使它們在圖像中重疊也是如此。它顯著減少了人力,同時生成高質量的訓練數據。為了驗證其有效性,研究人員在模擬數據上訓練了分割模型,并將其與在真實數據上訓練的模型進行了比較。人工智能模型在涉及大型、獨特建筑物的實例上表現類似,但數據集準備時間大幅減少。
研究人員的目標是提高圖像到圖像模型在不同條件下的性能。他們的成就不僅解決了訓練數據的短缺問題,還降低了與數據集準備相關的成本,為深度學習輔助城市景觀美化的新時代鋪平了道路。