Channel: 電腦王

↧

Google透過人工智慧教電腦如何分辨透明物體

February 13, 2020, 5:00 pm

≫ Next: Wi-Fi 6E/Bluetooth 5.0 行動版整合式晶片先出爐！Broadcom 宣布推出 BCM4389 支援 160MHz 頻寬

≪ Previous: MSI 雙陣營 Radeon RX 5500 XT 與 GeForce GTX 1650 Super Gaming X 版本顯示卡對決！

如何正確辨視透明物體一直是電腦視覺領域的一大難題，雖然自駕車或工業自動化機器人大多搭載先進且複雜的影像辨識系統，但往往敗在透明物體上。為了解決這項挑戰，來自哥倫比亞大學、Synthesis Ai與Google的研發團隊共同推出ClearGrasp技術，透過人工智慧的方式強化辨識效果。

透明物體常被辨識成雜訊

目前電腦視覺常使用RGB-D相機（可以記錄景深資訊的相機，如Kinect）、光達（Lidar）等光學距離感應器建立準確的3D環境模型，然而使用光學方式偵測的缺點，就是很容易受到玻璃容器等透明物體干擾。

其中主要的原因，在於這類感應器在運作過成中，會假設所有的物體表面均為完全漫反射（Lambertian Reflectance，指表面能將光線均勻反射至所有方向，從而在所有視角下產生均勻的表面亮度），然而透明物體的表面除了有反射光之外，還會有折射光，所以違背了這個假設，造成無法辨識或是被辨識為雜訊等情況。

根據ClearGrasp的論文（PDF）指出，ClearGrasp可以在深度學習的協助下，使用深度卷積網絡判斷物體表面的法線，以及透明物體的表面遮罩、遮擋邊界（Occlusion Boundary，即景深的不連續性），以精確推算單張RGB-D圖像中的景深資訊。

▲ 使用Intel RealSense D415景深攝影機拍攝透明物體的效果並不理想。（圖片來源：Google，下同）

在3D模型中透明物體的很多部分無法正常偵測。 ▲ 以傳統方式建立的3D模型中，許多透明物體無法正常偵測並顯示出來。

▲ ClearGrasp（右下）能大幅提升辨識透明物體的準確度。

使用模擬圖像訓練

ClearGrasp運作過程總計使用3個神經網路，第1個是用於標記物體表面的法線，第2個則用於標記遮擋邊界，最後的則用於標記透明物體，以利後續透過遮罩過慮屬於透明物體的所有像素，並在最後補上正確的景深數據。

由於目前沒有現成的透明物體圖片與景深資料庫，因此在訓練過程中，開發團隊使用3D繪圖的方式產生了超過50,000張的RGB-D模擬圖像，這樣一來不但可以快速建立資料庫，還能夠使用逼真的CG圖像搭配準確的景深資料訓練系統，並依需要改變背景和照明條件，增加訓練資料庫的豐富性。

為了驗證訓練成果，研發團隊準備了286組真實照片，每組由2張照片構成，其中1張包含透明物品，而另1張則將透明物品替換為外型一模一樣的非透明物品，藉以分析2種情況下的辨識情況是否相同。

值得注意的是，雖然這種訓練能準確辨識真實照片中的透明物體，但對於其他表面（如牆壁或一般物品）的表面辨識確不太理想，因此開發團隊還補充使用Matterport3D與ScanNet資料庫訓練系統一般物品，以強化整體表現。

在驗證實驗部分，開發團對使用UR5機械手臂測試抓取透明物體，使用平行爪抓取物體的成功率可以從12％提升到74％，如果使用吸盤吸取物體的話，成功率則從64％提高升到86％，證明ClearGrasp的準確度相當理想。

▲ ClearGrasp總共使用3個神經網路分析輸入的影像。

▲ 研發團隊使用大量電腦繪圖的模擬圖像訓練深度學習系統。

▲ 並使用包含透明、非透明對照物品的真實照片驗證。

▲ 此外研發團隊還使用Matterport3D與ScanNet資料庫訓練系統辨識一般物品，強化整體準確度。

▲ClearGrasp的成果展示。影片最後可以看到ClearGrasp（右上）的辨識情況與真實條件（左上）相當接近。

ClearGrasp目前已經以開源型式釋出，有興趣的讀者可以參考專案網頁或GitHub取得更多資訊。

加入電腦王Facebook粉絲團

↧

Trending Articles

《沈冰自述——我和周永康的故事》全本

February 8, 2015, 9:08 pm

Moog - Subsequent 25

January 16, 2020, 12:00 am

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

March 9, 2013, 11:02 am

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

July 16, 2019, 11:03 pm

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

April 24, 2019, 6:56 am

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

October 28, 2019, 8:49 pm

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

December 28, 2017, 6:55 pm

acermark龍璿國際展出多款包裝設備

April 18, 2016, 6:02 am

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

October 15, 2018, 6:03 am

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

September 4, 2013, 2:57 am

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

June 23, 2020, 2:17 am

MAS v2.8 magicgenius 汉化版 - 11.11更新

November 10, 2024, 5:46 pm

出售: Monster Cable Interlink Reference 2

May 23, 2018, 2:00 am

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

August 17, 2015, 1:12 am

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

December 21, 2016, 9:38 pm

[转载]煞貢、直星、人專吉日\金神七煞歌

March 3, 2016, 6:37 am

HAKERS哈克士戶外 12月8~14日廠拍

December 6, 2016, 3:52 am

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

June 16, 2019, 8:10 am

<請教>行駛中安卓機會重新開機

August 5, 2018, 7:25 am

Udp2raw-tunnel 及其一键安装脚本

October 23, 2017, 6:46 pm

© 2024 //www.rssing.com