官术网_书友最值得收藏!

2.3 計算機視覺的學習方式和未來趨勢

“給計算機連上一個攝像頭,讓計算機描述它看到什么。”這是計算機視覺作為一門學科被提出時就做出的目標。如今還有大量研究人員為這個目標孜孜不倦地工作著。

拿出一張圖片,上面有一只貓和一條狗,讓一個人去辨識(見圖2-12)。無論圖片上的貓或狗的形象與種類如何,人類總是能夠精確地區分圖片上是貓還是狗。把這種帶有標注的圖片送到神經網絡模型中去學習則稱為“監督學習”。

圖2-12 貓和狗

雖然在目前看來,在監督學習的計算機視覺領域,深度學習取得了重大成果,但是相對于生物視覺學習和分辨方式的“半監督學習”和“無監督學習”,還有更多重大的內容亟待解決,如視頻里物體的運動、行為存在特定規律;在一張圖片里,一個動物也是有特定結構的,利用這些視頻或圖像中特定的結構,可以把一個無監督的問題轉化為一個有監督的問題,然后利用有監督學習的方法來學習。這是計算機視覺的學習方式。

MIT給機器“看電視劇”預測人類行為,MIT的人工智能為視頻配音,迪士尼研究院可以讓AI直接識別視頻里正在發生的事。除此之外,計算機視覺還可應用在那些人類能力所限、感覺器官不能及的領域和單調乏味的工作上——在微笑瞬間自動按下快門、幫助汽車駕駛員泊車入位、捕捉身體的姿態與電腦游戲互動、工廠中準確地焊接部件并檢查缺陷、幫助倉庫分揀商品、離開家時掃地機器人清潔房間、自動將數碼照片進行識別分類。

或許將來門禁系統能分辨出帶有禮物的朋友,或者手持撬棒即將行竊的歹徒。更奇妙的是,它還能超越人類雙眼的感官,用聲波、紅外線來感知這個世界,觀察云層的洶涌起伏來預測天氣,監測交通來調整車輛,甚至突破我們的想象,幫助理論物理學家分析超過三維空間中物體的運動。

主站蜘蛛池模板: 桐梓县| 文化| 高陵县| 方山县| 邮箱| 武威市| 永胜县| 含山县| 时尚| 绿春县| 茶陵县| 镇江市| 镇雄县| 涟水县| 乐都县| 安阳市| 天津市| 习水县| 盐津县| 民勤县| 阿合奇县| 邵武市| 井陉县| 广安市| 上饶县| 宜昌市| 白水县| 呼伦贝尔市| 广东省| 湟中县| 大理市| 贞丰县| 久治县| 芒康县| 兰坪| 南城县| 华安县| 陈巴尔虎旗| 安龙县| 松阳县| 社旗县|