185-0822-7772
四川海輝千訊網(wǎng)絡(luò)科技有限公司
地址:成都雙流區(qū)東升街道藏衛(wèi)路南二段699號附6號1層
電話:185-0822-7772(王)  
189-8000-5257(佘)
郵箱:[email protected]
成都弱電公司訊:
近一兩年來,人工智能領(lǐng)域得到了媒體界、產(chǎn)業(yè)界和學(xué)術(shù)界等前所未有的關(guān)注,機器正在越來越多的取代人類特有的優(yōu)勢和技能,這其中最為重要的可能就是圖像辨認(rèn)技術(shù)。本文將從圖像辨認(rèn)技術(shù)的原理闡述出發(fā),介紹這一技術(shù)在安防行業(yè)的具體應(yīng)用,并且闡述其在當(dāng)前安防應(yīng)用上碰到的困難。當(dāng)然,面對這些困難,圖像辨認(rèn)技術(shù)將以此為契機,與安防技術(shù)實現(xiàn)更大范圍的融合與發(fā)展。
圖像辨認(rèn)技術(shù)與人工智能
說起圖像辨認(rèn),人類的這一能力非常突出。圖形**作用于感覺器官,人們辨認(rèn)出它是經(jīng)驗過的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過程叫做圖像再認(rèn)。在圖像辨認(rèn)中,既要有當(dāng)時進入感官的信息,也要有記憶中存儲的信息。只有通過存儲的信息與當(dāng)前的信息進行比較的加工過程,才能實現(xiàn)對圖像的再認(rèn)。
計算機圖像辨認(rèn)技術(shù),則是利用計算機對圖像進行處理、分析和理解,以辨認(rèn)各種分歧模式的目標(biāo)和對象的技術(shù)。圖像辨認(rèn)所研究的問題,是如何用計算機代替人類去自動處理大量的物理信息,解決人類所無法辨認(rèn)或者辨認(rèn)過于耗費資源的問題,從而很大程度上解放人類的勞動力。
圖像辨認(rèn)技術(shù)是人工智能的一個重要領(lǐng)域。圖像辨認(rèn)技術(shù)是以圖像的主要特征為基礎(chǔ)的。每個圖像都有它的特征,對圖像辨認(rèn)時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向忽然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特征轉(zhuǎn)到另一個特征上。由此可見,在圖像辨認(rèn)過程中,知覺機制必須排除輸入的多余信息,抽出關(guān)鍵的信息。同時,在大腦里必定有一個負(fù)責(zé)整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
為了編制模擬人類圖像辨認(rèn)活動的計算機程序,人們提出了分歧的圖像辨認(rèn)模型。例如模板匹配模型。這種模型認(rèn)為,辨認(rèn)某個圖像,必須在過去的經(jīng)驗中有這個圖像的記憶模式,又叫模板。當(dāng)前的**假如能與大腦中的模板相匹配,這個圖像也就被辨認(rèn)了。但這種模型強調(diào)圖像必須與腦中的模板完全符合才能加以辨認(rèn),有一定的局限性。格式塔心理學(xué)家又據(jù)此提出了一個原型匹配模型。這種模型認(rèn)為,在長時記憶中存儲的并不是所要辨認(rèn)的無數(shù)個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要辨認(rèn)的圖像。假如能找到一個相似的原型,這個圖像也就被辨認(rèn)了。但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,它也難以在計算機程序中得到實現(xiàn)。因此又有人提出了一個更復(fù)雜的模型,即“泛魔”辨認(rèn)模型。
隨著計算機技術(shù)及人工智能技術(shù)的發(fā)展,圖像辨認(rèn)技術(shù)越來越成為人工智能的基礎(chǔ)技術(shù),它將是未來科技領(lǐng)域幾大關(guān)鍵產(chǎn)業(yè)的核心技術(shù)之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動這項功能進步。好比微軟的圖像辨認(rèn)應(yīng)用“我看起來有多大”(HowOldDoILook?),成為網(wǎng)絡(luò)上紅極一時的話題。在去年舉行的第六屆ImageNet圖像辨認(rèn)技術(shù)比賽中,微軟憑借“圖像辨認(rèn)的深度殘差學(xué)習(xí)”(DeepResidualLearningforImageRecognition)系統(tǒng)獲得第一名??萍脊救绱藷嶂杂趫D像辨認(rèn)技術(shù)的應(yīng)用和創(chuàng)新,這種進步顯然會大大方便互聯(lián)網(wǎng)、傳媒行業(yè)及科研領(lǐng)域的相關(guān)工作。