發(fā)布時(shí)間:2020-11-09 16:51:56
標(biāo)簽:監(jiān)控探頭如何識(shí)車牌
瀏覽(48214)
接上文
監(jiān)控探頭如何識(shí)別你的車牌?四通搬家公司通俗講解人工智能(上)
隨著硬件和算法的突破以及大規(guī)模神經(jīng)網(wǎng)絡(luò)的應(yīng)用,使得全天候的車牌定位和識(shí)別不再成為問題,那么如何具體實(shí)現(xiàn)呢?
02
—
字符分割
將車牌提取出來以后,還要進(jìn)行一次形態(tài)學(xué)處理和濾波器過濾,用來去除微小的干擾元素、粘連和噪點(diǎn),圖像中非車牌字符的干擾越少,識(shí)別正確率就越高!
這時(shí)顏色對(duì)我們來說也沒有意義了,顏色并不會(huì)對(duì)字符識(shí)別有所幫助。因此我們用純粹的黑白圖像取代彩色的車牌圖像來簡化處理過程,這種圖像只包含純黑和純白,如果之前已經(jīng)把干擾基本消除了的話,我們會(huì)得到一張非常清晰的車牌圖像,有字或邊框的地方為純白,無字的背景是黑色。
四通搬家貨車的車牌經(jīng)過處理以后的圖像,比之前清晰很多了
現(xiàn)在,我們面臨一個(gè)問題,即分割出來的單字不能帶有邊框,否則會(huì)嚴(yán)重影響計(jì)算機(jī)的判斷。比如,如果數(shù)字1的上下都有橫線邊框,計(jì)算機(jī)可能會(huì)將其誤認(rèn)為是字母Z。還有一些家用轎車的車牌外延有一圈不銹鋼邊框,這個(gè)邊框的寬度如果不去除的話也會(huì)對(duì)識(shí)別造成很大干擾。
有兩種方法來消除邊框。
,由于邊框是白色,所以從上到下,每一行逐個(gè)查看像素是黑還是白,如果發(fā)現(xiàn)一整行的像素全都是白色,則判斷這行一定是邊框。同理,從左至右,每一列逐個(gè)查看像素黑白,也能判斷出左右兩端的邊框位置。
第二種方法更簡單,由于攝像頭位置固定,如果我們能保證每次提取出來的車牌圖像尺寸基本一致的話,根據(jù)我國公布的車牌格式標(biāo)準(zhǔn),把所有得到的車牌按比例直接剪裁掉一部分邊界區(qū)域就可以了。
另外,上下的鉚釘可以通過統(tǒng)計(jì)整行像素的躍變次數(shù)來去除(因?yàn)殂T釘所在的行的像素變化肯定少于有文字部分的行)。
去除了邊框和鉚釘
現(xiàn)在,我們終于得到了一張完美的不含任何干擾因素的車牌,可以開始分割單個(gè)字符了。這時(shí)就無法按照格式尺寸來直接切割了,因?yàn)椴荒鼙WC拍攝到的車牌圖像尺寸如此精確到能夠按照比例正好分割到字符間隙的位置。
我們需要借助投影法來確定分割位置。所謂投影,就是對(duì)一整行或者一整列的像素?cái)?shù)求和。這里要用到列投影也就是垂直投影,即從左至右統(tǒng)計(jì)每一列的像素總數(shù),然后畫出一張統(tǒng)計(jì)直方圖。
垂直投影展示了字符存在的7個(gè)區(qū)域,凡是有字符的地方就是有能量的(黃色),凡是不存在字符的列就是沒有能量的藍(lán)色
簡單地說,由于字符是白色,背景是黑色,那么車牌上字符之間的間隙就是白色像素?cái)?shù)少的部分,通過上邊提到的的垂直投影就可以在直方圖上顯示出波峰和波谷,其中波谷也就是圖上藍(lán)色的能量的幾個(gè)位置,它們一定就是字符間隙,從這幾個(gè)位置下刀進(jìn)行分割一定錯(cuò)不了!這樣就可以分割出7個(gè)獨(dú)立的字符了。
03
—
字符識(shí)別
終于進(jìn)入的識(shí)別模塊了!總得來說,單字的識(shí)別技術(shù)相對(duì)于車牌定位和字符分割來講是簡單的部分。
主要的字符識(shí)別方法有兩種:
模板匹配
深度神經(jīng)網(wǎng)絡(luò)
模板匹配:常用的識(shí)別方法。通過建立已知的字符模板庫,再將需要識(shí)別的單個(gè)字符與模板庫的字符進(jìn)行比較;也就是用待識(shí)別的字符與模板庫中的所有字符圖像逐一做減法,差異小的就是識(shí)別結(jié)果。這種方法速度快,但是在神經(jīng)網(wǎng)絡(luò)成熟以后,模板匹配就顯現(xiàn)出了不夠精準(zhǔn)的問題。例如,如果一幅在雨雪天氣中捕獲的不太清晰的車牌圖像,那么同為方塊字的結(jié)構(gòu)類似的漢字間的差異可能并不大,這就會(huì)造成識(shí)別錯(cuò)誤。
深度神經(jīng)網(wǎng)絡(luò):和車牌定位中提到的神經(jīng)網(wǎng)絡(luò)是一個(gè)道理。將大量不同樣式的單個(gè)字符作為樣本,讓計(jì)算機(jī)通過神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)和訓(xùn)練,計(jì)算機(jī)就能具備分辨單個(gè)字符的能力。實(shí)際上,這樣的神經(jīng)網(wǎng)絡(luò)被稱為分類器,也就是將待識(shí)別的字符自動(dòng)歸類到計(jì)算機(jī)在訓(xùn)練中學(xué)到的某一類型字符中。這種方法需要海量的各種情況下拍攝到的單個(gè)字符樣本,現(xiàn)在道路攝像頭用的識(shí)別模塊一般就是這種方法。在巨量訓(xùn)練樣本的加持下,神經(jīng)網(wǎng)絡(luò)具備對(duì)較模糊的漢字的精準(zhǔn)識(shí)別能力。更關(guān)鍵的是,通過有針對(duì)性的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)甚至能夠像人腦一樣對(duì)殘缺的字符進(jìn)行一定程度上的推測。
用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一小部分字符樣本
神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)能夠識(shí)別出目標(biāo)字符
終,我們得到了正確的結(jié)果!前邊的內(nèi)容看似很長,但隨著硬件的進(jìn)步、普及和成本的下降,內(nèi)置高性能處理芯片的監(jiān)控探頭設(shè)備可以在不足半秒的時(shí)間內(nèi)就完成上述所有的步驟。這些探頭無需將拍攝的照片傳回?cái)?shù)據(jù)中心再處理,而是直接拍完就可以自我處理圖像并進(jìn)行識(shí)別,準(zhǔn)確率大于95%,通過4G或者有線網(wǎng)絡(luò)傳回識(shí)別結(jié)果就可以了,大大降低了交警數(shù)據(jù)中心的負(fù)荷。如果在不通網(wǎng)絡(luò)的地區(qū),則探頭設(shè)備會(huì)將識(shí)別結(jié)果自動(dòng)存儲(chǔ)在內(nèi)置硬盤中,交警會(huì)定期去探頭所在地取回硬盤數(shù)據(jù)。
彩蛋
—
關(guān)于國外
歐洲的車牌自動(dòng)識(shí)別起步很早,但是準(zhǔn)確率卻不盡如人意。以德國為例,根據(jù)統(tǒng)計(jì),德國黑森州、薩克森和巴伐利亞州在2016到2017年抓拍到的共150萬張違章車牌圖片中,自動(dòng)識(shí)別正確的僅有3萬余張,錯(cuò)誤率竟然高達(dá)驚人的98%,簡直令人噴飯!不過,歐盟境內(nèi)各國不同的車牌書寫格式也是造成自動(dòng)識(shí)別率低的一個(gè)原因。
德國道路卡口照片,左上角的識(shí)別結(jié)果將N4046識(shí)別成了N4346
由于未處理好鉚釘問題,將JK識(shí)別成了UK
識(shí)別結(jié)果漏掉了首字母H,仍是未處理好鉚釘造成的粘連問題。
其實(shí),歐洲具備起步很早的光學(xué)字符識(shí)別技術(shù)(OCR),可能你在將紙上的文字掃描進(jìn)入電腦并直接形成可編輯的電子文檔時(shí)用過這種技術(shù)。對(duì)于完全由字母和數(shù)字組成的歐洲車牌來講,借助一種基于類似水域分割和圖論的思想配合成熟的字母數(shù)字OCR模塊可以簡單高效地自動(dòng)分割并識(shí)別字符。上述德國三個(gè)州發(fā)生的這種過高的錯(cuò)誤率應(yīng)該是由于部署了未經(jīng)針對(duì)性訓(xùn)練或者設(shè)置了不恰當(dāng)閾值參數(shù)的監(jiān)控設(shè)備所導(dǎo)致的。
OCR掃描筆可以快速將紙上文字錄入電腦
四通搬家保障
讓您放心搬家
爽約5倍賠
期詐3倍賠
亂收費(fèi)2倍賠