春節(jié)期間搶火車票是一場(chǎng)大戰(zhàn)
程序員在這場(chǎng)戰(zhàn)斗中唯一的優(yōu)勢(shì)是整個(gè)程序取代了人工預(yù)訂流程。
感謝太極公司,雖然他們顯然沒(méi)有預(yù)料到全國(guó)人民搶票的熱情mac上的好的ocr軟件,但他們并沒(méi)有為我們模擬搶票設(shè)置任何障礙。
嗯,除了驗(yàn)證碼。 . .
在網(wǎng)上搜索了一下,有一個(gè)圖像識(shí)別領(lǐng)域著名的開(kāi)源軟件-OCR3.0.1。瀏覽過(guò)他的官網(wǎng),結(jié)構(gòu)還是不錯(cuò)的。支持多種語(yǔ)言包,包括中文。
項(xiàng)目地址:
評(píng)價(jià)一個(gè)開(kāi)源項(xiàng)目首先是看它是否能幫助我們解決問(wèn)題,找一個(gè)基于-OCR3.0.1的在線工具,看看效果
效果還不錯(cuò),他已經(jīng)準(zhǔn)確識(shí)別了驗(yàn)證碼。
總是有一些問(wèn)題,所以這里是一個(gè)流水賬。希望對(duì)其他人有所幫助
1、第一個(gè)下載必需的軟件包
OCR工具:-OCR3.0.1 code -ocr-3.01.eng.tar.gz英文足以破解驗(yàn)證碼。
圖像處理工具:.68
png識(shí)別工具:
jpeg識(shí)別工具:
tif識(shí)別工具:
圖像壓縮算法包:(macos已經(jīng)集成了這個(gè)包,不需要安裝)
2、安裝步驟
1- 安裝,,,
./configure make sudo make install
2-安裝
./configure make sudo make install
制作時(shí)發(fā)現(xiàn)錯(cuò)誤mac上的好的ocr軟件,提示
pngio.c:119: 錯(cuò)誤:此處為“N”(不在 a 中)
我搜索了wiki,發(fā)現(xiàn)pngio.c文件中有一個(gè)bug。在 mac 下找不到該包。修改/src/pngio.c,在#"png.h"后面插入代碼??梢浴?/p>
#ifdef HAVE_LIBZ #include "zlib.h" #endif
3-安裝-OCR
./autogen.sh ./configure make sudo make install
4- 安裝語(yǔ)言包
解壓 -ocr-3.01.eng.tar.gz 到 /usr/local/share/。
3、試試ocr
MacBook-Pro:work my$ tesseract pin.jpg out -l eng Tesseract Open Source OCR Engine v3.01 with Leptonica MacBook-Pro:work my$ more out.txt Bvcs
至此,已經(jīng)可以正常工作了。
我們來(lái)寫(xiě)一段代碼,通過(guò)命令行調(diào)用它來(lái)實(shí)現(xiàn)圖像識(shí)別。
本人提供的經(jīng)過(guò)訓(xùn)練的語(yǔ)言包不能保證100%識(shí)別驗(yàn)證碼圖片。這可以通過(guò)抓取一定數(shù)量的驗(yàn)證碼來(lái)完成
培訓(xùn),為了更準(zhǔn)確的識(shí)別,有官方文檔和工具怎么做
我以后也會(huì)整理一篇博文來(lái)解釋一下!