實(shí)現(xiàn)了sauvola算法,原論文去google一下就有了~
參數(shù)是:k, windowSize,自己調(diào)調(diào)看效果
void sauvola(unsigned char * grayImage,unsigned char * biImage,int w,int h,int k,int windowSize)
{
int whalf = windowSize >> 1;
int i,j;...
/***********************聚類操作*******************************/
//圖像進(jìn)行顏色聚類
//輸入:灰度圖像
//輸出:顏色聚類結(jié)果圖片、聚類標(biāo)簽矩陣
int color_cluster(IplImage * src,IplImage * dst,int * class_mat)
{
if(src == NULL || dst == NULL...
int calEdgeHistogram(IplImage *image,IplImage * dst,double * edge_hist_feature)
{
if(NULL == image || NULL == edge_hist_feature)
return 1;
CvHistogram *hist = 0; // 直方圖
IplImage* canny;//邊緣圖像
...
利用cvFindContours 函數(shù)計算圖像的輪廓,獲取...
結(jié)合這周看的論文,我對這周研究的Histogram of oriented gradients(HOG)談?wù)勛约旱睦斫猓?
HOG descriptors 是應(yīng)用在計算機(jī)視覺和圖像處理領(lǐng)域,用于目標(biāo)檢測的特征描述器。這項(xiàng)技術(shù)是用來計算局部圖像梯度的方向信息的統(tǒng)計值。這種方法跟邊緣方向直方圖(edge orientation histograms)、尺度不變特征變換(scale-invarian...
安裝Tesseract-OCR
準(zhǔn)備工作:
編譯環(huán)境: gcc gcc-c++ make(這個環(huán)境一般機(jī)器都具備,可以忽略)
1
yum install gcc gcc-c++ make
依賴的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67...
中文識別:清華文通TH-OCR XP(8.0);漢王文本王5800;尚書七號OCR。
英文識別:ABBYY FineReader70pro;Cuneiform pro v6;Scansoft OmniPage SE;Scansoft PaperPort v9.0。
中英文混合識別:清華文通TH-OCR XP(8.0);漢王文本王5800;尚書七號OCR。
中文識別:漢王文本王5800更...
腐蝕的算法:
用3x3的結(jié)構(gòu)元素,掃描圖像的每一個像素,用結(jié)構(gòu)元素與其覆蓋的二值圖像做“與”操作:如果都為1,結(jié)果圖像的該像素為1。否則為0。
結(jié)果:使二值圖像減小一圈
B}í S = { x,y | Sxy?定義:E = B
膨脹的算法:
用3x3的結(jié)構(gòu)元素,掃描圖像的每一個像素,用結(jié)構(gòu)元素與其覆蓋的二值圖像做“與”操作:如果都為0,結(jié)果圖像的該像素為0。否則為1
結(jié)果:使二...
tesseract 訓(xùn)練字庫先做兩個準(zhǔn)備工作
1.下載工具cowboxer
http://download.csdn.net/detail/cxf7394373/5305519
2. 下載tesseract-ocr.exe
https://code.google.com/p/tesseract-ocr/downloads/list
3. 安裝tessract-ocr
我直接安裝在了D:...
讀研的時候?qū)戇^一篇文本定位相關(guān)的論文,當(dāng)時有一個處理步驟是對斷裂的邊緣進(jìn)行連接,當(dāng)時的程序已經(jīng)不知道扔哪兒去了,最近又要用到這個程序,把論文翻出來,把程序?qū)懥艘槐?。這個邊緣連接的方法我也不知道叫什么名字,隨便寫寫吧。
對所有的端點(diǎn)(該點(diǎn)八臨域內(nèi)有且只有一個前景點(diǎn))查找其更外層的16個點(diǎn),若有前景點(diǎn),則將該端點(diǎn)和前景點(diǎn)之間的點(diǎn)也改為前景點(diǎn)(圖1)。邊緣連接的結(jié)果表明該方法能把相鄰的前景點(diǎn)連接起...
最近在看車牌識別相關(guān)領(lǐng)域的論文,自己也試驗(yàn)了一些開源的代碼,opencv自帶的找四邊形的程序等等,感覺效果都不好。在車牌識別中,關(guān)鍵的是車牌定位,決定了車牌識別的準(zhǔn)確率,目前研究比較多的也就是基于顏色、邊緣、紋理的車牌定位方法,看了幾篇論文,有一篇碩士論文叫《汽車牌照識別系統(tǒng)中車牌定位與校正及字符分割的研究》,南航的一位同學(xué)的碩士畢業(yè)論文,想實(shí)現(xiàn)其中的車牌定位算法??梢匀ゾW(wǎng)上搜索該論文,在道客巴巴...
經(jīng)常用opencv下的cvCvtColor函數(shù)直接把圖片顏色空間轉(zhuǎn)換到了HSV下,今天自己寫了一段代碼進(jìn)行轉(zhuǎn)化,RGB轉(zhuǎn)HSV的計算公式如下:
在這里把h規(guī)范化到位于 0 到 360°之間,s和v均規(guī)范化到0-1之間,和opencv的范圍不同。
IplImage * src;
int * h;
float * s;
float * v;
int width = src->w...
Tesseract-ocr的dll tesseract-3.02.02-win32-lib-include-dirs下載地址:
Google-Tesseract-OCR
解壓之后包括 include文件夾和Lib文件夾,配置頭文件和庫文件,建立工程進(jìn)行測試。
#include "baseapi.h"
#include "strngs.h"
#pragma comment...
最近在用opencv寫一個文本定位的程序,獲取到字符輪廓之后需要進(jìn)行合并,涉及到判斷矩形是否相交的問題,記得去年去三星通信研究院面試同樣問到了這個問題,如何判斷兩條線段是否相交,如何判斷兩個矩形是否相交。以前寫過一篇如何判斷線段相交的問題,上網(wǎng)查了一些方法,在這里做一下后一個問題的總結(jié):
方法一:假定矩形是用一對點(diǎn)表達(dá)的(minx,miny)(maxx, maxy) ,那么兩個矩形rect1...
|
|