我們在實際應用中對圖像進行的操作,往往並不是將圖像作為一個整體進行操作,而是對圖像中的所有點或特殊點進行運算,所以遍歷圖像就顯得很重要,如何高效的遍歷圖像是一個很值得探討的問題。
Mat類提供了一個at的方法用於取得圖像上的點,它是一個模板函數,可以取到任何類型的圖像上的點。下面我們通過一個圖像處理中的實際來說明它的用法。
在實際應用中,我們很多時候需要對圖像降色彩,因為256*256*256實在太多了,在圖像顏色聚類或彩色直方圖時,我們需要用一些代表性的顏色代替豐富的色彩空間,我們的思路是將每個通道的256種顏色用64種代替,即將原來256種顏色劃分64個顏色段,每個顏色段取中間的顏色值作為代表色。
1 2 3 4 5 6 7 8 9 10 11 12void
colorReduce(Mat& image,
int
div
)
{
for
(
int
i=0;i<image.rows;i++)
{
for
(
int
j=0;j<image.cols;j++)
{
image.at<Vec3b>(i,j)[0]=image.at<Vec3b>(i,j)[0]/
div
*
div
+
div
/2;
image.at<Vec3b>(i,j)[1]=image.at<Vec3b>(i,j)[1]/
div
*
div
+
div
/2;
image.at<Vec3b>(i,j)[2]=image.at<Vec3b>(i,j)[2]/
div
*
div
+
div
/2;
}
}
}
通過上面的例子我們可以看出,at方法取圖像中的點的用法:
image.at<uchar>(i,j):取出灰度圖像中i行j列的點。
image.at<Vec3b>(i,j)[k]:取出彩色圖像中i行j列第k通道的顏色點。其中uchar,Vec3b都是圖像像素值的類型,不要對Vec3b這種類型感覺害怕,其實在core裡它是通過typedef Vec<T,N>來定義的,N代表元素的個數,T代表類型。
更簡單一些的方法:OpenCV定義了一個Mat的模板子類為Mat_,它重載了operator()讓我們可以更方便的取圖像上的點。
Mat_<uchar> im=image;
im(i,j)=im(i,j)/div*div+div/2;
上面的例程中可以看到,我們實際喜歡把原圖傳進函數內,但是在函數內我們對原圖像進行了修改,而將原圖作為一個結果輸出,很多時候我們需要保留原圖,這樣我們需要一個原圖的副本。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18void
colorReduce(
const
Mat& image,Mat& outImage,
int
div
)
{
// 創建與原圖像等尺寸的圖像
outImage.create(image.size(),image.type());
int
nr=image.rows;
// 將3通道轉換為1通道
int
nl=image.cols*image.channels();
for
(
int
k=0;k<nr;k++)
{
// 每一行圖像的指針
const
uchar* inData=image.ptr<uchar>(k);
uchar* outData=outImage.ptr<uchar>(k);
for
(
int
i=0;i<nl;i++)
{
outData[i]=inData[i]/
div
*
div
+
div
/2;
}
}
}
從上面的例子中可以看出,取出圖像中第i行數據的指針:image.ptr<uchar>(i)。
值得說明的是:程序中將三通道的數據轉換為1通道,在建立在每一行數據元素之間在內存裡是連續存儲的,每個像素三通道像素按順序存儲。也就是一幅圖像數據最開始的三個值,是最左上角的那像素的三個通道的值。
但是這種用法不能用在行與行之間,因為圖像在OpenCV裡的存儲機制問題,行與行之間可能有空白單元。這些空白單元對圖像來說是沒有意思的,只是為了在某些架構上能夠更有效率,比如intel MMX可以更有效的處理那種個數是4或8倍數的行。但是我們可以申明一個連續的空間來存儲圖像,這個話題引入下面最為高效的遍歷圖像的機制。
上面已經提到過了,一般來說圖像行與行之間往往存儲是不連續的,但是有些圖像可以是連續的,Mat提供了一個檢測圖像是否連續的函數isContinuous()。當圖像連通時,我們就可以把圖像完全展開,看成是一行。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20void
colorReduce(
const
Mat& image,Mat& outImage,
int
div
)
{
int
nr=image.rows;
int
nc=image.cols;
outImage.create(image.size(),image.type());
if
(image.isContinuous()&&outImage.isContinuous())
{
nr=1;
nc=nc*image.rows*image.channels();
}
for
(
int
i=0;i<nr;i++)
{
const
uchar* inData=image.ptr<uchar>(i);
uchar* outData=outImage.ptr<uchar>(i);
for
(
int
j=0;j<nc;j++)
{
*outData++=*inData++/
div
*
div
+
div
/2;
}
}
}
用指針除了用上面的方法外,還可以用指針來索引固定位置的像素:
image.step返回圖像一行像素元素的個數(包括空白元素),image.elemSize()返回一個圖像像素的大小。
&image.at<uchar>(i,j)=image.data+i*image.step+j*image.elemSize();
下面的方法可以讓我們來為圖像中的像素聲明一個迭代器:
MatIterator_<Vec3b> it;
Mat_<Vec3b>::iterator it;
如果迭代器指向一個const圖像,則可以用下面的聲明:
MatConstIterator<Vec3b> it; 或者
Mat_<Vec3b>::const_iterator it;
下面我們用迭代器來簡化上面的colorReduce程序:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
void
colorReduce(
const
Mat& image,Mat& outImage,
int
div
)
{
outImage.create(image.size(),image.type());
MatConstIterator_<Vec3b> it_in=image.begin<Vec3b>();
MatConstIterator_<Vec3b> itend_in=image.end<Vec3b>();
MatIterator_<Vec3b> it_out=outImage.begin<Vec3b>();
MatIterator_<Vec3b> itend_out=outImage.end<Vec3b>();
while
(it_in!=itend_in)
{
(*it_out)[0]=(*it_in)[0]/
div
*
div
+
div
/2;
(*it_out)[1]=(*it_in)[1]/
div
*
div
+
div
/2;
(*it_out)[2]=(*it_in)[2]/
div
*
div
+
div
/2;
it_in++;
it_out++;
}
}
如果你想從第二行開始,則可以從image.begin<Vec3b>()+image.rows開始。
上面4種方法中,第3種方法的效率最高!
很多時候,我們對圖像處理時,要考慮它的鄰域,比如3*3是我們常用的,這在圖像濾波、去噪中最為常見,下面我們介紹如果在一次圖像遍歷過程中進行鄰域的運算。
下面我們進行一個簡單的濾波操作,濾波算子為[0 –1 0;-1 5 –1;0 –1 0]。
它可以讓圖像變得尖銳,而邊緣更加突出。核心公式即:sharp(i.j)=5*image(i,j)-image(i-1,j)-image(i+1,j
)-image(i,j-1)-image(i,j+1)。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23void
ImgFilter2d(
const
Mat &image,Mat& result)
{
result.create(image.size(),image.type());
int
nr=image.rows;
int
nc=image.cols*image.channels();
for
(
int
i=1;i<nr-1;i++)
{
const
uchar* up_line=image.ptr<uchar>(i-1);
//指向上一行
const
uchar* mid_line=image.ptr<uchar>(i);
//當前行
const
uchar* down_line=image.ptr<uchar>(i+1);
//下一行
uchar* cur_line=result.ptr<uchar>(i);
for
(
int
j=1;j<nc-1;j++)
{
cur_line[j]=saturate_cast<uchar>(5*mid_line[j]-mid_line[j-1]-mid_line[j+1]-
up_line[j]-down_line[j]);
}
}
// 把圖像邊緣像素設置為0
result.row(0).setTo(Scalar(0));
result.row(result.rows-1).setTo(Scalar(0));
result.col(0).setTo(Scalar(0));
result.col(result.cols-1).setTo(Scalar(0));
}
上面的程序有以下幾點需要說明:
1,staturate_cast<typename>是一個類型轉換函數,程序裡是為了確保運算結果還在uchar范圍內。
2,row和col方法返回圖像中的某些行或列,返回值是一個Mat。
3,setTo方法將Mat對像中的點設置為一個值,Scalar(n)為一個灰度值,Scalar(a,b,c)為一個彩色值。
Mat類把很多算數操作符都進行了重載,讓它們來符合矩陣的一些運算,如果+、-、點乘等。
下面我們來看看用位操作和基本算術運算來完成本文中的colorReduce程序,它更簡單,更高效。
將256種灰度階降到64位其實是拋棄了二進制最後面的4位,所以我們可以用位操作來做這一步處理。
首先我們計算2^8降到2^n中的n:int n=static_cast<int>(log(static_cast<double>(div))/log(2.0));
然後可以得到mask,mask=0xFF<<n;
用下面簡直的語句就可以得到我們想要的結果:
result=(image&Scalar(mask,mask,mask))+Scalar(div/2,div/2,div/2);
很多時候我們需要對圖像的一個通信單獨進行操作,比如在HSV色彩模式下,我們就經常把3個通道分開考慮。
1 2 3 4 5 6vector<Mat> planes;
// 將image分為三個通道圖像存儲在planes中
split(image,planes);
planes[0]+=image2;
// 將planes中三幅圖像合為一個三通道圖像
merge(planes,result);