題目: 數(shù)字圖像處理系統(tǒng)設(shè)計-KLT\DCT變換壓縮
院(系) 信息科學(xué)與工程學(xué)院
專 業(yè) 通信工程
屆 別 2012屆
摘 要
隨著科學(xué)技術(shù)的發(fā)展,圖像壓縮技術(shù)越來越引起人們的關(guān)注,文章在研究近年來圖像壓縮一般方法的基礎(chǔ)上,介紹了基于DCT變換的圖像壓縮的基本原理及其實現(xiàn)步驟,適當(dāng)擴展研究KL變換的圖像壓縮方法,并使用MATLAB,針對同一幅原始圖像進行不同方法的壓縮比較,給出了實驗仿真結(jié)果。
本
論文首先說明了圖像壓縮在現(xiàn)代通信中的必要性和可行性以及介紹了Matlab的基本功能,提出了用Matlab來實現(xiàn)DCT變換的數(shù)字圖像壓縮技術(shù), 方法簡單,快速, 且誤差小。 然后重點介紹了圖像壓縮編碼的具體過程和方法。最后分析了圖像經(jīng)過2種壓縮方法時,圖像質(zhì)量的變化情況。
關(guān)鍵詞:圖像壓縮技術(shù);DCT/KL變換;MATLAB
ABSTRACT
With the development of science and technology,image compression technology has drawn increasing attention,this thesis based on the research of the general image compression method in recent years, introduces the basic principle based on the DCT transform image compression and implementation steps,e*pands the research of KL transform image compression method appropriately,and use MATLAB to compare with the original image through different image compression method for the e*perimental simulation results.
First,this paper e*plains the necessary of image compression technology in the modern and introduces the basic function of MATLAB.It put forward using MATLAB to achieve the digital image compression technology of DCT transform.Th
……(新文秘網(wǎng)http://jey722.cn省略1864字,正式會員可完整閱讀)……
。1966年J.B.O Neal對比分析了DPCM和PCM并提出了用于電視的實驗數(shù)據(jù)。1969年進行了線性預(yù)測編碼的實際實驗。1969年舉行首屆圖像編碼會議。70年代開始進行了幀間預(yù)測編碼的研究。80年代開始對運動估值和模型編碼進行研究。
進入90年代,ITU-T和ISO制定了一系列圖像編碼國際建議,如H.261、JPEG、MPEG-1、H.262、H.263、MPEG-4等。
變換編碼是1968年H.C.Andrews等人提出的,采用的是二維離散傅立葉變換,此后相繼出現(xiàn)用其他變換方法的變換編碼,其中包括二維離散余弦變換。
經(jīng)過幾十年的發(fā)展,圖像編碼技術(shù)業(yè)已成熟,一些國際建議的制定極大地推動了圖像編碼技術(shù)的實現(xiàn)和產(chǎn)業(yè)化,從而推動圖像編碼技術(shù)以更快的速度發(fā)展,目前的研究方向有兩個:
(A)更好地實現(xiàn)現(xiàn)有的圖像編碼國際建議。研制出集成度更高、性能更好的圖像編碼專用芯片,使編碼系統(tǒng)成本更低、可靠性更高。解決好現(xiàn)有的圖像編碼系統(tǒng)開發(fā)中的技術(shù)問題。例如:提高圖像質(zhì)量、提高抗碼能力等。
(B)對圖像編碼理論和其他圖像編碼方法的研究。目前已經(jīng)提出和正在進行研究的圖像編碼方法有:多分辨率編碼、基于表面描述的編碼、模型編碼、利用人工神經(jīng)網(wǎng)絡(luò)的編碼、利用分形幾何的編碼、利用數(shù)學(xué)形態(tài)學(xué)的編碼等等。
1.3 MATLAB簡介及其功能
如果應(yīng)用高級語言(如Basic,C,F(xiàn)ortran)編寫仿真程序來實現(xiàn)這一基于DCT的圖像壓縮編碼算法比較麻煩,而且仿真效果也不是十分理想。本文主要應(yīng)用MATLAB發(fā)布的圖像處理工具箱中的相關(guān)函數(shù)和命令來實基于DCT的圖像壓縮編碼理論算法的仿真。
MATLAB語言是由美國MathWorks公司推出的計算機軟件,經(jīng)過多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國際公認(rèn)的最優(yōu)秀的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件之一,它集數(shù)值分析、矩陣運算、信號處理和圖形顯示于一體,構(gòu)成了一個方便的、界面友好的用戶環(huán)境,而且還具有可擴展性特征。MATLAB中的數(shù)字圖像是以矩陣形式表示的,矩陣運算的語法對MATLAB中的數(shù)字圖像同樣適用,這意味著MATLAB強大的矩陣運算能力對用于圖像處理非常有利。其特點是語法結(jié)構(gòu)簡單, 數(shù)值計算高效,圖形功能完備。Matlab之所以成為世界頂尖的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件, 是因為它隨著版本的升級與不斷完善而具有愈來愈強大的功能:
(1)數(shù)值計算功能 Matlab出色的數(shù)值計算功能是使之優(yōu)于其他數(shù)學(xué)應(yīng)用軟件的決定性因素。
(2)符號計算功能 在數(shù)學(xué)科學(xué)、應(yīng)用科學(xué)和工程計算領(lǐng)域,常常會遇到符號計算問題。1993年,MathWorks公司以Maple的“內(nèi)核”作為符號計算功能的“引擎”, 依靠Maple已有的庫函數(shù),開發(fā)出了在Matlab環(huán)境下實現(xiàn)符號計算功能的系統(tǒng)組件。
(3)數(shù)據(jù)分析功能 在科學(xué)計算和工程應(yīng)用中,大量的原始數(shù)據(jù)和數(shù)值計算結(jié)果需要進行分析,Matlab將這些數(shù)據(jù)以圖形的方式顯示出來,不僅使數(shù)據(jù)間的關(guān)系清晰明了,而且對于揭示其內(nèi)在本質(zhì)往往有著非常重要的作用。
(4)動態(tài)仿真功能 Matlab提供了一個模擬動態(tài)系統(tǒng)的交互式程序SIMULINK,允許用戶在屏幕上繪制框圖來模擬一個系統(tǒng),并能動態(tài)地控制該系統(tǒng)。SIMULINK采用鼠標(biāo)驅(qū)動方式,能處理線性、非線性、連續(xù)、離散等多種系統(tǒng)。
(5)程序接口功能 Matlab提供了方便的應(yīng)用程序接口,用戶可以在Matlab環(huán)境下直接調(diào)用已經(jīng)編譯過的C和Fortran子程序,可以在Matlab和其他應(yīng)用程序之間建立客戶服務(wù)器關(guān)系。同樣,在C和Fortran程序中,也可以調(diào)用Matlab的函數(shù)或命令,使得這些語言可以充分利用Matlab強大矩陣運算功能和方便的繪圖功能。
(6)文字處理功能 Matlab Notebook能成功地將Matlab與文字處理系統(tǒng)Micro soft Word集成一個整體,為用戶進行科學(xué)計算、工程設(shè)計和文字處理等營造了一個完美統(tǒng)一的工作環(huán)境。
1.4 DCT變換
DCT變換利用傅立葉變換的性質(zhì)。采用圖像邊界褶翻將像變換為偶函數(shù)形式,然后對圖像進行二維傅立葉變換,變換后僅包含余弦項,所以稱之為離散余弦變換。
DCT編碼屬于正交變換編碼方式,用于去除圖像數(shù)據(jù)的空間冗余。變換編碼就是將圖像光強矩陣(時域信號)變換到系數(shù)空間(頻域信號)上進行處理的方法。在空間上具有強相關(guān)的信號,反映在頻域上是在某些特定的區(qū)域內(nèi)能量常常被集中在一起,或者是系數(shù)矩陣的分布具有某些規(guī)律。我們可以利用這些規(guī)律在頻域上減少量化比特數(shù),達(dá)到壓縮的目的。圖像經(jīng)DCT變換以后,DCT系數(shù)之間的相關(guān)性就會變小。而且大部分能量集中在少數(shù)的系數(shù)上,因此,DCT變換在圖像壓縮中非常有用,是有損圖像壓縮國際標(biāo)準(zhǔn)JPEG的核心。從原理上講可以對整幅圖像進行DCT變換,但由于圖像各部位上細(xì)節(jié)的豐富程度不同,這種整體處理的方式效果不好。為此,發(fā)送者首先將輸入圖像分解為8*8或16*16塊,然后再對每個圖像塊進行二維DCT變換,接著再對DCT系數(shù)進行量化、編碼和傳輸;接收者通過對量化的DCT系數(shù)進行解碼,并對每個圖像塊進行的二維DCT反變換。最后將操作完成后所有的塊拼接起來構(gòu)成一幅單一的圖像。對于一般的圖像而言,大多數(shù)DCT系數(shù)值都接近于0,所以去掉這些系數(shù)不會對重建圖像的質(zhì)量產(chǎn)生較大影響。因此,利用DCT進行圖像壓縮確實可以節(jié)約大量的存儲空間。
1.5 KL變換
KL變換又稱Hotelling變換,特征向量變換或主分量方法。KL變換是遙感圖像增強和信息提取中用得最多的線性變換,是對原波段圖像進行波譜信息的線性投影變換,在盡可能不減少信息量的前提下,將原圖像的高維多光譜空間的像元亮度值投影到新的低維空間,減少特征空間維數(shù),達(dá)到數(shù)據(jù)壓縮、提高信噪比、提取相關(guān)信息、降維處理和提取原圖像特征信息的目的,并能有效地提取影像信息。它可使原來多波段圖像經(jīng)變換后提供出一組不相關(guān)的圖像變量,最前面的主分量具有較大的方差,包含了原始影像的主要信息,所以要集中表達(dá)信息,突出圖像的某些細(xì)部特征,可采用主分量變換來完成。KL變換是圖像壓縮中的一種最優(yōu)正交變換。人們將它用于統(tǒng)計特征提取,從而形成了子空間法模式識別的基礎(chǔ)。
第二章 圖像壓縮算法基礎(chǔ)
2.1 DCT變換思想的來源
信號的變換分析方法中,通常是通過一組適當(dāng)?shù)幕瘮?shù)對信號進行分解,得到信號在變換域的表示方法,利用信號在變換域中某些特征趨于集中的特點來提取其特征從而進行分析。自1822年傅立葉(Fourier)發(fā)表“熱傳導(dǎo)解析理論”以來,傅立葉變換一直是信號處理領(lǐng)域中應(yīng)用最廣泛、效果最好的一種分析手段。但傅立葉變換只是一種純頻域的分析方法,它在頻域的定位性是完全準(zhǔn)確的(即頻域分辨率最高),而在時域無任何定位性(或分辯能力),也即傅立葉變換所反映的是整個信號全部時間下的整體頻域特征,而不能提供任何局部時間段上的頻率信息。事實上,在我們生活中的常見信號通常都具有非平穩(wěn)的性質(zhì),即其頻域性質(zhì)都是隨時間而變化的。對這一類信號用傅立葉變換進行分析,雖然可以知道信號所包含有哪些頻率信息,但不能知道這些頻率信息具體出現(xiàn)在哪個時間段上,因此不能提供關(guān)于信號完整的信息?梢姡盗⑷~變換不適用于提取局部時間段(或瞬間)的頻域特征信息。
為了研究信號在局部時間范圍的頻域特征,1946年Gabor提出了著名的Gabor變換。其基本思想是,取時間函數(shù) 作為窗口函數(shù),用 與待分析函數(shù) 相乘,然后再進行傅立葉變換。在Gabor變換的基礎(chǔ)上,為了適應(yīng)不同問題的需要,進一步發(fā)展了多種形式的窗口函數(shù),如矩形窗、漢寧窗、哈明窗等,這一類加窗的傅立葉變換統(tǒng)稱為短時傅立葉變換(STFT)。STFT從本質(zhì)上講,是用窗函數(shù)截取原始信號的一個待分析段進行傅立葉變換,因而可以描述信號在某一局部時間段上的頻率信息。目前,STFT在許多領(lǐng)域獲得了廣泛的應(yīng)用,但由于STFT的定義決定了其窗函數(shù)的大小和形狀均與時間和頻率無關(guān),一旦選定窗口就保持固定不變,不利于分析時變信號。實際上一般的高頻信號持續(xù)時間較短,而低頻信號持續(xù)時間較長,因此我們期望對于高頻信號采用小時間窗,對于低頻信號采用大時間窗進行分析。在進行信號分析時,這種變時間窗的要求同STFT的固定時窗(窗不隨頻率而變化)的特性是相矛盾的。
離散余弦變換(DCT)從本質(zhì)上是一種變換分析方法,要在變換時最大的去除分析信號的相關(guān)性提取其特征,就必須適當(dāng)?shù)臉?gòu)造一組基函數(shù),這組基函數(shù)以某種形式類似于我們所要表示的數(shù)據(jù),甚至具有與數(shù)據(jù)相同的相關(guān)結(jié)構(gòu)。在我們?nèi)粘I钪谐S龅降男盘栐诳臻g域和頻域都具有相關(guān)性。在空間上相隔較近的樣值間的相關(guān)性比相隔較遠(yuǎn)的大的多,而在頻域上通常呈帶狀。為了分析和表示這樣的信號,我們需要基函數(shù)在空間域和頻域是局域性的。由于離散余弦函數(shù)的頻域分辨率與時域分辨率成反比,剛好與實際信號長時低頻、短時高頻的特性相吻合,既能精確定位信號的突發(fā)跳變,又能把握信號的整體變化率。由此可見,離散余弦變換是一種比較理想的進行信號處理的數(shù)學(xué)工具。
圖像壓縮編碼的理論算法。
基于DCT的JPEG圖像壓縮編碼理論算法,基于DCT編碼的JPEG編碼壓縮過程框圖,如圖所示
基于DCT編碼的圖像壓縮過程簡化圖
上圖是基于DCT變換的圖像壓縮編碼的壓縮過程,解壓縮與上圖的過程相反。
在編碼過程中,首先將輸入圖像顏色空間轉(zhuǎn)換后分解為8*8大小的數(shù)據(jù)塊,然后用正向二維DCT把每個塊轉(zhuǎn)變成64個DCT系數(shù)值,其中1個數(shù)值是直流(DC)系數(shù),即8*8空域圖像子塊的平均值,其余的63個是交流(AC)系數(shù),接下來對DCT系數(shù)進行量化,最后將變換得到的量化的DCT系數(shù)進行編碼和傳送,這樣就完成了圖像的壓縮過程。
在解碼過程中,形成 ……(未完,全文共29112字,當(dāng)前僅顯示5236字,請閱讀下面提示信息。
收藏《畢業(yè)論文:數(shù)字圖像處理系統(tǒng)設(shè)計-KLT\DCT變換壓縮》)