您的位置:新文秘網(wǎng)>>教育/調研報告/畢業(yè)論文/>>正文

遠程教育中基于內容的視頻檢索研究

發(fā)表時間:2008/7/7 12:06:05


  遠程教育中基于內容的視頻檢索研究
  【摘要】視頻是遠程教育中的重要內容,由于視頻自身的特點,迫切需要基于內容對視頻檢索進行研究。本文首先提出視頻固有的特點,隨之基于內容對其分析,并介紹了國內外對視頻研究的現(xiàn)狀。
  【關鍵詞】視頻;基于內容;檢索
  一、遠程教育中基于內容視頻研究的必要性
  在遠程教育中數(shù)字視頻是多媒體教學信息系統(tǒng)中重要的數(shù)據(jù)類型,其特點是數(shù)據(jù)量大、信息量也大。如一幅24mm*36mm(即通常所說的35mm)的彩色照片,若以12um的間距進行掃描,則形成三副彩色數(shù)字圖像。每幅彩色圖像由3000*2000pi*el象素組成;如果每個象素用8bit數(shù)據(jù)量表示,那么三副數(shù)字圖像需用:3000*2000*8*3=144*106bit,而一幅圖像只相當于視頻中的一幀,假定播放速率為每秒25幀,
……(新文秘網(wǎng)http://jey722.cn省略578字,正式會員可完整閱讀)…… 
  視頻數(shù)據(jù)模型的特點是:每個視頻數(shù)據(jù)都是一個復雜的實體,關系不是存在于各視頻數(shù)據(jù)塊之間,而是存在于視頻數(shù)據(jù)塊內部。所以,首先要把視頻數(shù)據(jù)分解,分出結構和層次。然后分析結構中的各個對象,抽取各個對象的特征,并存儲這些屬性,使得用戶能夠根據(jù)視頻的內容來檢索。
  基于內容的視頻分析,是指根據(jù)特定的目的,從輸入視頻中提取關于內容的相關信息的一切處理過程。為了實現(xiàn)基于鏡頭內容的視頻檢索,視頻分析的基本過程包括鏡頭邊界的檢測、視頻數(shù)據(jù)的低層特征自動索引和視頻聚類。鏡頭邊界檢測通過視頻幀的比較,把視頻分割成基本的組成單元——鏡頭;視頻數(shù)據(jù)的自動索引包括關鍵幀的比較、靜止特征和運動特征的提取等;根據(jù)這些特征可以進行視頻聚類。
  視頻分析基本過程如下:
  三、國內外關于該課題的研究現(xiàn)狀
  1.切變檢測和鏡頭分割
  鏡頭是視頻的一種基本單元,它由時間上相連的一組幀圖像組成。鏡頭檢測是將視頻流切成一個個分離的鏡頭。這時需要確定鏡頭的時間邊界,或者說要檢測鏡頭的轉變或切換處。
  常見視頻節(jié)目中的鏡頭切換可分兩種:一種是直接切換,稱為切變;另一種是光學切換,是對應場景的逐漸變化,稱為漸變。
  檢測這兩種切換的一種策略是順序檢測它們:先檢切變,后檢漸變。輸入的視頻流是原始的視頻流或壓縮后的視頻流。對前者利用鄰域平均,對后者提取直流分量,都可得到待檢測的視頻流。鏡頭切換時,視頻數(shù)據(jù)將發(fā)生一系列的變化,表現(xiàn)在顏色差異突然增大、新舊邊緣的遠離、對象形狀的改變和運動的不連續(xù)性等各方面。鏡頭邊界檢測的目的就是尋找這些變化的規(guī)律。一般而言,同一個鏡頭內的各幀之間差異較小,而不同鏡頭的幀間差異較大。
  2.關鍵幀提取
  鏡頭的關鍵幀就是反映該鏡頭中主要信息內容的幀圖像。將各鏡頭檢測出來后,對每個鏡頭可提取關鍵幀,并用關鍵幀簡潔地表達鏡頭。這是因為每個鏡頭都是在同一個場景下拍攝的,同一個鏡頭中的各幀圖像有相當?shù)闹貜托畔ⅲP鍵幀就是反映該鏡頭中主要信息內容的幀圖像,一般一個鏡頭要用所提取出的一個或若干個幀圖像來表示。另外,用關鍵幀表示鏡頭使得可用基于圖像的技術對視頻鏡頭進行檢索。
  3.比較著名的圖像/視頻檢索系統(tǒng)
  qbic:是ibm研制的商用圖像檢索系統(tǒng),它支持:基于樣本圖像的查詢、用戶構畫草圖、用戶繪制圖形、用戶選擇希望的紋理和顏色。
  virage:是virageinc公司開發(fā)的基于內容圖形搜索引擎,類似于qbic,virage支持基于顏色、顏色布局、紋理、結構等視覺信息的檢索,支持上述幾種原子查詢的組合查詢,用戶能根據(jù)自己的意愿調整某個查詢權重。
  photobook:mit媒體實驗室研制的一組交互瀏覽和檢索工具,它實現(xiàn)形狀、紋理和人臉特征的提取和檢索。
  visualseek和webseek:visualseek是視覺特征搜索引擎,webseek是面向web的文本/圖像搜索引擎,由columbia大學研制。
  netra:ucsb為ale* ……(未完,全文共2553字,當前僅顯示1623字,請閱讀下面提示信息。收藏《遠程教育中基于內容的視頻檢索研究》
文章搜索