局部線性嵌入在視頻鏡頭變換檢測(cè)的應(yīng)用
出處:李家兵 發(fā)布于:2011-08-26 22:15:24
隨著日益豐富的視頻數(shù)據(jù)的出現(xiàn),人們迫切期望能在大量視頻數(shù)據(jù)中方便、快速地檢索到自己感興趣的視頻段。而要實(shí)現(xiàn)視頻檢索,通常是先將視頻分割成獨(dú)立的視頻鏡頭。鏡頭是指一個(gè)攝像機(jī)鏡頭連續(xù)拍攝的一組內(nèi)在相關(guān)的連續(xù)幀,用來(lái)表現(xiàn)在時(shí)空上連續(xù)的一組運(yùn)動(dòng),是視頻檢索的基本單元。鏡頭之間的變換通常分為切變(Cut)和漸變(Gradual)兩大類(lèi),其中漸變鏡頭變換又可分為溶解(Dissolve)、掃換(Wipe)、淡入(Fade in)與淡出(Fade out)[1-3]等。檢測(cè)出不同類(lèi)型的鏡頭變換是對(duì)視頻高層內(nèi)容分析、分類(lèi)、檢索和其他應(yīng)用的基礎(chǔ),因此,對(duì)鏡頭類(lèi)型變換檢測(cè)準(zhǔn)確性的高低將直接影響到后續(xù)處理效果。
視頻鏡頭邊界檢測(cè)是視頻分段、組織、索引的首要步驟。本文在總結(jié)分析現(xiàn)有的鏡頭邊界檢測(cè)技術(shù)的基礎(chǔ)上,深入研究了突變鏡頭的檢測(cè)??偨Y(jié)了視頻鏡頭邊界檢測(cè)中的方法和評(píng)價(jià)準(zhǔn)則,并對(duì)各種方法進(jìn)行比較。對(duì)直方圖方法進(jìn)行了深入的探討,利用灰度直方圖計(jì)算出幀間不連續(xù)值的方法來(lái)檢測(cè)突變的方法,實(shí)驗(yàn)證明該方法可以準(zhǔn)確快速地定位鏡頭邊界。對(duì)漸變鏡頭檢測(cè)也作了相應(yīng)的分析,且介紹了邊緣檢測(cè)方法。鏡頭檢測(cè)是視頻分析的首要工作,綜述了當(dāng)前鏡頭邊界檢測(cè)的研究成果,并對(duì)其中具有代表性的方法進(jìn)行了分析比較。
由于視頻鏡頭變換的多樣性以及視頻幀高維性的特點(diǎn),很難從高維中尋找到它們內(nèi)在的特征,但通過(guò)選擇恰當(dāng)?shù)乃惴ㄔ诒3指呔S特征的情況下,把高維降到低維,然后通過(guò)分析低維中的數(shù)據(jù),得出高維視頻變換的特征數(shù)據(jù)。根據(jù)流形學(xué)習(xí)的特性和視頻數(shù)據(jù)的特點(diǎn),把視頻表示成一幅幅圖像隨著時(shí)間變化而變化的一個(gè)高維空間,圖像之間在時(shí)間軸上是局部相關(guān)的,圖像之間呈現(xiàn)出特有的分布,把這種分布,看成是一個(gè)低維的流形嵌入到高維空間中進(jìn)行處理。
1 基于局部線性嵌入(LLE)的視頻鏡頭變換學(xué)習(xí)
局部線性嵌入LLE(Locally Liner Embedding)[6]是流形學(xué)習(xí)中的一種。流形學(xué)習(xí)是從觀測(cè)到的現(xiàn)象中尋找事物的本質(zhì),找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。本文用它來(lái)提取鏡頭之間的特征,以期得到對(duì)各種鏡頭分類(lèi)的效果。
1.1 基于LLE特征提取
LLE算法操作簡(jiǎn)單,且算法中的優(yōu)化不涉及到局部化。該算法能解決非線性映射,但是,當(dāng)處理數(shù)據(jù)的維數(shù)過(guò)大,數(shù)量過(guò)多,涉及到的稀疏矩陣過(guò)大,不易于處理。在圖1中的球形面中,當(dāng)缺少北極面時(shí),應(yīng)用LLE算法則能很好的將其映射到二維空間中,如圖1中的C所示。如果數(shù)據(jù)分布在整個(gè)封閉的球面上,LLE則不能將它映射到二維空間,且不能保持原有的數(shù)據(jù)流形。那么我們?cè)谔幚頂?shù)據(jù)中,首先假設(shè)數(shù)據(jù)不是分布在閉合的球面或者橢球面上。 LLE算法是近提出的針對(duì)非線性數(shù)據(jù)的一種新的降維方法,處理后的低維數(shù)據(jù)均能夠保持原有的拓?fù)潢P(guān)系。它已經(jīng)廣泛應(yīng)用于圖像數(shù)據(jù)的分類(lèi)與聚類(lèi)、文字識(shí)別、多維數(shù)據(jù)的可視化、以及生物信息學(xué)等領(lǐng)域中。
LLE算法是從流形的局部入手,一個(gè)局部鄰域上的流形可以近似看成是具有線性特征,在這個(gè)小的局部鄰域上的一個(gè)點(diǎn)就可以用它的相鄰點(diǎn)在二乘意義下的線性表示,通過(guò)連接的鄰域就可以從局部逐步擴(kuò)展到整體,處理過(guò)程如下。
給定視頻Video,把視頻看成是由幀序列{f1,f2,…,fn}構(gòu)成的。
?。?)將視頻幀序列fi(i=1,…,n)轉(zhuǎn)化為M×N(M、N為視頻的行數(shù)、列數(shù))的一維向量Fi,轉(zhuǎn)換后視頻幀變成n個(gè)f向量;
?。?)用LLE算法提取鏡頭變換特征。
保存原流形中局部鄰域間的相互關(guān)系,將高維數(shù)據(jù)映射到一維全局坐標(biāo)系中,具體算法如下:
步驟1:鄰域點(diǎn)搜索。計(jì)算出每個(gè)向量Fi的鄰域點(diǎn),通常取歐式距離的K個(gè)點(diǎn)為鄰域或者固定半徑ε的球狀鄰域。
步驟2:求重構(gòu)誤差。在Fi的鄰域中,計(jì)算能重構(gòu)每個(gè)Fi的權(quán)值Wij,使重構(gòu)誤差,即式(1)的值。

?。?)特征提取
根據(jù)上面算法的步驟,把視頻中得到的n個(gè)f向量數(shù)據(jù)作為數(shù)據(jù)源,用到LLE算法中,經(jīng)過(guò)局部嵌入學(xué)習(xí),求出一維向量Y,根據(jù)Y向量的值畫(huà)出如圖1所示的特征圖。

因LLE對(duì)K值敏感,不同的K值,即使特征值不同也有可能得到相同的特征曲線,圖1中算法的K值都取固定值15.對(duì)于2個(gè)鏡頭之間是切變變換,兩鏡頭變換處的2幀之間形成一個(gè)突然上升或下降的級(jí)躍,如圖1(a)所示;對(duì)于溶解型鏡頭變換,特征曲線表現(xiàn)為一個(gè)向下或向上的的光滑曲線,如圖1(b)所示;對(duì)于掃換型鏡頭變換,特征曲線表現(xiàn)為一個(gè)不光滑的鋸齒型曲線,如圖1(c)所示;對(duì)于淡入淡出型鏡頭變換,特征曲線成一個(gè)"n"形或類(lèi)似于"n"形曲線,如圖1(d)所示。
為了便于特征的提取并能正確地反映鏡頭變化的過(guò)程,在提取特征時(shí)需選擇合適的點(diǎn)數(shù)(即幀數(shù)),本文選擇21個(gè)數(shù)據(jù)點(diǎn)作為鏡頭之間變換的過(guò)程進(jìn)行實(shí)驗(yàn)。如果鏡頭變換過(guò)程中幀的數(shù)目多于21幀,則要對(duì)其進(jìn)行抽樣,采用等間距地抽取數(shù)據(jù)點(diǎn),如淡入淡出鏡頭變換特征曲線,變換過(guò)程中共有71幀,如圖2中的帶星號(hào)線所示,經(jīng)過(guò)抽樣等距點(diǎn)后,變換成圖2中左邊的無(wú)星號(hào)的特征曲線,仍然保持原來(lái)漸變過(guò)程變換的特征。

1.2 K近鄰視頻鏡頭學(xué)習(xí)
有了一維流形Y向量的數(shù)據(jù),得到了視頻幀序列的一維線性曲線。根據(jù)線性曲線的特點(diǎn),用K近鄰法對(duì)視頻序列進(jìn)行學(xué)習(xí),找出鏡頭變換的類(lèi)型。算法的流程如圖3所示。

?。?)預(yù)處理鏡頭類(lèi)型檢測(cè);
?。?)將步驟(1)中處理的數(shù)據(jù)分為兩部分,一部分作為學(xué)習(xí)集,另一部分作為測(cè)試集;
?。?)提取鏡頭類(lèi)型一維流形的特征,并根據(jù)預(yù)處理的鏡頭類(lèi)型作相應(yīng)類(lèi)型標(biāo)簽;
?。?)通過(guò)K近鄰分類(lèi)器測(cè)試測(cè)試集中鏡頭類(lèi)型,并分出相應(yīng)類(lèi)別的識(shí)別率。
2 實(shí)驗(yàn)與分析
2.1 選擇數(shù)據(jù)源
為了驗(yàn)證本文所述方法的有效性,在開(kāi)放式視頻庫(kù)(www.open-video.org)中幾段視頻,各段視頻幀數(shù)、鏡頭類(lèi)型數(shù)和鏡頭數(shù)量如表1所示。

2.2 實(shí)驗(yàn)比較與分析
從表1中抽取每種鏡頭數(shù)各30個(gè),共120個(gè),然后從120個(gè)鏡頭變換中隨機(jī)抽取每種各20個(gè)作為學(xué)習(xí)數(shù)據(jù),剩下作為測(cè)試數(shù)據(jù)。用KNN分類(lèi)器進(jìn)行分類(lèi),驗(yàn)證上述方法的實(shí)驗(yàn)結(jié)果及其受K值的影響情況。取相應(yīng)的 K值,實(shí)驗(yàn)結(jié)果數(shù)據(jù)如表2所示,不同K值實(shí)驗(yàn)結(jié)果如圖4所示。


圖4縱坐標(biāo)數(shù)值表示鏡頭變換類(lèi)型的識(shí)別率,橫坐標(biāo)表示K近鄰分類(lèi)器的不同K值。當(dāng)K值為3時(shí),除溶解的識(shí)別率為90%外,其他三種變換類(lèi)型的識(shí)別率都達(dá)到了100%.從圖4中可以看出,漸變識(shí)別率隨著K值的增加而下降。這是因?yàn)樵谔崛∏€特征,因幀數(shù)過(guò)多,間隔提取幀值時(shí),造成漸變鏡頭特征曲線相互靠近,使?jié)u變鏡頭類(lèi)型特征曲線可能互串。從平均識(shí)別率看,在K值為3時(shí),識(shí)別可達(dá)97.5%;在K值為9時(shí),識(shí)別率為77.5%.
本文提出了一種基于流形學(xué)習(xí)和K近鄰分類(lèi)器相結(jié)合的鏡頭類(lèi)型檢測(cè)方法。通過(guò)流形學(xué)習(xí)獲得了視頻幀的原始特征,便于把高維變換到低維來(lái)分析、處理。
今后還要做的工作有:針對(duì)漸變或漸變中的一種采用流形實(shí)現(xiàn)鏡頭變換的檢測(cè);實(shí)現(xiàn)一個(gè)能自動(dòng)處理視頻鏡頭分割的系統(tǒng),為關(guān)鍵幀提取、視頻摘要做好堅(jiān)實(shí)的基礎(chǔ)。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫(kù)電子市場(chǎng)網(wǎng)”的所有作品,版權(quán)均屬于維庫(kù)電子市場(chǎng)網(wǎng),轉(zhuǎn)載請(qǐng)必須注明維庫(kù)電子市場(chǎng)網(wǎng),http://www.hbjingang.com,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- ARM技術(shù)架構(gòu)與應(yīng)用開(kāi)發(fā)實(shí)踐指南2026/1/6 10:40:19
- 嵌入式實(shí)時(shí)操作系統(tǒng)(RTOS)選型與移植技術(shù)指南2025/12/31 10:42:31
- 工業(yè)嵌入式系統(tǒng):通信接口技術(shù)選型與抗干擾設(shè)計(jì)實(shí)踐2025/12/15 14:36:53
- 深入解析嵌入式 OPENAMP 框架:開(kāi)啟異核通信新時(shí)代2025/7/22 16:27:29
- 一文快速了解OPENWRT基礎(chǔ)知識(shí)2025/7/14 16:59:04
- 編碼器的工作原理及作用1
- 超強(qiáng)整理!PCB設(shè)計(jì)之電流與線寬的關(guān)系2
- 三星(SAMSUNG)貼片電容規(guī)格對(duì)照表3
- 電腦藍(lán)屏代碼大全4
- 國(guó)標(biāo)委發(fā)布《電動(dòng)汽車(chē)安全要求第3部分:人員觸電防護(hù)》第1號(hào)修改單5
- 通俗易懂談上拉電阻與下拉電阻6
- 繼電器的工作原理以及驅(qū)動(dòng)電路7
- 電容單位8
- 跟我學(xué)51單片機(jī)(三):?jiǎn)纹瑱C(jī)串口通信實(shí)例9
- 一種三極管開(kāi)關(guān)電路設(shè)計(jì)10
- 高速PCB信號(hào)完整性(SI)設(shè)計(jì)核心實(shí)操規(guī)范
- 鎖相環(huán)(PLL)中的環(huán)路濾波器:參數(shù)計(jì)算與穩(wěn)定性分析
- MOSFET反向恢復(fù)特性對(duì)系統(tǒng)的影響
- 電源IC在惡劣環(huán)境中的防護(hù)設(shè)計(jì)
- 連接器耐腐蝕性能測(cè)試方法
- PCB電磁兼容(EMC)設(shè)計(jì)與干擾抑制核心實(shí)操規(guī)范
- 用于相位噪聲測(cè)量的低通濾波器設(shè)計(jì)與本振凈化技術(shù)
- MOSFET在高頻開(kāi)關(guān)中的EMI問(wèn)題
- 電源IC在便攜式設(shè)備中的設(shè)計(jì)要點(diǎn)
- 連接器結(jié)構(gòu)設(shè)計(jì)常見(jiàn)問(wèn)題分析









