ISL-R09203 [影片中移動文字之偵測]
文件 說明 下載點
ISL-R09203 [影片中移動文字之偵測] 一般來說,文字在影片檢索的應用中佔著非常重要的地位。因此,文字的偵測與擷取成為多媒體互動應用中一項重要的前置工作。但是,複雜背景與移動的影像對於文字的偵測會造成極大的挑戰。此外,影片中文字有所謂的"靜止文字"與"移動文字"。移動文字的內容有著比靜止文字來的更重要的涵義,也較吸引觀眾的目光。在此,我們提出一套方法,來偵測、擷取"移動文字",並且把因複雜背景或影片中的移動物體所造成的誤判情形降低。針對時間軸與空間軸,使用不同維度的小波轉換當作是邊緣偵測,將得出來的係數先做調適當整過後,選擇適合頻帶並將其影像予以強化。緊接著將影像二值化、過濾雜點,再利用形態學來將文字區塊擷取出。其後文字區塊的修正,能將文字區塊框的更靠近文字,並且減少失誤掉的文字區塊。 立即下載