以馬可夫模型進行視訊分析與辨認
 
委託單位:國科會
日期:2004年8月至2005年7月

    數位視訊圖書館之重要瓶頸在於能自動加註內涵為主之索引,以利有效率而方便的檢索。為達此目的,視訊分析為重要的關鍵研究技術。視訊分析技術以視訊切割、關鍵畫面抽取群聚等最為普遍,近年來則開始有研究視訊內涵之高階語意分析,如事件偵測、視訊型態分類等。本計畫即擬針對電影視訊進行分類,以期抽取語意資訊提供作為視訊內涵之索引。由於電影視訊之內容豐富,運鏡手法複雜,因此其視訊之分析工作極具挑戰性。本計畫擬針對電影中最常出現之對話場景及動作場景進行分析與辨認。分析之方法分為兩個步驟:特徵抽取與模型辨認。特徵抽取將抽取顏色、移動等特徵。模型辨認將採取高斯混合Full-Ergodic隱藏式馬可夫模型,透過統計訓練建立兩個場景之馬可夫模型。本計畫預期透過隱藏式馬可夫模型的時間序列統計能力,可以成功辨認電影中的兩種重要場景,奠立電影語意分析之基礎應用研究。