Tải bản đầy đủ (.pdf) (79 trang)

Nghiên cứu một số kỹ thuật phân đoạn video ( Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (616.2 KB, 79 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
VÀ TRUYỀN THÔNG

NGUYỄN ĐÌNH TRUNG

NGHIÊN CỨU MỘT SỐ KỸ THUẬT
PHÂN ĐOẠN VIDEO

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên, 2014

Số hóa bởi Trung tâm Học liệu

/>

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
VÀ TRUYỀN THÔNG

NGUYỄN ĐÌNH TRUNG

NGHIÊN CỨU MỘT SỐ KỸ THUẬT
PHÂN ĐOẠN VIDEO
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. NGUYỄN THỊ HỒNG MINH



Đã chỉnh sửa theo ý kiến của hội đồng.
Thái Nguyên, 2014
Số hóa bởi Trung tâm Học liệu

/>

LỜI CAM ĐOAN
Tôi xin cam đoan Những nội dung trong luận văn “NGHIÊN CỨU MỘT SỐ KỸ
THUẬT PHÂN ĐOẠN VIDEO” là do tôi thực hiện dƣới sự hƣớng dẫn trực tiếp
của Cô TS. Nguyễn Thị Hồng Minh.
Mọi tham khảo dùng trong luận văn đều đƣợc trích dẫn rõ ràng tên tác giả, tên
công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin chịu
trách nhiệm hoàn toàn.

Thái Nguyên, tháng 05 năm 2014
Nguyễn Đình Trung

Số hóa bởi Trung tâm Học liệu

/>

LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành nhất tới TS. Nguyễn Thị Hồng Minh, Cô đã
cho tôi những định hƣớng, tận tình chỉ bảo giúp đỡ tôi những ý kiến rất quý báu
để tôi hoàn thành luận văn tốt nghiệp này.
Tôi xin cảm ơn Trƣờng Đại Học Công Nghệ Thông tin và Truyền thông - Đại
Học Thái Nguyên đã hết sức tạo điều kiện cho tôi trong quá trình học, làm và
hoàn thành khóa luận này.

Xin chân thành cảm ơn quý Thầy Cô trong khoa Sau đại học Trƣờng Đại học
Công nghệ Thông tin và Truyền thông – ĐH Thái Nguyên đã nhiệt tình giảng
dạy, trang bị cho tôi những kiến thức quý báu trong suốt thời gian học tập tại
trƣờng.
Tôi xin tỏ lòng biết ơn sâu sắc tới các thầy cô, bạn bè đã dìu dắt, giúp đỡ tôi tiến
bộ trong suốt quá trình làm khóa luận tốt nghiệp.
Xin gửi lời cảm ơn tới gia đình, những ngƣời bạn của tôi đã động viên, giúp đỡ
tôi trong suốt quá trình học tập và hoàn thành luận văn.

Số hóa bởi Trung tâm Học liệu

/>

MỤC LỤC
PHẦN MỞ ĐẦU ......................................................................................................... 8
I. Lý do chọn đề tài .............................................................................................................8
II. Mục tiêu nghiên cứu.....................................................................................................10
III. Nội dung nghiên cứu...................................................................................................10
IV. Phƣơng pháp nghiên cứu ............................................................................................10

Chƣơng 1 KHÁI QUÁT VỀ VIDEO VÀ BÀI TOÁN PHÂN ĐOẠN .................... 12
1.1. Khái quát về video .....................................................................................................12
1.1.1. Video là gì ...........................................................................................................12
1.1.1.2. Chuyển Cảnh................................................................................................12
1.1.2. Các ứng dụng Video ...........................................................................................13
1.1.2.1. Video tƣơng tự .............................................................................................15
1.1.2.2. Video số .......................................................................................................16
1.1.3. Các chuẩn video ..................................................................................................16
1.1.3.1. Định dạng AVI.............................................................................................17
1.1.3.2. Định dạng MOV ..........................................................................................17

1.1.3.3. Các định chuẩn MPEG ................................................................................19
1.1.3.4. Chuẩn ITU-T................................................................................................23
1.1.4. Một số đặc trƣng của video.................................................................................33
1.1.4.1. Màu sắc ........................................................................................................33
1.1.4.2. Kết cấu .........................................................................................................33
1.1.4.3. Hình dáng .....................................................................................................35
1.1.4.4. Chuyển động ................................................................................................35
1.2. Bài toán phân đoạn Video ..........................................................................................36
1.2.1. Bài toán ...............................................................................................................36
1.2.2. Phân loại các phƣơng pháp phân đoạn ...............................................................36
1.2.3. Các yếu tố chính để xác định phƣơng pháp phân đoạn ......................................37

Chƣơng 2 MỘT SỐ KỸ THUẬT PHÂN ĐOẠN VIDEO ....................................... 38
2.1. Phân đoạn video bằng kỹ thuật phát hiện đối tƣợng từ trên xuống ...........................38
2.2. Phân đoạn và theo vết các vùng Video ......................................................................39
2.3. Phân đoạn Video bằng kỹ thuật trừ ảnh và phát hiện chuyển cảnh trong Video ......41
2.3.1. Các kỹ thuật trừ ảnh ............................................................................................43
2.3.1.1. Trừ ảnh dựa vào điểm ảnh ...............................................................................43
2.3.1.2. Trừ ảnh phân khối ............................................................................................45
2.3.2. Phƣơng pháp biểu đồ màu. .....................................................................................45
2.3.2.1. Biểu đồ toàn cục ..............................................................................................48
2.3.2.2. Biểu đồ cục bộ .................................................................................................48
2.3.3. Trừ ảnh dựa vào đặc trƣng ..................................................................................53
2.3.3.1. Đặc trƣng là cạnh .........................................................................................55
2.3.3.2. Đặc trƣng là vectơ chuyển động ..................................................................55
2.3.4. Phƣơng pháp thống kê ............................................................................................61
2.3.5. Phát hiện chuyển cảnh ........................................................................................64
2.3.5.1. Đối với kỹ thuật phát hiện cắt cảnh .............................................................65
2.3.5.2. Đối với các kỹ thuật phát hiện chuyển cảnh dần dần ..................................65


Chƣơng 3 CHƢƠNG TRÌNH THỬ NGHIỆM ......................................................... 67
3.1. Bài toán ......................................................................................................................68
3.2. Phân tích, lựa chọn công cụ .......................................................................................68
Số hóa bởi Trung tâm Học liệu

/>

3.3. Một số kết quả thực hiện chƣơng trình ......................................................................68

PHẦN KẾT LUẬN ................................................................................................... 71
TÀI LIỆU THAM KHẢO......................................... Error! Bookmark not defined.

Số hóa bởi Trung tâm Học liệu

/>

DANH MỤC CÁC KÝ HIỆU VÀ VIẾT TẮT
AVI

Audio Video Interleave

BLOB

Binary Large Object

CATV

Cable Television

CBT


Computer Based Training

CDMA

Code Division Multiple Access

CSDL

Cơ sở dữ liệu

CCIR

Consultative Committee for International Radio

DBMS

Database Management System

DBS

Direct Broadcast Satellite

DCT

Discrete Cosine Transform

DV

Digital Video


DVD

Digital Video Disc

HDTV

High Definition TV

IEC

International Electrotechnical Commission

IMA

Interactive Multimedia Association

ISO

International Organization for Standardization

ISO-IEC

International Organization for Standard –
International Electrotechnical Commission

ITU-T

International Telecommunication Union


JPEG

Joint Picture Experts Group

MACE

Macintosh Audio Compression and Expansion
codec

Số hóa bởi Trung tâm Học liệu

/>

MOV

Quick Time Movie File Extension

MPEG

Moving Picture Experts Group

NTSC

National Television Standard Committee

OVID

Object Video Information Database

PAL


Phase Alternation Line

PES

Packetised Elementary Streams

RGB

Red, Green, Blue

RLE

Run Leng Encoding

TV

Television

VCD

Video Compact Disc

VDBMS

Video Database Management System

VIMSYS

Visual Information Management System


VOD

Video On Demand

VODM

Video Object Description Model

VSDG

Video Semantic Directed Graph

WBT

Web Based Training

WMA

Windows Media Audio

WMV

Windows Media file with Audio/Video

YUV

Sơ đồ mã hoá hình ảnh màu phân cách độ chói
(Y) và hai tín hiệu màu: đỏ trừ Y (U) và xanh
trừ Y (V).


Số hóa bởi Trung tâm Học liệu

/>

DANH MỤC CÁC HÌNH VẼ
Hình 1.1:
Cấu trúc phân cấp của video ..................... Error! Bookmark not defined.
Hình 1.2:
Cắt cứng .................................................... Error! Bookmark not defined.
Hình 1.3:
Fade in....................................................... Error! Bookmark not defined.
Hình 1.4:
Fade out..................................................... Error! Bookmark not defined.
Hình 1.5:
Chồng mờ.................................................. Error! Bookmark not defined.
Hình 1.6:
Wipe .......................................................... Error! Bookmark not defined.
Hình 1.7:
push sang trái ............................................ Error! Bookmark not defined.
Hình 1.8:
Một số loại wipe cơ bản ............................ Error! Bookmark not defined.
Hình 1.9:
Sơ đồ giải nén MPEG–1 (ISO/IEC 11172)Error! Bookmark not defined.
Hình 1.10: Sơ đồ nén dữ liệu âm thanh ...................... Error! Bookmark not defined.
Hình 1.11: Mô hình hệ thống giải mã MPEG 2 ......... Error! Bookmark not defined.
Hình 1.12: Mô hình nén và giải nén theo từng lớp của MPEG 4 ....Error! Bookmark
not defined.
Hình 1.13: Các ảnh rất khác nhau nhƣng có cùng biểu đồ màu Error! Bookmark not
defined.

Hình 1.14: Biểu đồ thể hiện 4 loại ảnh cơ bản ............ Error! Bookmark not defined.
Hình 1.15: Các thao tác camera .................................................................................. 35
Hình 2.1. Khám phá và khai thác cấu trúc các đối tƣợng ảnh………………………… 36
Hình 2.2. Sơ đồ ứng dụng kỹ thuật trừ ảnh vào phân đoạn video . Error! Bookmark not
defined.
Hình 2.3. Các cửa sổ cơ sở trong thuật toán so sánh thực ............. Error! Bookmark not
defined.
Hình 2.4. Chênh lệch biểu đồ, * cắt cảnh, ---- chồng mờ Error! Bookmark not defined.
Hình 2.5. So sánh biểu đồ của hai ảnh ............................ Error! Bookmark not defined.
Hình 2.6. a.Ví dụ một ảnh màu, b.Biểu đồ màu của ảnh a ........... Error! Bookmark not
defined.
Hình 2.7. So sánh cặp a. chênh lệch biểu đồ liên tiếp, b. chênh lệch biểu đồ tích lũy
........................................................................................ Error! Bookmark not defined.
Hình 2.8. Phát hiện chuyển cảnh dần dần bằng kỹ thuật so sánh cặp...Error! Bookmark
not defined.
Hình 2.9. Phát hiện chuyển cảnh dần dần bằng kỹ thuật phát hiện cạnh ................. Error!
Bookmark not defined.
Hình 2.10. Ma trận 3 thành phần mở rộng khác nhau có kích thƣớc 3*3, 5*5, 13*13
........................................................................................ Error! Bookmark not defined.
Hình 2.11. a. Phân số thay đổi cạnh P, b.Độ chênh lệch của P qua các khung hình
........................................................................................ Error! Bookmark not defined.
Hình 2.12. Phát hiện chuyển cảnh dần dần bằng phƣơng pháp phát hiện cạnh a.fade out
rồi fade in, b.chồng mờ ................................................... Error! Bookmark not defined.
Hình 2.13. Phân số thay đổi cạnh vào và ra của các khung hình ... Error! Bookmark not
defined.
Hình 2.14. Phân số thay đổi cạnh của các khung hình ... Error! Bookmark not defined.
Hình 2.15. Phát hiện chuyển cảnh dần dần ..................... Error! Bookmark not defined.
Hình 2.16. Mẫu vectơ cho các di chuyển camera ........... Error! Bookmark not defined.
Hình 2.17. Các hiệu ứng camera với luồng vectơ khuếch đại ....... Error! Bookmark not
defined.

Hình 2.18. Sơ đồ khối thuật toán phát hiện chuyển cảnh ............................................... 65
Hình 2.19. Kết quả phát hiện cắt cảnh. ......................... Error! Bookmark not defined.
Số hóa bởi Trung tâm Học liệu

/>

Hình 2.20. Kết quả phát hiện cắt cảnh bằng các kỹ thuật cải tiến từ hƣớng tiếp cận so
sánh biểu đồ (HistDiff) ................................................... Error! Bookmark not defined.
Hình 3.1.
Giao diện phát hiện chuyển cảnh .............................................................. 69
Hình 3.2.
Nội dung file lƣu kết quả phân đoạn......................................................... 69

DANH MỤC CÁC BẢNG
Bảng 1.1. Các tiêu chuẩn của Video số .......................................................................... 16
Bảng 1.2. Một số ràng buộc của MPEG-1 ...................... Error! Bookmark not defined.
Bảng 1.3. Mô tả kiểu CIF và QCIF................................................................................. 32
Bảng 2.1.
So sánh các kỹ thuật trừ ảnh với việc phát hiện biên tập video ................ 65

Số hóa bởi Trung tâm Học liệu

/>

PHẦN MỞ ĐẦU
I. Lý do chọn đề tài

Hiện nay, phần lớn lƣợng thông tin mà con ngƣời tiếp thu đƣợc từ thế giới
bên ngoài là ở dạng thông tin thị giác, vì vậy các nghiên cứu về dạng thông
tin này đều ít nhiều mang đến những lợi ích thiết thực cho cuộc sống. Với

trình độ khoa học kỹ thuật hiện nay, thông tin thị giác đuợc số hóa dƣới hai
dạng là ảnh số và video số.
Video ra đời vào những năm đầu của thế kỷ XX và phát triển khá mạnh mẽ,
nhƣng phải đến những thập kỷ cuối của thế kỷ XX video số mới phát triển.
Với sự ra đời và phát triển mạnh của máy tính và các hệ thống viễn thông,
việc xử lý dữ liệu video đƣợc số hoá trên máy tính tỏ ra khá hiệu quả. Dữ
liệu video số đã đƣợc đƣa vào rất nhiều ứng dụng trong thực tế nhƣ đào tạo
điện tử dựa vào máy tính, hỗ trợ đào tạo trên mạng, hệ thống mô phỏng,
giám sát, video theo yêu cầu… Vấn đề nâng cao hiệu quả và chất lƣợng của
thao tác, xử lý với dữ liệu video đang đƣợc nhiều nhà nghiên cứu, triển
khai ứng dụng quan tâm
Thông tin video khác với dữ liệu dạng văn bản cũng nhƣ dữ liệu ảnh
số bởi hai yếu tố là thời gian và không gian. Hơn thế nữa, dung lƣợng và
định dạng phi cấu trúc của dữ liệu video số gây ra một số khó khăn trong
quản lý, truy xuất, tái sử dụng và biên soạn các đoạn video thành tài liệu
video. So với ảnh số có tính chất tĩnh, video là dữ liệu động với trục thời
gian. Ảnh video đƣợc biểu diễn một cách liên tục trên một tốc độ nhất định.
Một ảnh video có chất lƣợng tốt bao gồm 25 đến 30 khung hình (frame)
trên một giây. Bên cạnh đó, ảnh video cần lƣợng lƣu trữ lớn và băng thông
rộng. Kích thƣớc một giờ video MPEG -1 là hơn 500MB.
Chính đặc tính liên tục và lƣợng dữ liệu lớn làm cho video trở nên thách
thức hơn khi xử lý và quản lý. Nói cách khác, khi nhiều thông tin hơn, đặc
Số hóa bởi Trung tâm Học liệu

/>

biệt là theo thời gian và chuyển động, ta lại có thêm nhiều cơ hội để phân
tích các nội dung trực quan trong ảnh video. Hơn nữa, mặc dù video là
phƣơng tiện truyền thông liên tục, nội dung chứa trong nó có dạng phân
cấp theo tự nhiên. Một đoạn phim video đƣợc chia thành các câu chuyện,

shot, frame/đoạn, cảnh, khung hình và cả các đối tƣợng kèm theo hành
động. Những hệ thống tìm kiếm video hiệu quả đòi hỏi phân tích và chỉ
mục đƣợc tất cả các yếu tố này.
Trong quá trình nỗ lực tìm kiếm lời giải cho bài toán truy vấn dữ liệu ảnh,
video, thì bài toán phân đoạn video xuất hiện một cách tự nhiên. Để có thể
truy vấn các đoạn video, thì các video phải đƣợc phân đoạn một cách thích
hợp trong một thể thống nhất có ý nghĩa. Sự phân đoạn và miêu tả đặc điểm
bằng tay là cách thủ công, tốn nhiều thời gian, phụ thuộc vào kỹ năng và sự
hiểu biết của ngƣời thực hiện, hơn nữa có khả năng bị giới hạn chỉ ở các
thuộc tính tƣơng đƣơng.
Trong quá trình chỉ số hoá dữ liệu video, bƣớc quan trọng đầu tiên là phân
đoạn dữ liệu video theo thời gian. Bƣớc này nhằm mục đích phân chia
dòng video liên tục thành các đơn vị cơ sở có ý nghĩa đó là các lia (shot),
các cảnh (scene) hay một dãy cảnh quay.
Một kịch bản điển hình trong tạo chỉ mục và tìm kiếm nội dung video đƣợc
biểu diễn trong hình 1 dƣới đây. Trƣớc tiên, các video và ảnh đầu vào đƣợc
phân đoạn thành các đơn vị theo không gian và thời gian thích hợp. Các
đặc trƣng trực quan sau đó đƣợc rút ra từ các đơn vị này để tạo chỉ mục và
tóm lƣợc, cuối cùng những video và ảnh này đƣợc đƣa ra và tìm kiếm dựa
trên các cấu trúc và đặc trƣng ở trên.

Số hóa bởi Trung tâm Học liệu

/>

Hình 1. Quá trình phân đoạn và tìm kiếm ảnh video

Chính vì vậy, việc nghiên cứu về phân đoạn Video là rất cần thiết cho một hệ
thống dữ liệu video và nó ngày càng trở nên cấp thiết hơn khi nhu cầu sử dụng
video ngày càng gia tăng. Xuất phát từ hoàn cảnh đó chúng tôi lựa chọn đề tài

"Nghiên cứu một số kỹ thuật phân đoạn video".
II. Mục tiêu nghiên cứu

Mục tiêu của đề tài là tập trung nghiên cứu một số kỹ thuật phân đoạn
video, đề xuất một số cải tiến và xây dựng một ứng dụng thực tế sử dụng
kỹ thuật cải tiến đã đƣợc nghiên cứu.
III. Nội dung nghiên cứu
Tổng quan về dữ liệu video.
Nghiên cứu các kỹ thuật phân đoạn video và đề xuất cải tiến
Triển khai ứng dụng thử nghiệm phân đoạn video nhằm tìm ra các phân
đoạn có ngữ cảnh phù hợp theo mục đích tìm kiếm
IV. Phƣơng pháp nghiên cứu
Tổng hợp các thông tin liên quan, lựa chọn các cách tiếp cận đã đƣợc
áp dụng thành công, tiến hành cài đặt thử nghiệm cho với các kỹ thuật đƣợc đề

Số hóa bởi Trung tâm Học liệu

/>

xuất. Đánh giá kết quả, từ đó sẽ tiến hành nghiên cứu sâu hơn về giải pháp cải
tiến.
Các tƣ liệu và thông tin liên quan chủ yếu đƣợc thu thập, tổng hợp từ
các nguồn sau:
+ Các tạp chí khoa học chuyên ngành trong và ngoài nƣớc, internet...
+ Trao đổi với các đồng nghiệp cùng lĩnh vực nghiên cứu.
Tiến hành nghiên cứu và tìm các ứng dụng có liên quan đến đề tài đặt
ra.
Trao đổi thông qua seminar hoặc tham gia báo cáo tại các hội thảo
khoa học nhằm nâng cao khả năng nghiên cứu, cách trình bày bài báo cáo khoa
học là kiểm chứng đánh giá các kết quả nghiên cứu.


Số hóa bởi Trung tâm Học liệu

/>

Luận án đầy đủ ở file: Luận án Full












×