Tải bản đầy đủ (.pdf) (109 trang)

Nghiên cứu và ứng dụng kỹ thuật nén và truyền ảnh qua mạng internet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.95 MB, 109 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-----------------------------------------------

NGUYỄN TUÂN ANH

ĐỀ TÀI:

NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT NÉN VÀ
TRUYỀN ẢNH QUA MẠNG INTERNET

LUẬN VĂN THẠC SỸ
NGÀNH: ĐIỆN TỬ VIỄN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:
NGUYỄN VĂN KHANG

HÀ NỘI – 2010


MỤC LỤC
MỞ ĐẦU...............................................................................................................................1
CHƯƠNG I: TỔNG QUAN................................................................................................5
1.1 Giới thiệu ....................................................................................................................5
1.2 Nội dung nghiên cứu..................................................................................................9
1.3 Mục tiêu của đề tài...................................................................................................15
CHƯƠNG II: KỸ THUẬT VIDEO SỐ ...........................................................................17
2.1 Kỹ thuật nén Video số .............................................................................................17
2.1.1 Khái niệm............................................................................................................17
2.1.2 Mô hình nén ảnh .................................................................................................17
2.2 Các đặc điểm của nén tín hiệu số............................................................................18


2.2.1 Xác định hiệu quả của quá trình nén tín hiệu số.................................................18
2.2.2 Độ dư thừa số liệu...............................................................................................19
2.2.3 Sai lệch bình phương trung bình.........................................................................19
2.3 Các phương pháp nén..............................................................................................20
2.3.1 Nén không tổn hao.............................................................................................20
2.3.2 Nén có tổn hao ....................................................................................................21
2.4 Tiêu chuẩn nén MPEG ............................................................................................22
2.4.1 Cấu trúc ảnh ........................................................................................................22
2.4.2 Nhóm ảnh (GOP- Group Of Picture)..................................................................23
2.4.3 Cấu trúc dòng bit MPEG Video..........................................................................24
2.5 Tiêu chuẩn nén MPEG-2.........................................................................................25
2.5.1 Đặc tính và định mức (profile and level) ............................................................25
2.5.2 MPEG-2 4:2:
2.6 Tiêu chuẩn nén H.264..............................................................................................28
2.6.1 Giới thiệu chung về bộ CODEC H.264 ..............................................................28
2.6.2 Cấu trúc...............................................................................................................30
2.6.3 Profile..................................................................................................................35
2.6.4 Một số kỹ thuật trong H.264...............................................................................36
2.6.5 Các đặc điểm nổi bật trong thiết kế của H.264...................................................48
CHƯƠNG III: CẤU TRÚC GÓI DỮ LIỆU .................................................................53
3.1 Lớp mã hóa video.....................................................................................................53
3.2 Lớp đóng gói Video..................................................................................................54
3.3 Lớp cấu trúc dòng truyền tải .................................................................................57
3.4 Lớp giao thức truyền tải thời gian thực( tùy chọn) .............................................61
3.5 Lớp truyền tải...........................................................................................................65
3.6 Lớp IP .......................................................................................................................72


3.7 Lớp liên kết dữ liệu ..................................................................................................79
3.8. Lớp vật lí..................................................................................................................81

CHƯƠNG IV: THỬ NGHIỆM NÉN ẢNH VÀ TRUYỀN ẢNH ..................................83
4.1 Đặt vấn đề .................................................................................................................85
4.2 Thử nghiệm nén ảnh................................................................................................85
4.3. Truyền ảnh và đánh giá đường truyền qua mạng ...............................................88
4.3.1. Cách thiết lập mạng vô tuyến giữa hai máy tính ...............................................89
4.3.2. Truyền ảnh qua mạng Peer to Peer ....................................................................92
KẾT LUẬN.......................................................................................................................102
TÀI LIỆU THAM KHẢO...............................................................................................105


DANH MỤC HÌNH VÀ BẢNG
Hình 1.1: Hội tụ truyền thông ................................................................................................6
Hình 1.2: Truyền tải các chương trình trên IP .....................................................................10
Hình 1.3: Mạng ngang hàng.................................................................................................14
Hình 2.1: Mô hình hệ thống nén Video. ..............................................................................17
Hình 2.2: Sự phối hợp các kỹ thuật trong JPEG và MPEG .................................................20
Hình 2.3: Dự đoán bù chuyển động một chiều và hai chiều................................................23
Hình 2.4: Kiến trúc dòng Video MPEG...............................................................................24
Hình 2.5: Cấu trúc số liệu nén ảnh MPEG...........................................................................24
Hình 2. 6: Sơ đồ bộ mã hoá .................................................................................................28
Hình 2.7: Sơ đồ bộ mã hoá cụ thể........................................................................................29
Hình 2.8: Sơ đồ bộ giải mã ..................................................................................................30
Hình 2.9: cấu trúc mã hoá dữ liệu của H.264 ......................................................................30
Hình 2.10: Chuỗi đơn vị NAL .............................................................................................31
Hình 2. 11: Slices.................................................................................................................31
Hình 2.12: Cấu trúc của slice...............................................................................................33
Hình 2.13: MacroBlock .......................................................................................................33
Hình 2.14: Ảnh tham chiếu và bù chuyển động...................................................................34
Hình 2.15: Các profile..........................................................................................................35
Hình 2.16: Dự đoán nội suy .................................................................................................36

Hình 2.17: Dự đoán intra 4x4 ............................................................................................37
Hình 2.18: Các chế độ dự đoán intra_4x4 ...........................................................................37
Hình 2.19: Các chế độ dự đoán intra_16x16 .......................................................................38
Hình 2.20: Phân mảnh macroblock......................................................................................39
Hình 2.21: Phân mảnh submacroblock ................................................................................39
Hình 2.22: Tính nội suy cho các chuyển động có khoảng cách không nguyên...................40
Hình2.23: Minh họa dự đoán bù chuyển động đa khung.....................................................42
Hình 2.24: Dự đoán liên khung trong slice B .....................................................................43
Hình 2.25: Ví dụ về một khung hình sử dụng bộ lọc Deblocking .......................................46
H.2.26: So với một số chuẩn nén khác. ...............................................................................52
Hình 3.1: Mô hình giao thức...............................................................................................53
Hình 3.2: Cấu trúc của khối NAL........................................................................................54
Hình 3.3: Định dạng gói MPEG PES..................................................................................55
Hình 3.4: Định dạng gói MPEG TS.....................................................................................57
Hình 3.5: Ánh xạ gói truy cập AVC sang gói MPEG PES................................................58
Hình 3.6: Ứng dụng nhãn thời gian với các gói MPEG PES...............................................58
Hình 3.7: Mối liên hệ giữa PMT và PAT ............................................................................60
Hình 3.8: Định dạng RTP header.........................................................................................62
Hình 3.9: Các gói MPEG TS ...............................................................................................63
Hình 3.10: Ánh xạ nội dung H264/AVC ( từng khối NAL riêng biệt ) sang RTP payload 64
Hình 3.11: Ánh xạ nội dung H264/AVC ( nhiều khối NAL riêng biệt ) ...........................64
sang một RTP payload ........................................................................................................64
Hình 3.12: Ánh xạ nội dung một H264/AVC NAL sang nhiều RTP payload ....................65
Hình 3.13: Cơ chế điều khiển luồng của TCP .....................................................................66
Hình 3.14: Quá trình truyên thông trong mạng IPTV..........................................................68
Hình 3.15: Định dạng datagram dựa trên UDP....................................................................71
Hình 3.16: Định dạng gói video IPv4 ..................................................................................73
Hình 3.17: Các lớp địa chỉ IP...............................................................................................76

1



Hình 3.18: Cấu trúc header của IPv6 ..................................................................................78
Hình 4.1: Mô hình đo PSNR................................................................................................85
Hình 4.2. Một picture của news_rev.mp4 ứng với PSNR >20(dB)..................................100
Hình 4.3. Một picture của news_rev.mp4 ứng với PSNR <20(dB)..................................100
Bảng 2.1: Các loại slice .......................................................................................................32
Bảng 2.2: Các thành phần cấu trúc của Macroblock ..........................................................33
Bảng 3.1: Cấu trúc của một gói MPEG PES..........................................................................55
Bảng 3.2: Cấu trúc gói MPEG TS .......................................................................................58
Bảng 3.3: Cấu trúc của gói IPTV dựa trên RTP ..................................................................62
Bảng 3.4: Định dạng của TCP segment ...............................................................................69
Bảng 3.5: Cấu trúc datagram IPTV dựa trên UDP ..............................................................71
Bảng 3.6: Cấu trúc gói video IPv4.......................................................................................73
Bảng 3.7: Các lớp địa chỉ IPv4 ............................................................................................75
Bảng 3.8: Mô tả trường của IPv6.........................................................................................78
Bảng 3.9: Cấu trúc của Ethernet header...............................................................................80
Bảng 3.10: Cấu trúc khung Ethernet được dùng để mang nội dung MPEG-2 ....................81
Bảng 3.11 Tổng kết các lớp trong mô hình IPTV................................................................81
Bảng 4.1: Bảng đánh giá chất lượng video ..........................................................................85
Bảng 4.2. Kết quả PSNR của file phía thu sau giải mã news_rev_cfi.yuv so với file phía
phát a03_ref.yuv ..................................................................................................................99
Bảng 4.3. Kết quả PSNR của file phía thu sau giải mã news_rev_cfi.yuv so với file phía
phát a03_ref.yuv ..................................................................................................................99

2


MỞ ĐẦU
Toàn cầu hoá và hội nhập là quá trình vận động mang tính hệ thống và khách

quan trên phạm vi toàn cầu, bao trùm tất cả các mặt đời sống kinh tế - xã hội của
các quốc gia trên toàn thế giới. Hiện tại, Việt Nam đã là thành viên chính thức của
WTO, điều này đánh dấu một bước phát triển cao hơn trong quá trình hội nhập, đây
là kết quả tất yếu khi mà quá trình toàn cầu hóa đang diễn ra mạnh mẽ trên mọi mặt,
tác động tới toàn bộ sự phát triển của mỗi quốc gia. Tác động của Internet tới các
hoạt động kinh doanh và xã hội ngày một lớn. Khả năng tương tác và tiếp cận rộng
rãi với công chúng biến Internet thành công cụ truyền thông đặc biệt. Sau tin tức,
âm nhạc, giờ đây tới ngành công nghiệp truyền hình truyền thống đứng trước lựa
chọn: kết hợp với Internet để bước sang kỷ nguyên phát triển mới hay tiếp tục đứng
độc lập (và có thể đối mặt với nguy cơ biến mất). Những năm gần đây, khái niệm
hội tụ truyền thông (media convergence) đã được nhắc đến nhiều. Hội tụ truyền
thông là một xu thế mới xuất phát từ những phát minh công nghệ, đặc biệt là
internet. Vì lý do này nên tôi đã làm luận văn khoa học tốt nghiệp với đề tài:
“Nghiên cứu ứng dụng kỹ thuật nén và truyền ảnh qua mạng Internet”
Nội dung của luận văn gồm 5 chương:
Chương 1: Tổng quan
Chương 1 đề cập tới vấn đề nghiên cứu nén ảnh và truyền ảnh trong môi
trường mạng Internet.
Chương 2: Kỹ thuật video số
Chương này đi vào chi tiết trình bầy một số vấn đề về nguyên lý nén ảnh số,
đóng gói dữ liệu và truyền gói dữ liệu IP
Chương 3: Cấu trúc gói dữ liệu
Chương này đi vào chi tiết trình bầy một số vấn đề về nguyên lý đóng gói dữ
liệu và truyền gói dữ liệu IP và giới thiệu mô hình giao thức truyền tải.
Chương 4: Những thực nghiệm về nén ảnh và truyền ảnh
Phần này chủ yếu trình bầy quá trình thực hiện bằng thực nghiệm quá trình
nén ảnh và truyền ảnh qua môi trường vô tuyến trong mạng giữa hai máy tính.

3



Kết luận
Qua quá trình nghiên cứu chuẩn nén và thực nghiệm truyền ảnh qua mạng vô
tuyến, chương này xây dựng mô hình mã hóa một file video thô YUV, sau đó tiến
hành nén ảnh sang chuẩn MPEG và truyền hình ảnh nén này qua mạng vô tuyến. Từ
đó đưa ra những đánh giá quá trình nén và giải nén thông qua việc tính toán PSNR,
tỉ số nén và xem đoạn video sau khi nén và truyền ảnh. Cuối cùng là đưa ra những
kiến nghị, kết luận và hướng phát triển trong tương lai.
Tôi xin gửi lời cảm ơn chân thành tới TS. Nguyễn Văn Khang người đã
hướng dẫn và giúp đỡ tôi hoàn thành luận văn này. Tôi cũng xin gửi lời cảm ơn tới
những thầy cô giáo người đã trang bị những kiến thức để tôi làm luận văn này. Mặc
dù tôi đã cố gắng nhưng chắc chắn luận văn vẫn còn rất nhiều thiếu sót, tôi mong
các thầy cô và các bạn đồng nghiệp chỉ bảo để tôi ngày càng hoàn thiện hơn vốn
kiến thức của mình
Hà Nội, tháng 10 năm 2010

4


CHƯƠNG I: TỔNG QUAN
1.1 Giới thiệu
Liệu trong thế kỷ tới, truyền hình có còn như hiện nay không? Trả lời được câu
hỏi này là chúng ta đã biết được tương lai của truyền hình trong kĩ nguyên số hoá.
Kể từ khi tín hiệu radio đầu tiên được phát sóng vào thế kỷ 18, con người
vẫn luôn luôn theo đuổi một mục đích duy nhất là phủ sóng cho nhiều người trên
một diện tích rộng. Từ xa xưa đến nay vẫn luôn tồn tại ước mơ cháy bỏng của con
người là vượt qua khoảng cách về thời gian và không gian bị giới hạn bằng mắt và
tai. Bởi vậy, người ta đã xây dựng rất nhiều trạm phát trên núi, nối liền các thành
phố và thị trấn với nhau bằng những đường dây cáp như một tấm màng nhện khổng
lồ, rồi sau đó đã tiến hành phóng vệ tinh vào quỹ đạo trái đất nhằm thực hiện ước

mơ trên. Với những nỗ lực như vậy, trong thế kỷ này, những người ở cách xa nhau
nửa vòng trái đất đã có thể cùng xem và cùng suy ngẫm một vấn đề trong cùng một
thời gian. Ở đây ta có thể hình dung camera và micro không chỉ đơn thuần là thiết bị
điện tử, đó chính là biến thể (sự nối dài) của con mắt và tai người, có khả năng thu
nhận những sự kiện ở rất xa. Thông qua những biến thể này, một cá nhân có thể
vượt qua được nền tảng chính trị cũng như văn hoá truyền thống của mình để cùng
chia sẻ và thấu hiểu giá trị cũng như cách nhìn của những con người khác nhau trên
thế giới. Những con người, những bộ tộc hoặc dân tộc đã lưu trữ lối sống cũng như
nền văn hoá của mình trong một phạm vi hẹp qua hàng ngàn năm, nay đã có thể gia
nhập ngôi làng toàn cầu nhờ vào bản chất của sóng điện từ. Bản chất đó có thể mô
tả là khả năng truyền đến rất nhiều người một thông điệp cùng một thời gian. Cho
dù có sự khác nhau về địa lý, về văn hóa, về nghề nghiệp người ta vẫn có thể hiểu ít
nhất là những vấn đề cơ bản trong bức thông điệp đó. Tuy vậy, ngày nay con người
đang mất dần hứng thú với truyền hình và họ chờ đợi một cái gì hơn thế nữa. Nhu
cầu của họ đang chuyển từ những vấn đề dành cho quảng đại dân cư sang những
vấn đề dành cho những cá nhân riêng lẻ. Khi hạ tầng mạng IP phát triển sẽ làm cho
việc ứng dụng cụng nghệ truyền video qua mạng đáp ứng nhu cầu người sử dụng
ngày càng tăng. Sự thay đổi này ta có thể thấy được hình ảnh thu vào camera ở một

5


nơi nào đú rất xa trên thế giới được truyền qua mạng IP về tới cho người xem. Gần
đây có khá nhiều dịch vụ ứng dụng công nghệ IP như : IPTV, Internet Video…

Hình 1.1: Hội tụ truyền thông
Hiện nay, chúng ta đang trong thời kỳ xây dựng một khuôn mẫu mới cho
hoạt động thông tin liên lạc của con người. Ðó chính là một môi trường phương tiện
cho phép từng cá nhân liên lạc một cách thuận tiện vào bất kì lúc nào, bất kỳ ở nơi
đâu qua phương tiện truyền thông có chức năng hợp nhất mọi dạng phương tiện liên

lạc. Sự ghép nối có tổ chức tạo nên sự linh hoạt, công nghệ mạng đang tạo ra một hệ
thống liên lạc mới cho phép vượt qua mọi trở ngại trong việc liên lạc giữa cá nhân
với cộng đồng. Hệ thống mới này đồng thời cũng hợp nhất các phương tiện đã phát
triển một cách độc lập với nhau trong quá khứ như: video, audio, text, liên lạc vô
tuyến, hữu tuyến thành một phương tiện duy nhất. Chúng ta hãy xét xem môi trường
mới với tên gọi là công nghệ truyền thông tương lai, sẽ thay đổi môi trường phương
tiện hiện đại như thế nào?
Thứ nhất, thông tin liên lạc giữa cá nhân, tổ chức và quảng đại dân cư trước
đây được thiết lập theo nhiều cách khác nhau nay sẽ được hợp nhất bằng hình thức
liên lạc hợp nhất. Chúng ta đã vượt qua giai đoạn khởi đầu và giờ đây đang tiến dần
tới hình thức liên lạc hợp nhất khi mà chức năng xử lý và lưu giữ thông tin do máy
tính đảm nhiệm, khả năng nối mạng do Internet đảm nhiệm, khả năng dịch vụ video
do truyền hình đảm nhiệm và chức năng liên lạc do điện thoại đảm nhiệm. Ngày
nay người ta có thể nối máy thu hình hoặc máy tính của mình vào mạng Internet và

6


liên lạc với những người khác bằng lời thoại hoặc thông điệp audio, video. Không
chỉ có vậy, ngày nay chúng ta còn có thể đọc báo, tạp chí hoặc xem truyền hình qua
Internet.
Thứ hai, khả năng hợp nhất truyền thông giữa mạng truyền dẫn có dây và
không dây chỉ có thể thực hiện được qua mạng hợp nhất. Trên cơ sở công nghệ số,
mạng có dây và không dây sẽ thiết lập và duy trì mạng hợp nhất có chức năng ghép
nối mạnh và trở thành mạng hạ tầng. Ðến lượt mình, mạng hạ tầng này sẽ cung cấp
một môi trường hợp nhất có khả năng cung cấp đa dịch vụ cho người sử dụng.
Thứ ba, mục tiêu tương lai của dịch vụ truyền thông là các cá nhân trong
quảng đại dân cư. Người ta sẽ tiêu nhiều thời gian hơn cho những dịch vụ cung cấp
thông tin cho họ vào thời gian và địa điểm mà họ đã định. Bởi vậy các phương tiện
phải cung cấp nhiều và lựa chọn khác nhau và điều kiện phải phù hợp với thị hiếu

cũng như mối quan tâm của từng cá nhân. Đến đây sẽ chấm dứt thời kỳ truyền tải
một chiều và đồng dạng (giống nhau). Như vậy cái nỗi lo của các đài truyền hình lo
lắng sự “đắt khách” của mình giảm thiểu đã được gạt bỏ. Đối thủ trước mắt chính là
sự bùng nổ Internet. Số người giải trí trong không gian Internet ngày càng tăng. Tuy
vậy cái bậc thang danh vọng mà truyền hình chiếm giữ bao lâu nay đâu dễ dàng từ
bỏ. Với hệ thống âm thanh vòng (nhà hát tại gia) và màn hình phẳng long lanh
truyền hình vẫn đang ngày càng thu hút người xem.
Đầu năm 2005, tác giả Rob McGann cho biết, kết quả điều tra thường niên
của Universal McCann với hơn 6000 người được phỏng vấn đã thống kê được thời
gian sử dụng đồng thời để lướt web và xem tivi tại Anh đã tăng lên 72 phần trăm.
Năm 2001, thời gian trung bình để cùng lúc làm hai việc này là 174 phút mỗi tuần.
Tới năm 2004, con số này đạt 300 phút mỗi tuần. Số thống kê năm 2004 cho thấy,
thời gian sử dụng internet trong lúc xem tivi chiếm khoảng 20 phần trăm thời gian
xem tivi hàng tuần với dân số trong độ tuổi từ 18-49 tại Hoa Kỳ. Tại thời điểm năm
2001, nhóm người này chỉ dành 11 phần trăm thời gian xem tivi mỗi tuần kết hợp
với duyệt web. Sau ba năm, tỷ lệ này gần như đã tăng lên gấp hai lần.
Tháng 11/2006, khảo sát thường niên của USC-Annenberg Digital Future
Project với thói quen sử dụng internet của hơn 2000 người dùng tại Hoa Kỳ đã
thống kê các kết quả: 41 phần trăm người dùng internet có thâm niên từ chín năm

7


trở lên cho biết việc xem thông tin trên web khiến họ ít xem truyền hình hơn. Chỉ 23
phần trăm những người mới sử dụng Internet (dưới một năm) xác nhận họ dành ít
thời gian cho truyền hình hơn vì Internet. Những người không sử dụng Internet có
thời gian xem tivi trung bình mỗi tuần là 21,4 giờ trong khi nhưng người có thói
quen duyệt web (kể cả những người mới làm quen với Internet) chỉ dành 12,3 giờ
mỗi tuần cho truyền hình. Sự kiện bóng đá FIFA 2006 đã truyền hình trực tiếp tới
26 triệu người xem trên khắp các châu lục toàn thế giới. Truyền hình Internet nhanh

chóng bắt kịp với công bố rằng năm 2007 người mỹ đã xem khoảng 9,5 tỉ đoạn
video Internet có độ dài trung bình 2,8 phút.
Trên đây là con số thống kê về lượng người sử dụng truyền hình internet sử
dụng tại các nước phát triển mạnh trên thế gới như Anh, Mỹ…, ta thấy rằng con số
này tăng lên hàng năm. Vậy tình hình ở Việt Nam ra sao? Đánh giá được đưa ra
trong Hội thảo Cơ hội kinh doanh trong ngành vô tuyến và di động tại Việt Nam
thời hội nhập, một hoạt động của VietnamComm 2007. Truyền hình trên Internet
(IPTV) là dịch vụ được đánh giá sẽ phát triển bùng nổ bởi hội tụ nhiều điều kiện cần
thiết. Ông Weijun Lee, Phó Giám đốc tập đoàn ZTE - nhà cung cấp dịch vụ IPTV
hàng đầu tại Trung Quốc, nêu ra 3 yếu tố căn bản để phát triển một dịch vụ IPTV,
gồm: đường truyền băng rộng, nội dung đa dạng và thị trường phát triển năng động.
Tại Việt Nam, nền tảng cơ sở hạ tầng của VNPT đảm bảo được những chương trình
IPTV hấp dẫn như Karaoke trên truyền hình, tương tác trực tiếp với những gì nhìn
thấy trên màn hình TV.
"Lấy ví dụ để các bạn thấy IPTV thay đổi quan niệm về truyền hình như thế
nào. Hãy tưởng tượng các bạn đang xem chương trình Vietnam Idol rất hấp dẫn.
Các bạn không cần soạn tin hay vào web để bình chọn mà có thể thao tác ngay trên
máy thu hình", ông Weijun Lee nói. "Thực tế tại những nơi đã triển khai IPTV, tỷ lệ
bình chọn như vậy cao hơn hẳn so với qua tin nhắn hoặc các hình thức khác". Cơ
hội kiếm tiền từ IPTV gần như được chia đều cho các bên tham gia. Theo đó, nhà
cung cấp dịch vụ được khoảng 30%, nhà cung cấp nội dung 40% và 30% còn lại
thuộc về các nhà cung cấp dịch vụ gia tăng trên IPTV.
Ông Trần Minh Tuấn, Phó viện trưởng Viện chiến lược Bộ TT-TT, cho biết
những dự án truyền hình analog sẽ dần được hạn chế trong thời gian tới. Thay vào

8


đó, truyền hình KTS sẽ được mở rộng. Đặc biệt khi vệ tinh Vinasat được phóng lên
quỹ đạo trong năm 2008, truyền hình kỹ thuật số sẽ được mở rộng đến vùng sâu,

vùng xa. Việc mở rộng truyền hình thế hệ mới sẽ được phổ biến bằng quỹ của chính
phủ. Từ đó làm cơ sở để kết thúc truyền hình analog vào năm 2015 - 2020.
Chúng ta đang sống trong một thế giới bùng nổ thông tin rất mạnh mẽ. Việc
ứng dụng các công nghệ hiện đại cho phát thanh và truyền hình để truyền tin tức, sự
kiện diễn ra rộng khắp trên toàn thế giới. Xuất phát từ nhu cầu ngày càng tăng của
đại bộ phận người xem cũng như xu thế phát triển mạnh của công nghệ truyền hình
trên mạng internet trong thời gian tới, cũng như xu thế phát triển công nghệ truyền
hình này trên thế giới và tại Việt Nam, tôi đã chọn đề tài “ Nghiên cứu và ứng
dụng kỹ thuật nén và truyền ảnh qua mạng Internet ” làm đề tài luận văn bảo vệ
tốt nghiệp cao học.
1.2 Nội dung nghiên cứu
Đã từ lâu, việc download và xem (nghe) lại các file video và audio chất
lượng cao từ Internet đã trở nên dễ như... bóc kẹo. Các trình duyệt và máy chủ Web
hiện hành đều hỗ trợ chức năng này. Tuy nhiên, truyền đầy đủ dung lượng của một
file multimedia thường yêu cầu một khoảng thời gian tải lâu đến mức không thể
chấp nhận được, mà lại còn hay ... "đứt" giữa chừng và rất hay bị lỗi. Chính vì dung
lượng các file nội dung âm thanh và hình ảnh quá lớn, nên một giải pháp phát trực
tuyến các nội dung này dưới dạng "dòng chảy" (streaming) đã được hình thành, để
người dùng có thể xem và nghe từng phần nội dung được "phát sóng" từ máy chủ
web một cách tuần tự. Toàn bộ file nội dung vẫn được lưu giữ trên máy chủ, chỉ có
từng phần thông tin được truyền tải và người dùng không lưu được toàn bộ file âm
thanh hay hình ảnh, kể cả sau khi đã xem hoặc nghe toàn bộ nội dung.

9


Hình 1.2: Truyền tải các chương trình trên IP
Theo lý thuyết, hình ảnh video và âm thanh sẽ được truyền từ máy chủ, qua
mạng Internet đến với khách hàng theo đúng yêu cầu của họ khi truy cập vào trang
web có tích hợp chức năng video. Người sử dụng sẽ xem nội dung gửi tới cùng lúc

dữ liệu chuyển đến, theo kiểu "nhận tới đâu, xem tới đó". Tuy nhiên, do sử dụng
đường truyền mạng như một kênh truyền nội dung, nên độ rộng của đường truyền
sẽ là yếu tố quyết định chất lượng truyền tải nội dung có được liền mạch và trôi
chảy hay không. Tính tới thời điểm này, đã xuất hiện khá nhiều trang web cung cấp
dịch vụ video streaming (các video streamer), cùng với nhiều công nghệ và giải
pháp "truyền hình Internet" đầy tiềm năng. Song thường thì các giải pháp video
streaming hiện tại mới chỉ phát huy được hiệu quả trong các mạng intranet khép kín,
còn khi đưa ra cung cấp đại trà trên toàn mạng Internet, chúng bỗng trở nên chuệch
choạc và "tậm tịt". Tuy vậy, người ta vẫn tin rằng một ngày nào đó, những cải tiến
và sáng chế mới trong giao thức đường truyền sẽ giúp biến "ước muốn" này trở
thành hiện thực thực tiễn. Trong mô hình client/server thì một máy khách (client) sẽ
kết nối với một máy chủ thông qua một giao thức nhất định, nên mọi xử lý sẽ nằm
trên server và do đó sẽ tránh cho clients những tính toán nặng nề. Tuy nhiên, mô
hình client/server bộc lộ một nhược điểm quan trọng: khi số lượng clients tăng đến
một mức độ nào đó thì nhu cầu về tải và băng thông tăng lên dẫn đến việc máy chủ
không có khả năng cung cấp dịch vụ cho các máy khách thêm vào. Để giải quyết
vấn đề trên, công nghệ mạng ngang hàng P2P (peer to peer technology) được tin
tưởng sẽ là lời giải cho các vấn đề trên. Mạng đồng đẳng (peer-to-peer network),
10


còn gọi là mạng ngang hàng, là một mạng máy tính trong đó hoạt động của mạng
chủ yếu dựa vào khả năng tính toán và băng thông của các máy tham gia chứ không
tập trung vào một số nhỏ các máy chủ trung tâm như các mạng thông thường. Mạng
đồng đẳng thường được sử dụng để kết nối các máy thông qua một lượng kết nối
dạng Ad hoc. Ứng dụng thường xuyên gặp nhất là chia sẻ tệp tin, tất cả các dạng
như âm thanh, hình ảnh, dữ liệu,... hoặc để truyền dữ liệu thời gian thực như điện
thoại VoIP. Một mạng đồng đẳng đúng nghĩa không có khái niệm máy chủ và máy
khách, nói cách khác, tất cả các máy tham gia đều bình đẳng và được gọi là peer, là
một nút mạng đóng vai trò đồng thời là máy khách và máy chủ đối với các máy

khác trong mạng. Mạng ngang hàng (Peer to Peer - P2P) là một kiểu kiến trúc máy
tính mới có nhiều hứa hẹn. Tuy vậy để có thể có các ứng dụng tin cậy như thực tế
đòi hỏi, không ít công sức và thời gian sẽ phải bỏ ra. Trong những năm qua thuật
ngữ mạng ngang hàng peer-to-peer (P2P) đã trở nên đồng nghĩa với Napster,
chương trình chia xẻ tệp nổi tiếng được chuyên gia lập trình 20 tuổi là Shawn
Fanning viết ra. Khi các kiến trúc Internet đầu tiên được dựng lên như mạng của các
mạng, các máy tính được kết nối theo kiểu ngang hàng. Nhiều dịch vụ trên Internet
như DNS, các nhóm tin và vô số các tính nǎng dựa trên các kiến trúc ngang hàng.
Nhưng trong thời gian đó, các máy tính nối mạng là những máy tính lớn, nặng nề và
liên kết với nhau ít hơn bây giờ. Vào nǎm 1996, hãng Mirabilis, Israel giới thiệu
dịch vụ đưa tin tức thời ICQ được ưa thích ngay lập tức sử dụng kiến trúc ngang
hàng để nhắn tin giữa các PC kết nối Internet. Napster đã tiến những bước xa hơn,
nhờ vào các bộ vi xử lý nhanh hơn, dung lượng nhớ lớn hơn và tốc độ kết nối nhanh
hơn cho phép các PC cùng chia xẻ file trên Internet. Thật đáng ngạc nhiên trường
hợp Napster cho thấy mọi người sẵn sàng mở máy tính của họ, chia xẻ các file dữ
liệu với những người hoàn toàn xa lạ khi họ thấy việc làm đó có lợi. Trong quá trình
đó, những mạng máy tính lớn đã được tạo ra nhanh chóng từ sự kết hợp của hàng
triệu máy PC riêng lẻ, mỗi máy trong số chúng có chức nǎng của máy chủ cũng như
máy khách. Nó cũng không hoàn toàn là một hệ thống P2P. Nó sử dụng một máy
server trung tâm để kết nối các máy tính với nhau tránh những rắc rối của các
chương trình ngang hàng khác, như Gnutella, một chương trình chia xẻ file được
dùng nhiều giữa các cộng đồng công nghệ cao. Khái niệm P2P như người ta hiểu

11


bao gồm bốn hoạt động khác nhau: sự hợp tác giữa những người sử dụng, sự tương
tác giữa những ứng dụng phần mềm, việc sử dụng hiệu quả các tài nguyên mạng và
các siêu tính toán. Các hệ thống này kết hợp khả nǎng chia sẻ tài nguyên với khả
nǎng truyền tin tức thời, tất cả trong một môi trường an toàn. Sự hấp dẫn chính là ở

sự khuyến khích chia xẻ file và truyền thông giữa các nhóm làm việc. Ví dụ, người
sử dụng có thể kết nối với các đồng sự trong các môi trường ảo để cùng hợp tác
trong công việc, giải quyết các vấn đề phức tạp và thậm chí lập kế hoạch chia xẻ tài
liệu và cùng lướt trên Internet. Quan trọng hơn cả đối với giới doanh nghiệp là dịch
vụ tạo ra một không gian an toàn cho người dùng cho dù họ ở trên Internet hay
trong Intranet sau tường lửa. Không cần phải có các kỹ sư của công ty, không cần
phải thiết lập hình thức tổ chức trung tâm và không phải lo đến những vị khách lạ
truy nhập vào mạng công ty. Một số công ty khác nhấn mạnh việc xây dựng hạ tầng
P2P, trên cơ sở đó các nhà phát triển có thể xây dựng các ứng dụng khác. Một trong
các cách làm này là sử dụng sức mạnh của giao thức XML, cho phép các nhà phát
triển không những chỉ định rõ cách bố trí của các trang web mà còn có thể hiện các
nội dung. Mặc dù mọi sự chú ý đều tập trung vào vấn đề cộng tác, các hệ thống P2P
cho phép các ứng dụng phần mềm tương tác với nhau đem lại nhiều hứa hẹn nhất
cho các ứng dụng kết hợp các dữ liệu phân tán cho thương mại điện tử, thiêt kế sản
phẩm hoặc quản lý tri thức. Các chương trình đó dùng P2P như một phương thức
gửi dữ liệu vào và ra từ trình ứng dụng này tới trình ứng dụng khác hoặc liên kết
một số lượng vô hạn các máy tính thành một cơ sở dữ liệu khổng lồ. Công nghệ
tương tác phần mềm cho phép các công ty chia nhỏ các vấn đề phức tạp cho dễ
quản lý hơn. Các hệ thống cho phép đối chiếu dữ liệu và đảm bảo rằng chúng đang
được điều khiển bởi chính những người tạo ra chúng, đảm bảo rằng hoạt động chính
xác và kịp thời rất lý tưởng cho các ứng dụng trực tuyến và kinh doanh chứng
khoán. Một số các hang máy tính đang tiếp tục phát triển thế hệ tiếp theo của các
máy tìm kiếm trên công nghệ P2P để phân phối thông tin đúng lúc và toàn diện hơn
cho các công ty truyền thông lớn. Một loạt các hãng mới thành lập đang tạo ra
những chương trình tận dụng tài nguyên triển khai khả nǎng của P2P để lưu trữ các
file, phân phối nội dung và chia sẻ sức mạnh xử lý của các máy khác. Mục đích ở
đây một phần là cắt giảm giá thành phần cứng chẳng hạn như thiết bị lưu trữ, server

12



và các thiết bị khác, nhưng cũng giúp cho việc quản lý giao thông trên mạng. Mặc
dù có tiềm nǎng dịch vụ lớn, nhưng đây là một vấn đề khó khǎn nhất của P2P. Có
quá nhiều vấn đề liên quan đến an toàn bảo mật và sự phức tạp - không đề cập đến
giá của các thiết bị lưu trữ và các server giảm xuống - khiến cho các dịch vụ P2P trở
nên không thiết thực. Cuối cùng, công nghệ P2P có thể áp dụng cho các dịch vụ tính
toán phân tán có khả nǎng đạt được siêu xử lý cho các công ty cần khả nǎng xử lý
lớn nhưng không muốn bỏ hàng triệu đôla cho nó. Công nghệ này đã chia việc xử lý
lớn ra thành những xử lý nhỏ có thể phân tán giữa các máy tính trong một mạng.
Mỗi một PC đồng thời xử lý các dữ liệu và trả về kết quả cho máy tính trung tâm
ráp nối các phần này lại. Ví dụ, tiến trình này có thể được sử dụng để chia ra từng
ảnh nhỏ riêng biệt để tạo hình ảnh động cho những máy PC khác nhau thực hiện
đồng thời và sau đó kết hợp những hình đã được xử lý đó thành một chuỗi các hình
liên tục. Khi có hàng ngàn, hay hàng triệu máy tính được nối lại với nhau thì có thể
liên kết tính toán siêu xử lý song song với tốc độ nhiều triệu phép tính / giây, với giá
thành nhỏ hơn nhiều so với các siêu máy tính như máy đánh cờ Deep Blue hay Blue
Gene của IBM. Liệu rằng các công ty đã sẵn sàng tin vào những người dùng máy
tính dấu tên trên khắp thế giới truy nhập dữ liệu quý giá của họ không cho dù vô
tình hay cố ý ?. Do vậy hầu hết các hãng P2P đang thiết kế các ứng dụng cho các
hãng đủ lớn để có thể thực hiện các xử lý phân tán trong nội bộ công ty. Mặc dù
một số lượng lớn các công ty nhỏ đã thất bại nhưng những sản phẩm của các công
ty lớn như Microsoft , Sun Microsystems và nhiều công ty khác đã bắt đầu áp dụng
P2P. Những hãng khổng lồ này đang nghiên cứu để ứng dụng công nghệ P2P trong
các sản phẩm của họ. Intel là công ty lớn đầu tiên dùng P2P và đang đầu tư để phát
triển tiếp và đồng thời giúp đỡ các nhóm làm việc về P2P nhằm đưa ra các chuẩn
công nghệ ban đầu. Trong khi đó Microsoft đã tuyên bố công khai vào tháng Tám
dự án Hailstorm của họ, đó là ".Net" và đã đưa ra một số nét nổi bật của các dịch vụ
P2P. Không chịu đứng ngoài cuộc Sun Microsystems đã đưa ra một loạt chuẩn cho
một nền P2P mã nguồn mở gọi là JXTA. Sun gần đây cũng đã bắt đầu đầu tư cho
công nghệ này và mua Infrasearch với giá 10 triệu đô la. Thập kỷ trước đã chứng

kiến những thay đổi lớn về cung cách làm việc. Biên giới của các công ty đã trở lên
rộng lớn hơn và mối quan hệ giữa khách hàng và nhà cung cấp đã trở lên gần gũi

13


hơn đồng thời sự tin tưởng của công ty vào những người lao động tạm thời và các
chuyên gia tǎng lên, trong khi đó các tổ chức lại dựa nhiều hơn vào các nhóm làm
việc đặc biệt. Những nơi làm việc như vậy sẽ không có một cấu trúc làm việc cố
định và một vai trò nghề nghiệp được xác định rõ ràng. P2P rất phù hợp với cách
thức hợp tác này. Việc sử dụng các hệ thống mạng đã làm thay đổi một cách đáng
kể lực lượng lao động trong những nǎm gần đây. Những nhóm làm việc tự phát qua
mạng là sự phát triển có ý nghĩa quan trọng về cách thức làm việc của các công ty.

Hình 1.3: Mạng ngang hàng
Lần lượt các hệ thống nhắn tin như ICQ và các công cụ P2P khác dùng để
giao tiếp sẽ trở thành trung tâm của các mạng như thế và cho phép người sử dụng
liên kết với nhau một cách tự do và dễ dàng. Những bước nghiên cứu ban đầu về
các ứng dụng P2P đã công nhận những xu hướng như vậy trong thế giới kinh doanh.
Các hệ thống giao tiếp tương tác được ứng dụng liên kết các hệ thống lập trình và
thiết kế lại với nhau, tích hợp các kho dữ liệu khổng lồ và cho phép những nhóm
phát triển và thiết kế độc lập liên kết với nhau tốt hơn. Trong quá trình xử lý này hệ
thống giảm các luồng thông tin sai hay lỗi thời giữa các nhóm thiết kế dẫn đến tiết
kiệm nhiều triệu đô la. Các nhà tin học cho rằng trong thương mại, P2P chỉ thích
hợp cho những ứng dụng có trao đổi thông tin trực tiếp. Như vậy, server sẽ tiếp tục
duy trì vị trí của mình trong việc quản lý nhân sự và chi tiêu, kế hoạch kinh doanh
và nhiều ứng dụng khác. Tuy nhiên, trong tương lai, server sẽ cung cấp các dịch vụ
cao cấp hơn thay vì những việc lặt vặt đơn giản như lưu trữ và phân phát các tệp.

14



P2P là một kiểu kiến trúc máy tính mới có nhiều hứa hẹn. Tuy vậy để có thể có các
ứng dụng tin cậy như thực tế đòi hỏi, không ít công sức và thời gian sẽ phải bỏ ra.
Vì những ứng dụng thực tế của sự phát triển Internet trong nhiều lĩnh vực đời
sống, với xu thế hội tụ truyền thông trên nền truyền dẫn là internet là một vấn đề rất
rộng lớn nên trong đề tài luận văn này xin trình bầy một số vấn đề :
- Giới thiệu tổng quan nói tới sự phát triển của truyền hình từ phát sóng
quảng bá tới ứng dụng những công nghệ số mới để đáp ứng những nhu cầu con
người trong thời đại phát triển internet. Ngoài ra trong phần này cũng giới thiệu tình
hình phát triển của một hình thức truyền hình mới đó là truyền hình internet trên thế
giới và những đánh giá, xu hướng tiếp cận công nghệ mới tại Việt Nam. Từ đó làm
cơ sở cho nội dung nghiên cứu về nén ảnh và truyền ảnh qua mạng internet.
- Cơ sở lý thuyết xin trình bầy về nguyên lý nén tín hiệu video với những vấn
đề như kỹ thuật nén video số, các đặc điểm của nén số, các phương pháp nén…và
hai chuẩn nén cơ bản MPEG-2, H-264. Cuối cùng đề cập tới cấu trúc dữ liệu và các
giao thức truyền tải gói dữ liệu.
- Phần thử nghiệm truyền ảnh trong phẩn này tiến hành thử nghiệm hai vấn
đề chính đó là thử nghiệm nén ảnh H264 bằng công cụ phần mềm sau đó tiến hành
đánh giá chất lượng ảnh sau khi nén bằng tham số PSNR. Thứ hai là thử nghiệm
truyền ảnh qua môi trường internet giữa hai máy tính dạng mạng đồng đẳng P2P
(Peer to Peer) sau khi thu được ảnh sẽ tiến hành đánh giá chất lượng ảnh sau khi
truyền bằng tham số PSNR.
- Kết luận đưa ra nhận xét những kết quả thực nghiệm và những định hướng
tiếp theo của luận văn. Đồng thời tiến hành đánh giá lại đề tài và chỉ ra những tồn
tại mà đề tài chưa thực hiện được.
1.3 Mục tiêu của đề tài
Trước những phát triển mạnh mẽ của công nghệ số, ứng dụng truyền hình
trên nền truyền dẫn mạng internet mạnh mẽ, mục tiêu của đề tài đề cập tới một số
vấn đề cơ bản như :

-

Chỉ ra lý do tại sao phải tiến hành nén ảnh trước khi truyền dẫn và một số

nguyên lý nén ảnh.
-

Cách hình thành cấu trúc gói dữ liệu để truyền qua mạng IP

15


-

Phương pháp đánh giá chất lượng hình ảnh sau nén

-

Phương pháp đánh giá chất lượng ảnh sau khi truyền qua mạng P2P.

Thông qua những kiến thức các thầy cô giáo đã chỉ dạy tiến hành một số thử
nghiệm thực tiễn về nén ảnh và truyền dẫn ảnh theo phương thức mạng ngang hang
(P2P). Những thử nghiệm này giúp cho em minh họa thêm, hiểu rõ hơn những kiến
thức thu được trong quá trình học tập tại trường Đại Học Bách Khoa Hà Nội.

16


CHƯƠNG II: KỸ THUẬT VIDEO SỐ
2.1 Kỹ thuật nén Video số

2.1.1 Khái niệm
Nén về cơ bản là một quá trình trong đó lượng số liệu (data) biểu diễn
lượng thông tin của một ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ
những số liệu dư thừa trong tín hiệu Video. Các chuỗi ảnh truyền hình có nhiều
phần ảnh giống nhau, vậy tín hiệu truyền hình có chứa nhiều dữ liệu dư thừa, ta có
thể bỏ qua mà không làm mất thông tin ảnh. Đó là các phần xoá dòng, xoá mành,
vùng ảnh tĩnh hoặc chuyển động rất chậm, vùng ảnh nền giống nhau, mà ở đó các
phần tử liên tiếp giống nhau hoặc khác nhau rất ít. Thường thì chuyển động trong
ảnh truyền hình có thể được dự báo, do đó chỉ cần truyền các thông tin về chuyển
động. Các phần tử lân cận trong ảnh thường giống nhau, nên chỉ cần truyền các
thông tin biến đổi. Các hệ thống nén sử dụng đặc tính này của tín hiệu Video và
các đặc trưng của mắt người là kém nhậy với sai số trong hình ảnh có nhiều chi
tiết, các phần tử chuyển động. Quá trình sau nén ảnh là dãn (giải nén) ảnh để tạo
lại ảnh gốc hoặc xấp xỉ ảnh gốc.
2.1.2 Mô hình nén ảnh

Biểu diễn
thuận lợi

Lượng tử
hóa

Gán từ


Xử lý
kênh

Giải từ



Giải
L.T.H

Biểu diễn
thuận lợi

Hình 2.1: Mô hình hệ thống nén Video.
Ở tầng đầu tiên của bộ mã hoá video, tín hiệu video được trình bày dưới
dạng thuận tiện để nén có hiệu quả nhất. Điểm cốt yếu là chỉ xác định cái gì được
mã hoá. Sự biểu diễn có thể chứa nhiều mẩu thông tin để mô tả tín hiệu hơn là chính
tín hiệu, nhưng hầu hết thông tin quan trọng chỉ tập trung trong một phần nhỏ của
sự mô tả này. Trong cách biểu diễn có hiệu quả, chỉ có phần nhỏ dữ liệu cần thiết để
truyền cho việc tái tạo tín hiệu video.

17


- Hoạt động thứ hai của bộ mã hoá là lượng tử hoá, giúp rời rạc hoá thông tin
được biểu diễn. Để truyền tín hiệu video qua một kênh số, những thông tin biểu
diễn được lượng tử hoá thành một số hữu hạn các mức.
- Hoạt động thứ 3 là gán các từ mã. Các từ mã này là một chuỗi bit dùng để
biểu diễn các mức lượng tử hoá.
Các quá trình sẽ ngược lại trong bộ giải mã video.
Mỗi hoạt động cố gắng loại bỏ phần dư thừa trong tín hiệu video và tận dụng
sự giới hạn của khả năng nhìn của mắt người. Nhờ bỏ đi các phần dư thừa, các
thông tin giống nhau hoặc có liên quan đến nhau sẽ không được truyền đi. Những
thông tin bỏ đi mà không ảnh hưởng đến việc nhìn cũng không được truyền đi.
2.2 Các đặc điểm của nén tín hiệu số
2.2.1 Xác định hiệu quả của quá trình nén tín hiệu số

Hiệu quả nén được xác định bằng tỉ lệ nén, nghĩa là tỷ số giữa số lượng dữ
liệu của ảnh gốc trên trên số lượng dữ liệu của ảnh nén.
Độ phức tạp của thuật toán nén được xác định bằng số bước tính toán trong
cả hai quá trình mã hoá và giải mã. Thông thường thì thuật toán nén càng phức tạp
bao nhiêu thì hiệu quả nén càng cao nhưng ngược lại giá thành và thời gian thực
hiện lại tăng. Đối với thuật toán nén có tổn thất thì độ sai lệch được xác định bằng
số thông tin bị mất đi khi tái tạo lại hình ảnh từ dữ liệu nén. Với nén không tổn thất
thì chúng ta có thể có những thuật toán mã hoá càng gần với Entropy của thông tin
nguồn, bởi vì lượng entropy của nguồn chính là tốc độ nhỏ nhất mà bất cứ một thuật
toán nén không tổn thất nào cũng có thể đạt được.
Ngược lại, trong các nén có tổn thất thì mối quan hệ giữa tỷ lệ nén và độ sai
lệch thông tin được Shannon nghiên cứu và biểu diễn dưới dạng hàm RD (hàm về độ
sai lệch thông tin). Lý thuyết của ông cũng chỉ ra rằng với thuật toán nén có tổn thất
thì chúng ta sẽ có hiệu quả cao nhất, nhưng ngược lại ta bị mất thông tin trong quá
trình tái tạo lại nó từ dữ liệu nén. Trong khi đó nén không tổn thất , mặc dù đạt hiệu
quả thấp nhưng ta lại không bị mất thông tin trong quá trình tái tạo lại nó. Vì vậy, ta
phải tìm ra một biện pháp nhằm trung hoà giữa hai thuật toán nén này để tìm ra một
thuật toán nén tối ưu sao cho hiệu quả nén cao mà lại không bị mất mát thông tin.

18


2.2.2 Độ dư thừa số liệu
Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một
lượng thông tin cho trước. Số liệu và thông tin không đồng nghĩa với nhau, số liệu
chỉ là phương tiện dùng để truyền tải thông tin. Cùng một lượng thông tin cho trước
có thể biểu diễn bằng các lượng số liệu khác nhau.
Độ dư thừa số liệu là vấn đề trung tâm trong nén ảnh số. Đánh giá cho quá
trình thực hiện giải thuật nén là tỷ lệ nén (CN) được xác định như sau: Nếu N1 và N2
là lượng số liệu trong hai tập hợp số liệu cùng được biểu diễn một lượng thông tin

cho trước thì độ độ dư thừa số liệu tương đối RD của tập hợp số liệu thứ nhất với tập
hợp số liệu thứ hai có thể được định nghĩa như sau:

RD =1-1/ CN
Trong đó: CN =N1/N2
Trong trường hợp N1=N2 thì CN =1 và RD=0, có nghĩa là so với tập số liệu
thứ hai thì tập số liệu thứ nhất không chứa số liệu dư thừa. Khi N2<tới vô cùng và RD tiến tới 1, có nghĩa là độ dư thừa số liệu tương đối của tập số liệu
thứ nhất là khá lớn hay tập số liệu thứ hai đã được nén khá nhỏ.
2.2.3 Sai lệch bình phương trung bình
Một đánh giá thống kê khác có thể đánh giá cho nhiều giải thuật nén là sai
lệch bình phương trung bình so với ảnh gốc RMS (Root Mean Square) được tính
bởi biểu thức:
RMS =

1
×
n

n

∑ (X − X )
i =1

' 2

i

i


Trong đó:
RMS – sai lệch bình phương trung bình
Xi – Giá trị điểm ảnh ban đầu
Xi’ – Giá trị điểm ảnh sau khi nén
n – Tổng số điểm ảnh trong một ảnh
RMS chỉ ra sự khác nhau thống kê giữa ảnh ban đầu và ảnh sau khi nén. Đa
số trường hợp khi nén chất lượng của ảnh nén là tốt với RMS thấp. Tuy nhiên, trong
một số trường hợp có thể xảy ra là chất lượng ảnh nén với RMS cao tốt hơn ảnh với
RMS thấp hơn.
19


2.3 Các phương pháp nén
Các hệ thống nén số liệu là sự phối hợp của rất nhiều các kỹ thuật xử lý
nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng hình ảnh phù hợp
ứng với một ứng dụng nhất định. Nhiều kỹ thuật nén mất và không mất thông tin
(loss/lossless data reduction techniques) đã được phát triển trong nhiều năm qua.
Chỉ có một số ít trong chúng có thể áp dụng cho nén video số.
Hình 2.2 minh hoạ kỹ thuật nén được sử dụng để tạo thành các tín hiệu nén
JPEG (Joint Photographic Expert Group) và MPEG (Moving Picture Expert Group).
Sử dụng các kỹ thuật này một cách riêng rẽ thực tế không đưa lại một kết quả nào
về giảm tốc độ dòng tín hiệu .
Tuy nhiên, phối hợp một số các kỹ thuật này sẽ đem lại những hệ thống nén
vô cùng hiệu quả như hệ thống nén JPEG, MPEG-1, MPEG-2.
Video số

Nén không
mất thông

DCT


VLC

RLC

Nén mất
thông tin

Loai bỏ
khoảng

Mẫu
con

DPCM

Lượng
tử hoá

JPEG
MPEG –

Hình 2.2: Sự phối hợp các kỹ thuật trong JPEG và MPEG
2.3.1 Nén không tổn hao
Nén không mất thông tin cho phép phục hồi lại đúng tín hiệu ban đầu sau
khi giải nén. Đây là một quá trình mã hoá có tính thuận nghịch. Hệ số nén phụ
thuộc vào chi tiết ảnh được nén. Hệ số nén của phương pháp nén không mất thông
tin nhỏ hơn 2:1. Các kỹ thuật nén không mất thông tin bao gồm:

20



a.

Mã hoá với độ dài thay đổi (VLC)

Phương pháp này còn được gọi là mã hoá Huffman và mã hoá Entropy, dựa
trên khả năng xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết
lập một từ mã ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho
các giá trị còn lại. Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử
dụng để tái tạo lại giá tri tín hiệu ban đầu.
b.

Mã hoá với độ dài động (RLC)

Phương pháp này dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã
đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại.
Chỉ các mẫu có giá trị khác không mới được mã hoá. Số mẫu có giá trị bằng
không sẽ được truyền đi dọc theo cùng dòng quét.
c.

Sử dụng khoảng xoá dòng, xoá mành

Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông
tin tích cực của ảnh. Theo phương pháp đó, thông tin xoá dòng và xoá mành sẽ
không được ghi giữ và truyền đi. Chúng được thay bằng các dữ liệu đồng bộ ngắn
hơn tuỳ theo ứng dụng.
d.

Biến đổi cosin rời rạc (DCT)


Quá trình DCT thuận và nghịch được coi là không mất thông tin nếu độ dài
từ mã hệ số là 13 hoặc 14 băng tần đối với dòng video số sử dụng 8 bit biểu diễn
mẫu. Nếu độ dài từ mã hệ số của phép biến đổi DCT nhỏ hơn, quá trình này trở nên
có mất thông tin .
Trong truyền hình, phương pháp nén không tổn hao được kết hợp trong các
phương pháp nén có tổn hao sẽ cho tỷ lệ nén tốt mà không gây mất mát về độ phân giải.
2.3.2 Nén có tổn hao
Nén có tổn hao chấp nhận mất mát một ít thông tin để gia tăng hiệu quả nén,
rất thích hợp với nguồn thông tin là hình ảnh và âm thanh. Như vậy, nén có tổn hao
mới thật sự có ý nghĩa đối với truyền hình. Nó có thể cho tỷ lệ nén ảnh cao để
truyền dẫn, phát sóng đồng thời cho một tỷ lệ nén thích hợp cho xử lí và lưu trữ ảnh
trong studio.
Nén tổn hao thường thực hiện theo 3 bước liên tục:

21


-Bước 1: Biến đổi tín hiệu từ miền thời gian (không gian) sang miền tần số
bằng cách sử dụng các thuật toán chuyển vị như biến đổi cosin rời rạc DCT. Bước
này thực hiện việc giảm độ dư thừa của pixel trong ảnh, tuy nhiên quá trình này
không gây tổn hao.
-Bước 2: Thực hiện lượng tử hoá các hệ số DCT, số liệu được “làm trơn”
bằng cách làm tròn. Việc mất mát số liệu xảy ra ở giai đoạn làm trơn này.
Bước 3: Nén số liệu đã biến đổi và làm trơn bằng cách mã hoá Entropy, ở
đây sử dụng các mã không tổn hao như mã Huffman, RLC,…
2.4 Tiêu chuẩn nén MPEG
2.4.1 Cấu trúc ảnh
MPEG định nghĩa các loại ảnh khác nhau cho phép sự linh hoạt để cân nhắc
giữa hiệu quả mã hoá và truy cập ngẫu nhiên. Các loại ảnh đó như sau:

a. ẢNH I: (Intra- Code Picture)
Các ảnh I được mã hoá theo mode intra để có thể giải mã mà không cần sử
dụng dữ liệu từ bất cứ một ảnh nào khác. Đặc điểm của phương pháp mã hoá này
như sau:
- Chỉ loại bỏ được sự dư thừa không gian.
- Dùng các điểm trong cùng một khung để dự báo.
- Không có bù chuyển động.
- Các thông tin được mã hoá rõ ràng, minh bạch nên số lượng bit yêu cầu lớn.
Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh
hay một chuỗi ảnh. Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm.
b. ẢNH P (Predictive Code Picture)
Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):
- Dự báo Inter một chiều.
- Ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả). Ảnh tham
chiếu này có thể là ảnh I hoặc ảnh P gần nhất.
- Có sử dụng bù chuyển động. Thông tin ước lượng chuyển động của các
khối nằm trong vector chuyển động (motion vector). Vector này xác định
Macroblock nào được sử dụng từ ảnh trước.

22


×