TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
CÔNG CỤ MULTIMEDIA
Giảng viên: Trần Nguyên Ngọc
Bộ môn: Truyền thông và Mạng máy tính
E-mail:
1
MULTIMEDIA
Những khái niệm cơ bản của Multimedia
Các dạng dữ liệu Multimedia
Văn bản.
Âm thanh.
Hình ảnh tĩnh và đồ họa.
Hình ảnh động.
Nén thông tin đa phương tiện và các chuẩn
Nhu cầu nén đa phương tiện
Nén không mất thông tin và nén mất thông tin
Phương pháp nén văn bản
Phương pháp nén âm thanh
Phương pháp nén ảnh tĩnh
Phương pháp nén ảnh động
2
1. Những khái niệm cơ bản của Multimedia
Khái niệm Multimedia
Lịch sử và đối tượng của Multimedia
Các dạng dữ liệu của kỹ thuật Multimedia
Các thiết bị Multimedia
Các lợi thế, hạn chế của kỹ thuật Multimedia
Các ứng dụng của kỹ thuật Multimedia
3
1.1 Khái niệm về công cụ Multimedia
Định nghĩa: Multimedia là kỹ thuật tích hợp trên một nền thống nhất các
dạng dữ liệu khác nhau với mục đích thao tác bằng các kỹ thuật tương
tác trực tiếp có sự hộ trợ của máy tính.
Các dạng dữ liệu: văn bản, âm thanh, hình ảnh tĩnh, hình ảnh động.
Thiết bị: CD-ROM, Disc…
Các thao tác:
Các thiết bị tính toán:
Tùy các dạng dữ liệu khác nhau, nhưng thao tác thích hợp.
Thu thập dữ liệu, xử lý dữ liệu, truyền dữ liệu, truy xuất dữ liệu (information retrieval).
Các thiết bị vật lý và phần mềm.
Xử lý số.
Tương tác trực quan:
Lựa chọn phần tử cần thao tác.
Thời điểm lựa chọn các phần tử thao tác.
4
1.2 Lịch sử và đối tượng của công cụ Multimedia
Lịch sử của kỹ thuật Multimedia
Multimedia là sự kết hợp của các kỹ thuật: âm thanh, hình ảnh, công
nghệ thông tin và truyền thông.
Ra đời vào những năm 80 khi xuất hiện các đĩa hình sử dụng kỹ
thuật tương tự và dùng để lưu trữ âm thanh, hình ảnh tĩnh và các
đoạn video.
Một số máy tính vào những năm 1990 cũng được gọi là multimedia
computer bởi nó có thể chứa đồng thời hàng trăm megabyte các
khuôn dạng dữ liệu khác nhau.
Nguyên nhân phát triển
Sử dụng được các kỹ thuật tiên tiến
Kỹ thuật lưu trữ
Kỹ thuật nén và giải nén dữ liệu
Kỹ thuật truyền dữ liệu
Khả năng tính toán và xử lý của máy tính tăng nhanh
5
1.2 Lịch sử và đối tượng của công cụ Multimedia
Công nghệ liên quan đến Multimedia
Các hệ thống multimedia
Các hệ thống truyền thông điệp Multimedia
Hội thảo truyền hình
Hiện thực ảo
Mạng Internet
Hiện thực ảo
Hội thảo truyền hình
Lasershow (kết hợp ánh sáng, hình ảnh, âm thanh)
6
1.2 Lịch sử và đối tượng của công cụ Multimedia
Đối tượng của Multimedia
Thu nhận, quản lý và thao tác các số, văn bản, âm thanh, đồ họa,
hình ảnh, video.
Yêu cầu
Thao tác trên các thiết bị khác nhau
Kết hợp kỹ thuật tương tự và kỹ thuật số
Lưu trữ và quản lý một số lượng lớn thông tin
Số hóa thông tin
Dung hòa khả năng lưu trữ thông tin, truyền thông tin, chất lượng và giá
thành
7
1.3 Các dạng dữ liệu Multimedia
Dữ liệu số
Các tín hiệu vật lý là liên tục theo thời gian
Quá trình xử lý trên máy tính là xử lý số
Vấn đề số hóa tín hiệu: chuyển tín hiệu tương tự thành tín hiệu số
Lấy mẫu
Lượng tử hóa
Vấn đề nảy sinh: sai số Mất mát thông tin
Định luật Nyquist - Shannon: Nếu tần số lấy mẫu lớn hơn hoặc bằng
2 tần số có ý nghĩa cao nhất thì mẫu lấy được sẽ phản ánh tốt nhất
tín hiệu ban đầu.
Ứng dụng trong các lĩnh vực lý thuyết thông tin, viễn thông và xử lý tín
hiệu.
8
1.3 Các dạng dữ liệu Multimedia
Các dạng dữ liệu multimedia
Các dạng dữ liệu truyền thống: văn bản, số liệu
Dữ liệu rời rạc
Âm thanh: tiếng ồn, âm nhạc, tiếng nói…
Tín hiệu âm thanh: tín hiệu một chiều liên tục
Số hóa tín hiệu âm thanh
Ảnh tĩnh: đồ họa, ảnh
Tín hiệu ảnh: tín hiệu hai chiều liên tục trên miền không gian
Số hóa ảnh
Ảnh động: hoạt hình, video
Chuỗi các ảnh
Tín hiệu theo thời gian, phụ thuộc vào hai chiều không gian và thời gian
9
1.4 Các thiết bị Multimedia
Các thiết bị số
Máy tính số
Các thiết bị số hóa video, audio
Các thiết bị tương tự
Video camera
Microphone
Videodisc (tape), Audiodisc (tape) player, recorder
Các thiết bị đồng bộ
Hỗ trợ đồng bộ về thời gian
Các thiết bị tương tác
Màn hình, chuột…
10
1.5 Mạng truyền thông đa phương tiện
Băng thông
Yêu cầu băng thông lớn… GbNetwork
Các công nghệ truyền dẫn băng thông rộng
B-ISDN, ATM
Thời gian thực
Độ tin cậy
Đảm bảo chất lượng dịch vụ, QoS
Các mô hình cung cấp dịch vụ
Các yêu cầu dịch vụ: băng thông 64 kbps, trễ cực đại 100 ms, tỷ lệ
lỗi cực đại 1%.
Voice over internet protocol (VoIP):
Băng thông: 24 kbps – 90 kbps
Trễ cực đại ~ 100 ms (chất lượng tốt) và không vượt quá 400 ms
Tỷ lệ mất gói tin ~ 4% - 5%
11
1.6 Ưu điểm và hạn chế của công nghệ Multimedia
Ưu điểm
Tích hợp trên một nền thống nhất các dạng dữ liệu khác nhau
Khả năng thao tác dữ liệu
Khả năng lưu trữ và trích xuất dữ liệu
Mức độ trung thực của các phiên bản dữ liệu
Dữ liệu số được biểu diễn trên cùng hệ nhị phân
Cấu trúc dữ liệu có nhiều nguồn gốc khác nhau
Nhược điểm
Các khuôn dạng dữ liệu khác nhau làm cho tính tương thích kém
Khó khăn trong việc quản lý quyền sở hữu cũng như kiểm soát
quyền sử dụng
Quá trình số hóa dữ liệu làm dữ liệu bị rời rạc hóa Sai số
12
1.7 Các ứng dụng của công nghệ Multimedia
Các hệ thống soạn thảo và sản xuất
Các hệ thống soạn thảo văn bản, bảng biểu
Các hệ thống xử lý số video
Các hệ thống trình diễn
Các phần mềm chương trình (PowerPoint)
Các hệ thống tương tác
Các hệ thư mục như: văn bản, âm thanh, hình ảnh, video
Các hệ thống dạy học
Các khóa học trực quan
Các lớp học trên mạng sử dụng công nghệ Multimedia
13
1.7 Các ứng dụng của công nghệ Multimedia
Các hệ mô phỏng
Hiện thực ảo
Các hệ thống mô phỏng: các hệ điều khiển, kỹ thuật hàng không, trò
chơi.
Trong truyền thông
Điện thoại qua mạng IP (VoIP)
Phân phối dữ liệu đa phương tiện qua mạng
Hội thảo truyền hình từ xa
Điện thoại truyền hình
14
Phụ lục
Dạng dữ liệu
Công cụ
Văn bản
Microsoft Office Word, Corel WordPerfect, Tex, Latex
Đồ họa
Corel Draw, Adobe Illustrator, Macromedia, Adobe ImageReady, Macromedia Flash
Ảnh
Adobe Photoshop, Macromedia Fireworks
Audio
Sony Sound Edit Pro, Sony Sound Forge for Windows, Sony Acid
Hoạt họa
Macromedia Flash, AutoDesk AutoCAD, Discreet 3D Studio (MAX)
Video
Adobe Premiere, Ulead Media Studio Pro, Microsoft Movie Maker, Apple iMovie
Xử lý nhiều kiểu dữ liệu
Macromedia Dreamweaver, Microsoft Front Page, Adobe Page Mill, Microsoft PowerPoint with
Producer
Các chương trình cho phép thao trên số, văn bản, hình ảnh, video
15
2. Các dạng dữ liệu Multimedia
Các dạng dữ liệu Multimedia gồm
Các dạng dữ liệu truyền thống: văn bản, số liệu…
Âm thanh: tiếng ồn, âm nhạc, tiếng nói…
Hình ảnh tĩnh: đồ họa, ảnh
Ảnh động: animation, video
16
2.1 Văn bản
Dữ liệu văn bản kinh điển: plain text
Đơn giản, không đòi hỏi phải xử lý nhiều.
Mã hóa bởi bộ mã ASCII, ISO/IEC 646 hoặc EBCDIC.
Chuyên dùng để tạo các tệp tin cấu hình, thư điện tử do tính tương thích cao.
Dạng Rich Text: kiểu chữ, cỡ chữ, màu chữ…
Các vấn đề
Nhập: gõ phím, tự động nhận dạng text.
Xử lý: tạo văn bản và chỉnh lý, biên tập theo nguyên tắc WYSIWYG (What
you see is what you get).
Lưu trữ: tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông
tin.
Hiển thị: hiển thị và cảm giác.
Vấn đề phổ biến: thường gặp sự không tương thích giữa các văn bản.
17
2.1 Văn bản
Biểu diễn văn bản
ASCII – American Standard Code for information interchange là
bộ mã mã hóa ký tự và hỗ trợ biểu diễn văn bản trên máy tính và
các thiết bị khác liên quan.
Trước khi ASCII được phát triển, người ta sử dụng các bộ mã để mã
hóa 26 ký tự, 10 chữ số và khoảng từ 11 – 25 biểu tượng đặc biệt, ngoài
ra còn một số các ký tự điều khiển khác nhằm tương tích với chuẩn
CCITT (Consultative Committee International Telephone and Telegraph)
CCITT ≥ 64 ký tự (tương đương với 6 bit).
Các công nghệ băng bấm lỗ thời bấy giờ cho phép 8 bit cùng được lưu
tại một vị trí.
Chính vì thế bên cạnh 7 bit biểu diễn cho một ký tự, chúng ta có thêm 1
bit khác gọi là parity bit để có thể sửa lỗi xảy ra trong quá trình truyền
dẫn.
18
2.1 Văn bản
Biểu diễn văn bản
Bảng mã ASCII: Sử dụng 7 bit để biểu diễn một ký tự, ngoài ra còn có một bit (parity bit) chuyên dùng để sửa lỗi.
19
2.1 Văn bản
Biểu diễn văn bản
Mã Unicode
Bộ mã chuẩn dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ trên thế
giới.
Hỗ trợ các ký tự tượng hình phức tạp như tiếng Trung Quốc, tiếng Thái.
Unicode chiếm 1.114.112 ((16+1)*65536) code point, đã gán 96000 mã chữ.
Unicode chia làm 17 mặt phẳng. Mỗi mặt gồm 65536 code point.
20
2.1. Văn bản
Mã Unicode ( tiếp )
256 mã đầu tiên phù hợp với ISO 8859-1
17 mặt phẳng gồm :
Mặt phẳng đầu tiên (plane 0), "Mặt phẳng đa ngôn ngữ căn bản" (Basic
Multilingual Plane - BMP), là nơi mà đa số các ký hiệu được gán mã.
BMP chứa các ký hiệu cho hầu hết các ngôn ngữ hiện đại đặc biệt là các
ngôn ngữ CJKV (Hán-Nhật-Hàn-Việt).
Hai mặt phẳng tiếp theo được dùng cho các ký tự "đồ họa".
Mặt phẳng 1, "Mặt phẳng đa ngôn ngữ bổ sung" (Supplementary Multilingual
Plane - SMP), được dùng chủ yếu cho các loại chữ viết cổ, ví dụ Egyptian
hieroglyph (chưa được mã hóa), nhưng cũng còn được dùng cho các ký hiệu
âm nhạc.
Mặt phẳng 2, (Supplementary Ideographic Plane - SIP), được dùng cho
khoảng 40000 chữ Trung Quốc ít gặp mà đa số là các ký hiệu cổ, ngoài ra
cũng có một số ký hiệu hiện đại.
Mặt phẳng 14 hiện chứa một số các ký tự thẻ ngôn ngữ không được
khuyến khích và một số ký hiệu lựa chọn biến thể.
Mặt phẳng 15 và Mặt phẳng 16 được mở cho các sử dụng cá nhân.
21
2.1 Văn bản
Các dạng mã Unicode : UTF-32, UTF-16 và UTF-8
UTF-32 : sử dụng 32 bit cho mỗi ký tự, được gọi là
UTF-32 và ISO/IEC 10646 gọi là UCS-4
UTF-16/UCS-2
Mã hóa dùng Unicode 20 bit. Trong Windows NT, CE người ta dùng
16 bit để mã hóa các ký tự BMP.
Một code point có 20 bit được chia làm hai nhóm 10 bit:
Most Significant: U+D800 – U+DBFF
Least Significant: U+DC00 – U+DFFF
D800 DC00 U+00010000
DBFF DFFF U+0010FFFF
Bộ mã sử dụng cặp thay thế UTF-16
22
2.1 Văn bản
UTF-8
Mã hóa các xâu ký tự theo UCS hoặc Unicode theo dạng mỗi ký tự
dùng 2 hoặc 4 byte – tương ứng các sơ đồ mã hóa UCS-2 và UCS-4.
UTF-8 được thiết kế để tương thích với chuẩn ASCII. UTF-8 có thể
sử dụng từ một (ASCII) cho đến 6 byte để biểu diễn một ký tự.
tương thích với các hệ thống hiện tại
Sơ đồ mã hóa UTF-8
U+0000 – U+007F: các ký tự ASCII.
Các ký tự > U+007F được mã hóa thành một dãy các byte có các
nhóm bit đặc biệt sao cho không có byte nào của ASCII xuất hiện
trong thành phần các ký tự này.
Byte đầu tiên của các ký tự nhiều byte luôn bắt đầu từ 0xC0 đến
0xFD.
Byte đầu chỉ rõ có bao nhiêu byte sẽ theo sau byte này trong
chuỗi mã của ký tự đang xét. Ví dụ: byte đầu là 11110xxx: có
nghĩa ký tự này sẽ được mã hóa bằng chuỗi bit bao gồm 4 byte.
Các byte sau sẽ có giá trị từ 0x80 đến 0xBF.
23
2.1 Văn bản
Sơ đồ mã hóa UTF-8
U+00000000 – U+0000007F: 0xxxxxxx
U+00000080 – U+000007FF: 110xxxxx 10xxxxxx
U+00000800 – U+0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U+00010000 – U+0010FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U+00200000 – U+03FFFFFF: 111110xx 10xxxxxx 10xxxxxx
10xxxxxx 10xxxxxx
U+04000000 – U+7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx
10xxxxxx 10xxxxxx 10xxxxxx
U+00A9 1010 1001 UTF-8: 11000010 10101001
U+2260 10 0010 0110 0000 UTF-8: 11100010 10001001
10100000 = 0xE2 0x89 0xA0
24
2.1 Văn bản
Các phiên bản Unicode
1991 Unicode 1.0
1993 Unicode 1.1
1996 Unicode 2.0
1998 Unicode 2.1
2000 Unicode 3.0
2001 Unicode 3.1
2002 Unicode 3.2
2003 Unicode 4.0
25