Tải bản đầy đủ (.pdf) (41 trang)

Bài giảng xử lý âm thanh và hình ảnh-p5 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 41 trang )

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


43

Chương 3: Kỹ thuật xử lý ảnh
3.1. Giới thiệu chung
3.1.1. Khái niệm cơ bản về ảnh và xử lý ảnh, video
Đứng trên góc độ cảm nhận của thị giác, ảnh là một sự vật đại diện cho người,
sinh vật hay một đồ vật nào đó… Đứng trên góc độ kỹ thuật thì ảnh được nhận biết thông
qua hệ thống thị giác hai chiều. Ảnh động (video) như đã thấy trên truyền hình, phim ảnh
là tập hợp của nhiều ảnh liên tiếp. Khi một ảnh được số hoá thì nó trở thành ảnh số và
ảnh số này lại là tập hợp của các phần tử ảnh nhỏ được gọi là điểm ảnh “pixel”. Mỗi điểm
ảnh lại được biểu diễn dưới dạng một số hữu hạn các bit. Ta có thể chia thành 3 loại ảnh
khác nhau:

• Ảnh đen trắng: mỗi điểm ảnh được biểu diễn bởi 1 bit, các ảnh này đôi khi
còn được gọi là Bi-level hoặc Bi-tonal images.
• Ảnh Gray-scale: mỗi điểm ảnh được biểu diễn bằng các mức chói khác
nhau, thường thì được biểu diễn bằng 256 mức chói hay 8 bit cho mỗi điểm
ảnh.
• Ảnh màu: mỗi điểm ảnh màu được chia ra gồm 1 tín hiệu chói và các tín
hiệu màu.

Biểu diễn ảnh số
Một mẫu tín hiệu hai chiều có thể mô tả bằng một dãy hai chiều , ký
hiệu . Trong đó

là các số nguyên, và là khoảng cách các mẫu của
mành và dòng. Cường độ của tín hiệu được đặc trưng bởi độ cao của toạ độ ô
.


Đối với ảnh đen trắng thì ảnh được biểu diễn bằng một hàm cường độ sáng hai
chiều , trong đó là các giá trị tọa độ không gian và giá trị tại bất kỳ của một
điểm sẽ tỉ lệ với độ sáng (mức xám) của ảnh tại điểm này. Đôi khi, người ta còn
biểu diễn hàm ảnh với một trục thứ 3 là cường độ sáng.

Hình 3.1: Biểu diễn ảnh bằng hàm


Một ảnh số là một ảnh được gián đoạn theo không gian và độ sáng.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


44

Nếu



là một số hiện hữu các giá trị rời rạc, chúng ta có ảnh số. Một ảnh số
được xem như là một ma trận với hàng và cột biểu diễn một điểm trong ảnh và giá trị
điểm ma trận tương ứng mức xám tại điểm đó. Các phần tử của một dãy số như thế được
gọi là các điểm ảnh (pixels).
Lĩnh vực xử lý ảnh đề cập đến việc xử lý ảnh bằng máy tính số. Trong thực tế,
người ta phân chia thành ba loại xử lý của máy tính trong quá trình liên tục từ: mức thấp,
mức trung, đến mức cao.
- Quá trình xử lý mức thấp liên quan đến những hoạt động như là tiền xử lý ảnh để
giảm nhiễu, tăng độ sáng. Một quá trình xử lý thấp có đặc điểm là cả đầu vào và đầu
ra của nó đều là hình ảnh.
- Xử lý ảnh mức trung liên quan đến công việc như phân đoạn ảnh (segmentation), mô
tả những đối tượng và đưa chúng vào một mẫu thích hợp cho các máy tính xử lý, và

phân loại từng đối tượng. Mức trung có đặc điểm đầu vào của nó thường là hình ảnh,
nhưng kết quả đầu ra của nó là thuộc tính trích ra từ những hình ảnh (ví dụ như các
cạnh, đường viền của ảnh, và nhận dạng của các đối tượng cá nhân).
- Xử lý ảnh mức cao liên quan đến việc "tạo cảm nhận" của một tập các đối tượng
nhận dạng, như trong phân tích ảnh, và xa hơn là quá trình thực hiện các chức năng
nhận dạng thông thường gắn với hệ thống thị giác của con người.

3.1.2. Các ứng dụng phổ biến của xử lý ảnh
Máy tính đủ mạnh đầu tiên để thực hiện nhiệm vụ xử lý ảnh xuất hiện vào những
năm đầu của thập kỷ 60, thế kỷ 20. Xử lý ảnh bằng máy tính đã được thực hiện tại Phòng
thí nghiệm Jet Propulsion (Pasadena, California) vào năm 1964 về hình ảnh của mặt
trăng được truyền bởi Ranger 7 từ khoảng không vũ trụ. Hình 3.2 hiển thị hình ảnh đầu
tiên của mặt trăng đưa bởi Ranger 7 lúc 9h09’ sáng ngày 31 tháng 6 năm1964.


Hình 3.2: Hình ảnh đầu tiên của mặt trăng do tàu vũ trụ Ranger 7 chụp

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


45

Từ những năm 1960s cho đến nay, xử lý ảnh đã phát triển mạnh mẽ. Ngoài các
ứng dụng trong lĩnh vực y khoa, thám hiểm không gian vũ trụ, thiên văn học, địa lý (phát
hiện các nguồn tài nguyên thiên nhiên), dự báo thời tiết, xử lý ảnh số hiện nay đang được
sử dụng đa dạng trong nhiều lĩnh vực ứng dụng khác nhau.

Xử lý ảnh dùng tia Gamma

Chủ yếu ứng dụng trong y học hạt nhân và quan sát thiên văn. Trong y học hạt

nhân, cách tiếp cận ở đây là tiêm vào người bệnh chất đồng vị phóng xạ phát ra các tia
gamma khi bị phân rã. Các hình ảnh được tạo ra từ việc thu thập các bức xạ bởi bộ phát
hiện tia gamma. Hình ảnh có được bằng sử dụng tia Gamma ở hình vẽ 3.3 dưới đây cho
thấy bệnh nhân có một khối u trong não và trong phổi qua các đốm nhỏ màu trắng.

Hình 3.3: Hình ảnh bệnh nhân dùng tia Gamma

Xử lý ảnh dùng X-quang

X-quang là một trong các phát minh lâu đời nhất của việc dùng nguồn bức xạ sóng
điện từ cho việc tạo ra ảnh. Trong y khoa, X-quang rất phù hợp cho việc chẩn đoán bệnh
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


46

và được dùng khá phổ biến. Ngoài ra X-quang cũng được sử dụng rộng rãi trong các
ngành công nghiệp khác

Hình 3.4: Minh họa về các ảnh chụp bằng X-quang

Xử lý ảnh trong băng cực tím

Các ứng dụng của "ánh sáng" cực tím là rất đa dạng. Chúng bao gồm điêu khắc,
kiểm tra công nghiệp, kính hiển vi, laser, xử lý ảnh sinh học, và thiên văn học. Hình vẽ
3.5 dưới đây mô tả xử lý ảnh bằng tia cực tím giúp phát hiện được bệnh nấm Smut ở cây
ngô (hình bên phải) – một loại bệnh khá phổ biến ở các cây ngũ cốc.


Hình 3.5: Xử lý ảnh bằng tia cực tím


Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


47

Xử lý ảnh trong băng hồng ngoại

Xem xét đến các băng nhìn thấy được của quang phổ điện từ là rất gần gũi với
hoạt động của tất cả chúng ta. Băng hồng ngoại thường được sử dụng cùng với xử lý ảnh
trực quan, vì vậy xử lý ảnh trong băng hồng ngoại được ứng dụng khá nhiều trong thiên
văn vũ trụ, cảm biến từ xa, kính hiển vi…

Quan trắc thời tiết và dự đoán là một trong những ứng dụng chính của xử lý ảnh
hồng ngoại. Ở hình vẽ 3.6 là ảnh của một cơn bão cung cấp bởi một vệ tinh Hải dương
học và khí tượng Quốc gia (NOAA). Vệ tinh này sử dụng các cảm biến hồng ngoại và
mắt của cơn bão đó nhìn rõ trong hình ảnh này.




Hình 3.6: Xử lý ảnh trong băng hồng ngoại

Xử lý ảnh trong băng vi ba

Ứng dụng chính của xử lý ảnh trong băng vi ba là Radar. Tính đặc trưng của xử lý
ảnh bằng Radar là khả năng thu thập dữ liệu bất kỳ ở đâu bất cứ lúc nào, bất kể thời
tiết hay điều kiện ánh sáng. Một số sóng Radar có thể thâm nhập đám mây, và dưới
điều kiện nhất định cũng có thể xuyên qua thảm thực vật, băng, cát rất khô. Trong
nhiều trường hợp, Radar là cách duy nhất để thám hiểm các vùng trên bề mặt Trái

đất.
Hình 3.7 minh họa ảnh bằng Radar trên vùng núi khu vực đông nam của Tây
Tạng, cách 90 km về phía đông của thành phố của Lhasa.

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


48



Hình 3.7: Ảnh Radar một vùng núi Tây Tạng
Xử lý ảnh trong băng radio

Các ứng dụng chính của xử lý ảnh trong băng radio chủ yếu trong y khoa và thiên
văn học. Trong lĩnh vực y khoa, các sóng radio được sử dụng trong chụp ảnh cộng hưởng
từ (MRI). Ở đây, bệnh nhân được đặt trong từ trường mạnh và các sóng radio ở dạng các
xung ngắn được truyền qua cơ thể người bệnh. Mỗi xung đáp ứng của một sóng vô tuyến
của bệnh nhân phát giá. Sự định vị bắt nguồn từ các tín hiệu mạnh của chúng được xác
định bởi một máy tính, nó cung cấp một ảnh bệnh nhân hai chiều. MRI có thể cung cấp
ảnh trong mọi mặt phẳng.



Hình 3.8: Ảnh chụp cộng hưởng từ đầu gối của bệnh nhân

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


49


3.1.3. Các bước xử lý ảnh số
Các bước xử lý ảnh số được mô tả ở hình vẽ 3.9 dưới đây.

Hình 3.9: Các bước xử lý ảnh số
Tiếp theo đây là mô tả tóm tắt các giai đoạn chính trong xử lý ảnh:

1. Thu nhận hình ảnh: Đây là giai đoạn đầu tiên và quan trọng nhất trong tòan bộ
quá trình xử lý ảnh. Ảnh nhận được tại đây chính là ảnh gốc để đưa vào xử lý tại các giai
đoạn sau, trường hợp ảnh gốc có chất lượng kém hiệu quả của các bước xử lý tiếp theo sẽ
bị giảm. Thiết bị thu nhận có thể là các ống ghi hình chân không (vidicon, plumbicon )
hoặc CCD (Charge-Coupled Device).

2. Tiền xử lý ảnh: Giai đoạn xử lý tương đối đơn giản nhằm nâng cao chất lượng
ảnh để trợ giúp cho các quá trình xử lý nâng cao tiếp theo, ví dụ: tăng độ tương phản, làm
nổi đường biên, khử nhiễu …

3. Phân đoạn: là quá trình tách hình ảnh thành các phần hoặc vật thể riêng biệt.
Đây là một trong nhưng vấn đề khó giải quyết nhất trong lĩnh vực xử lý ảnh. Nếu thực
hiện tách quá chi tiết thì bài toán nhận dạng các thành phần được tách ra trở nên phức tạp,
còn ngược lại nếu quá trình phân đoạn được thực hiện quá thô hoặc phân đoạn sai thì kết
quả nhận được cuối cùng sẽ không chính xác.

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


50

4. Biểu diễn và mô tả: là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các vật
thể sau khi phân đoạn có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên ranh giới

một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó. Phương pháp mô tả
thông qua ranh giới vùng thường được sử dụng khi cần tập trung sự chú ý vào hình dạng
bên ngòai của chi tiết ảnh như độ cong, các góc cạnh… Biểu diễn vùng thường được sử
dụng khi chúng ta quan tâm tới đặc tính bên trong của vùng ảnh như đường vân (texture)
hay hình dạng (skeletal).

5. Nén ảnh: bao gồm các biện pháp giảm thiểu dung lượng bộ nhớ cần thiết để lưu
trữ hình ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tín hiệu hình ảnh số.

6. Nhận dạng: là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả vật thể
đó (ví dụ các phương tiện giao thông có trong ảnh).

3.1.4. Các thành phần của hệ thống xử lý ảnh số
Cấu trúc của một hệ thống xử lý ảnh số được mô tả ở hình vẽ 3.10 dưới đây.

Hình 3.10: Các thành phần chính của hệ thống xử lý ảnh số

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


51

Thiết bị thu nhận hình ảnh: là thiết bị biến đổi quang-điện, cho phép biến đổi hình ảnh
quang học thành tín hiệu điện dưới dạng analog hay trực tiếp dưới dạng số. Có nhiều
dạng cảm biến cho phép làm việc với ánh sáng nhìn thấy hoặc hồng ngoại. Hai loại thiết
bị biến đổi quang – điện chủ yếu thường được sử dụng là đèn ghi hình điện tử và CCD.

Bộ nhớ trong và ngoài: các hệ thống xử lý ảnh số thường có dung lượng rất lớn dùng để
lưu trữ ảnh tĩnh và động dưới dạng số. Ví dụ, để lưu một ảnh số đen trắng kích thước
1024x1024 điểm, mỗi điểm được mã hóa bằng 8 bits cần bộ nhớ ~1MB. Để lưu một ảnh

màu không nén, dung lượng bộ nhớ phải tăng lên gấp 3. Bộ nhớ số trong hệ thống xử lý
ảnh có thể chia làm 3 loại: 1- bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý.
Bộ nhớ này phải có khả năng ghi/đọc rất nhanh (ví dụ 25 hình/s); 2- bộ nhớ ngoài có tốc
độ truy cập tương đối nhanh, dùng để lưu thông tin thường dùng. Các bộ nhớ ngoài có thể
là ổ cứng, thẻ nhớ flash 3- Bộ nhớ dùng để lưu trữ dữ liệu. Loại bộ nhớ này thường có
dung lượng lớn, tốc độ truy cập không cao. Thông dụng nhất là đĩa quang ghi 1 lần
(ROM) hoặc nhiều lần (ROM) như đĩa DVD có dung lượng 4.7GB (một mặt). Ngoài ra
trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu ảnh trên vật liệu khác như
giấy in, giấy in nhiệt, giấy trong, đó có thể là máy in phun, in laser, in trên giấy ảnh đặc
biệt bằng công nghệ nung nóng …

Bộ xử lý ảnh chuyên dụng: Sử dụng chip xử lý ảnh chuyên dụng, có khả năng thực hiện
nhanh các lệnh chuyên dùng trong xử lý ảnh. Cho phép thực hiện các quá trình xử lý ảnh
như lọc, làm nổi đường bao, nén và giải nén video số…Trong bộ xử lý ảnh thường tích
hợp bộ nhớ đệm có tốc độ cao.

Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen trắng cũng như
màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin của ảnh (tín hiệu video) thành
hình ảnh trên màn hình. Có hai dạng display được sử dụng rộng rãi là đèn hình CRT
(Cathode-Ray Tube) và màn hình tinh thể lỏng LCD (Liquid Crystal Display). Đèn hình
CRT thường có khả năng hiển thị màu sắc tốt hơn màn hình LCD nên được dùng phổ
biến trong các hệ thống xử lý ảnh chuyên nghiệp.

Máy tính: có thể là máy tính để bàn cũng như siêu máy tính có chức năng điều khiển tất
cả các bộ phận chức năng trong hệ thống xử lý ảnh số.

3.1.5. Đồ họa và các kiểu dữ liệu ảnh
Số lượng các định dạng tập tin được sử dụng trong truyền thông đa phương tiện
liên tục phát triển. Bảng 3.1dưới đây cho thấy một danh sách các định dạng file phổ biến
sử dụng trong sản phẩm Macromedia Director. Ở đây, chúng ta chỉ tập trung giới thiệu

một số định dạng tập tin phổ biến như GIF và định dạng hình ảnh JPG.

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


52

Bảng 3.1: Các định dạng file

3.1.5.1. Hình ảnh 1-bit

Hình ảnh bao gồm các điểm ảnh, hoặc Pels hình ảnh- phần tử trong hình ảnh kỹ
thuật số. Một hình ảnh 1-bit bao gồm các bit on và off và do đó là loại đơn giản nhất của
hình ảnh. Mỗi pixel được lưu giữ như là một bit duy nhất (0 hay 1). Do đó, do vậy một
hình ảnh cũng được gọi như là một hình ảnh nhị phân.
Nó cũng được gọi là một hình ảnh đơn sắc-1, vì nó không chứa màu sắc. Hình
3.11 cho thấy một hình ảnh đơn sắc 1-bit (các nhà khoa học đa phương tiện gọi là "Lena"
- đây là một hình ảnh tiêu chuẩn được sử dụng để minh họa nhiều thuật toán). Một hình
ảnh kích thước 640 x 480 đơn sắc đòi hỏi 38,4 Kb dung lượng lưu trữ (640 x 480/8).
Hình ảnh đơn sắc 1-bit chỉ tốt cho hình có chứa đồ họa đơn giản và văn bản.

Hình 3.10: Bức ảnh Lena đơn sắc 1 bit
File Import File Export Native
Image Palette Sound Video Anim. Image Video
.BMP,
.DIB,
.GIF,
.JPG,
.PICT,
.PNG,

.PNT,
.PSD,
.TGA,
.TIFF,
.WMF
.PAL
.ACT
.AIFF
.AU
.MP3
.WAV
.AVI
.MOV
.DIR
.FLA
.FLC
.FLI
.GIF
.PPT
.BMP .AVI
.MOV
.DIR
.DXR
.EXE
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


53

3.1.5.2. Ảnh thang độ xám 8-Bit


Xem xét một hình ảnh 8-bit, mỗi một điểm ảnh có giá trị mức xám (Gray level)
giữa 0 và 255. Mỗi pixel được đại diện bởi một byte duy nhất - ví dụ, một điểm ảnh tối có
thể có giá trị 10, và một điểm ảnh sáng có thể là 230.

Toàn bộ hình ảnh có thể được xem như một mảng hai chiều của các giá trị pixel.
Chúng ta tham khảo một mảng như bitmap, - một đại diện của các đồ họa / dữ liệu hình
ảnh song song với cách thức mà nó được lưu trữ trong bộ nhớ video.

Chúng ta có thể xem hình ảnh 8-bit như là một tập hợp các mặt phẳng bit
(bitplanes) 1 bit. Hình 3.11 mô tả khái niệm về các mặt phẳng bit. Mỗi một mặt phẳng bit
có thể có giá trị 0 hoặc 1 tại mỗi pixel, nhưng cùng với tất cả các bitplanes tạo thành một
byte duy nhất để lưu trữ giá trị mức xám từ 0 đến 255.

Hình 3.11: Các mặt phẳng bit cho hình ảnh 8-bit thang độ xám.

Như vậy, mỗi điểm ảnh thường được lưu trữ như là một byte (cho một giá trị mức
xám giữa 0-255), do đó, một ảnh thang độ xám 640 x 480 đòi hỏi dung lượng lưu trữ hơn
300 Kb (640 x 480 x 8 = 307.200 Kb). Hình 3.12 minh họa một lần nữa hình ảnh Lena
theo thang độ xám.

Hình 3.12: Hình ảnh thang độ xám của Lena.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


54

3.1.5.3. Ảnh 24 bít màu

Trong một hình ảnh 24-bit màu, mỗi điểm ảnh được đại diện bởi 3 byte, thường là

đại diện cho RGB. Vì mỗi giá trị trong khoảng 0-255, định dạng này hỗ trợ 256 x 256 x
256, hoặc tổng số 16.777.216 màu sắc có thể kết hợp . Tuy nhiên, như sự linh hoạt dẫn
đến bất lợi trong việc lưu trữ vì: một hình ảnh 640 x 480 24-bit màu sẽ yêu cầu 921,6 Kb
dung lượng lưu trữ.
Hình 3.13 minh họa một đám cháy rừng qua một hình ảnh 24-bit trong Microsoft
Windows định dạng BMP (forestfire. bmp).


Hình 3.13: Hình ảnh có độ phân giải màu sắc cao và
các ảnh màu sắc từ các kênh R, G, B
3.1.5.4. Ảnh mầu 8 bit

Khi lưu trữ ảnh là vấn đề quan tâm thì nhiều hệ thống có thể chỉ dùng 8 bit thông
tin màu (gọi là "256 màu sắc") trong việc thể hiện ảnh trên màn hình. Lúc này một ảnh
mầu 640 x 480 8-bit chỉ đòi hỏi dung lượng 300 Kb, so với 921,6 Kb cho một hình ảnh
màu 24 bit mà chưa cần áp dụng một giải pháp nén bất kỳ nào.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


55


Hình 3.14 cho thấy hình ảnh 8-bit theo định dạng GIF và chúng ta thấy rằng rất khó
để phân biệt sự khác nhau giữa hình ảnh 24-bit mầu (3.13), và hình ảnh 8-bit mầu (3.14).


Hình 3.14: Hình ảnh 8-bit màu

3.1.5.5. Các định dạng file ảnh phổ biến


Định dạng
GIF (
Graphics Interchange Format): được đưa ra bởi Công ty Unisys và
Compuserve, ban đầu để truyền các hình ảnh đồ họa trên đường dây điện thoại thông qua
Modem. Các tiêu chuẩn GIF sử dụng thuật toán nén Lempel-Ziv-Welch và được giới hạn
cho 256 màu (8 bit). Trong thực tế, GIF có hai chuẩn: GIF87a (Phiên bản kỹ thuật ban
đầu) và GIF89a – Phiên bản mở rộng hỗ trợ cho hoạt hình đơn giản.

Định dạng JPEG: Các tiêu chuẩn hiện hành quan trọng nhất cho nén hình ảnh là JPEG,
tiêu chuẩn này được tạo ra bởi một nhóm làm việc của Tổ chức tiêu chuẩn quốc tế (ISO)
đã được chính thức gọi là Joint Photographic Experts Group và do đó các file ảnh được
tạo ra theo chuẩn nén JPEG có tên định dạng jpeg. JPEG cho phép người dùng thiết lập
một mức độ mong muốn về chất lượng, hoặc tỉ lệ nén.

Định dạng PNG (Portable Network Graphics): Xuất phát từ sự phổ biến của Internet
nhằm hỗ trợ nhiều hơn cho các định dạng hình ảnh hệ thống độc lập. Tiêu chuẩn PNG có
thể thay thế các tiêu chuẩn GIF và hỗ trợ lên đến 48 bit thông tin màu sắc.

Định dạng
TIFF (
Tagged Image File Format): là một tập tin định dạng phổ biến hình
ảnh. Phát triển bởi Công ty Aldus vào những năm 1980, sau đó nó đã được hỗ trợ bởi
Microsoft. TIFF có thể lưu trữ nhiều loại khác nhau của hình ảnh: 1-bit, màu xám, 8-bit,
24-bit RGB.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


56

Định dạng

EXIF (
Exchange Image File): là một định dạng hình ảnh cho máy ảnh kỹ
thuật số. Ban đầu phát triển vào năm 1995, phiên bản hiện tại của nó (2.2) đã được đưa
ra vào năm 2002 bởi các hãng điện tử Nhật Bản và Informa - Hiệp hội Công nghiệp Công
nghệ (JEITA). Nén các tập tin EXIF sử dụng chuẩn nén JPEG.

Định dạng Windows WMF
(Windows Metafile): là định dạng file gốc cho môi trường hệ
điều hành Microsoft Windows. Tệp tin WMF thực sự bao gồm một tập hợp các hàm giao
diện thiết bị đồ họa (GDI), cũng có nguồn gốc ở các môi trường Windows. Khi chơi
(play) một tập tin WMF (thông thường bằng cách sử dụng hàm Windows PlayMetaFile())
các đồ họa mô tả được trả lại.

Định dạng Windows BMP (Bitmap): là tiêu chuẩn hệ thống định dạng tập tin đồ họa lớn
cho Microsoft Windows, được sử dụng trong Microsoft Paint và chương trình khác. Nó
có thể lưu trữ ảnh 24-bit bitmap khá hiệu quả. Tuy nhiên lưu ý BMP có có rất nhiều chế
độ khác nhau, bao gồm cả không nén hình ảnh 24-bit.

3.1.6. Mầu sắc trong ảnh và video

Ánh sáng là một dạng sóng điện từ và màu sắc của nó được đặc trưng bởi các
bước sóng. Ánh sáng Laser chỉ có một bước sóng đơn - ví dụ, Laser Ruby tạo ra một
chùm tia sáng màu đỏ tươi. Ngược lại, phần lớn các nguồn ánh sáng có nhiều bước sóng.
Con người không thể phát hiện tất cả các ánh sáng – mà chỉ có các anh sáng có bước
sóng thuộc vùng nhìn thấy được. Bước sóng ngắn tạo ra một cảm giác màu xanh, và
bước sóng dài tạo ra một cảm giác màu đỏ.

Ánh sáng nhìn thấy được là một dạng sóng điện từ có bước sóng trong khoảng
400-700 nm. Hình 3.15 minh họa cho thấy mối quan hệ về công suất tương đối của từng
bước sóng có trong thành phần của ánh sáng ban ngày. Đường cong này được gọi là phân

bố năng lượng quang phổ (SPD), hoặc quang phổ của ánh sáng E (
λ
) tại mỗi bước sóng
λ
.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


57


Hình 3.15: Phân bố năng lượng quang phổ của ánh sáng ban ngày.

3.1.6.1. Các mô hình màu trong ảnh


Các lý thuyết về mầu sắc chỉ ra rằng bất kỳ một màu nào đều có thể được tổng hợp
từ ba màu chính, cơ bản có cường độ tương thích đó là ba màu: Đỏ (Red); Xanh lá cây
(Green) và Xanh lơ (Blue). Thông tin về ba mầu cơ bản được minh họa ở hình 3.16 dưới
đây. Ngược lại bất kỳ màu sắc nào cũng đều có thể phân chia thành ba mầu cơ bản R, G
và B.

Hình 3.16: Các mầu cơ bản

Mô hình cộng màu RGB

Mô hình cộng mầu RGB được mô tả ở hình vẽ 3.17. Theo đó chúng ta có một số
nguyên tắc cộng màu như sau:
Magenta = Red + Blue
Cyan = Blue + Green

Yellow = Green + Red
White = Red + Blue + Green
Mầu
Đỏ (R)
Xanh lơ (B)
Xanh lá cây (G)
615
470
532
Bước sóng, 10
-
9
m
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


58


Hình 3.17: Mô hình cộng màu RGB

Mô hình màu loại trừ CMY
Mô hình loại trừ màu CMY (C: Cyan-Màu lục lam; M: Magenta-Màu đỏ tươi; Y:
Yellow-Màu vàng) được mô tả ở hình vẽ 3.18. Theo đó chúng ta có một số nguyên tắc
trừ màu như sau:
Magenta = White - Green
Cyan = White - Red
Yellow = White - Blue
Black = Red + Blue + Green



Hình 3.17: Mô hình trừ màu CMY

Chuyển đổi từ RGB thành CMY

Một số hệ tọa độ mầu quan trọng có thể được chuyển đổi sang nhau thông qua một
số phép biến đổi đơn giản. Ví dụ như chuyển đổi từ RGB thành CMY, người ta sử dụng
quan hệ:

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


59



(3.1
)

Ngược lại khi chuyển từ CMY thành RGB, người ta sử dụng quan hệ:



(3
.2)1)
3.1.6.2. Các mô hình màu trong Video

Các ảnh, trước khi được truyền đi, phải được quét với 3 thiết bị quang, mà mỗi
một trong số chúng đều có một bộ lọc màu khác nhau đặt ở phía trước của thiết bị. Ba
kênh (R, G, B) được hiệu chỉnh sao cho nếu một vùng trắng đều được quét, thì cả 3 đầu

ra phải có điện áp cân bằng nhau.

Bởi vì mắt người có độ nhạy khác nhau đối với các màu có cùng cường độ, nên độ
chói phải được bổ sung thêm các trọng số. Độ chói của tín hiệu Y được xác định bởi:

Y= 0.299R+0.587G+0.114B (3.3)


Thông tin về bão hoà màu cũng đã được xác định cùng với độ chói; để tránh việc
truyền nhiều lần về bão hòa màu, nó sẽ bị loại trừ ra khỏi các thành phần của màu. Các
thành phần hiệu màu cần một băng tần truyền thấp hơn so với thông tin độ chói, bởi vì
mắt người không thể phân tích được nhiều chi tiết màu như chi tiết độ chói.

Do một sắc màu được xác định nếu hai trong số ba màu cơ bản được biết, cho nên
người ta chỉ cần truyền đi thông tin của 2 tín hiệu hiệu màu. Màu cơ bản thứ 3 sẽ được
tính toán lại tại phía thu. Từ đây, người ta đưa ra một số mô hình màu khác nhau trong
truyền dẫn tín hiệu video.

Mô hình màu YUV

Ban đầu, mô hình YUV được sử dụng cho tín hiệu video tương tự hệ PAL. Một
phiên bản của YUV hiện nay cũng được sử dụng trong tiêu chuẩn CCIR 601 cho video
kỹ thuật số.
Đầu tiên, nó mã hóa tín hiệu độ chói Y theo biểu thức (4.3) và tiếp theo đó các tín
hiệu hiệu mầu U, V được xác định theo biểu thức 4.4 dưới đây.




(3.4)


Từ các biểu thức (4.3) và (4.4) ta có:

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


60




(3.5)


Trong các tín hiệu PAL tương tự, băng thông 1,3 MHz được giành cho các tín
hiệu hiệu mầu U và V, trong khi đó băng tần 5,5 MHz được dành riêng cho các tín hiệu
độ chói Y. Với tín hiệu video số, 8 bit được giành cho Y và 4 bit cho các tín hiệu U, V.

Mô hình màu YIQ

YIQ được dùng trong truyền hình màu hệ NTSC. Mặc dù U và V được định nghĩa
khá đơn giản, nhưng nó không nắm bắt được hệ thống phân cấp bậc thấp nhất về độ nhạy
hiển thị của con người. NTSC đã sử dụng I và Q thay thế. YIQ được xem như là một
phiên bản của YUV, với cùng một Y nhưng với U và V được quay đi góc 33 °.




(3.6)


Điều này dẫn đến các ma trận biến đổi sau đây:



(3.7)

NTSC cấp phát băng thông 4,2 MHz cho tín hiệu độ chói Y; 1,5 MHz cho tín hiệu
hiệu màu I và 0,6 MHz cho tín hiệu Q. Tuy nhiên, hiện nay cả I và Q đều được cấp phát
băng thông 1,0 MHz.

Mô hình màu YCbCr

Chuẩn quốc tế chính thức cho các tín hiệu video số thành phần là Khuyến nghị
ITU-R BT.601-4 (được gọi là "Rec. 601"). Tiêu chuẩn này dùng một không gian màu
YCbCr. Biến đổi YCbCr được sử dụng trong nén ảnh JPEG và nén video MPEG và có
liên quan đến biến đổi YUV. Cụ thể như sau:



(3.8)

Khi đó, chúng ta có:




(3.9)

3.1.7. Cơ bản về Video


Tín hiệu Video nói chung được sử dụng trong rất nhiều lĩnh vực: truyền hình,
truyền hình quảng bá, truyền hình vệ tinh, truyền hình di động… Với công nghệ phát
triển ngày nay thì tín hiệu Video được sử dụng rộng rãi đặc biệt là Video số.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


61

3.1.7.1. Các loại tín hiệu Video

Các tín hiệu Video có thể được tổ chức theo ba cách khác nhau: Video thành phần
(Component Video); Video tổ hợp (Composite Video) và S-Video.

Video thành phần: Các hệ thống Video đầu cuối cao cấp như các phòng thu hình
(studios) sử dụng ba tín hiệu Video riêng rẽ cho các ảnh màu đỏ, xanh lá cây và xanh lơ.
Các tín hiệu này được biết đến như là các tín hiệu Video thành phần. Ở những hệ thống
phòng thu này người ta sử dụng ba dây (connector) kết nối Camera hoặc các thiết bị khác
đến TV hay màn hình.
Video thành phần cho tái tạo màu sắc tốt nhất vì không có xuyên nhiễu giữa ba
kênh tín hiệu khác nhau, tuy nhiên nó đòi hỏi nhiều băng thông hơn và đồng bộ tốt hơn
cho cả ba tín hiệu thành phần.

Video tổ hợp: Các tín hiệu mầu và độ chói được trộn vào trong một sóng mang đơn. Tín
hiệu mầu là tổ hợp của hai thành phần hiệu mầu I và Q (hoặc U và V). Tín hiệu Viedo tổ
hợp được sử dụng trong truyền hình mầu quảng bá, thích ứng với truyền hình đen – trắng.
Trong hệ truyền hình NTSC, I và Q được kết hợp thành một tín hiệu mầu, và một
sóng mang sẽ đặt tín hiệu mầu vào cuối tần số cao hơn của kênh chia sẻ với tín hiệu độ
chói. Sau đó, các thành phần độ chói và màu được tách ra tại đầu cuối máy thu và hai
thành phần màu sắc được khôi phục tiếp theo đó.
Khi đấu nối với TV hoặc VCR, Video tổ hợp chỉ sử dụng 1 dây (Hình 3.18) và các

tín hiệu mầu video được trộn với nhau, không gửi riêng biệt. Các tín hiệu đồng bộ và
tiếng cũng được đưa vào chung với tín hiệu này. Vì tín hiệu mầu và độ chói được đưa vào
cùng một tín hiệu, nên nhiễu giữa chúng là không thể tránh khỏi.



Hình 3.18: Cáp Video tổ hợp

S-Video: Xem như là sự thỏa hiệp giữa Video thành phần và Video tổ hợp S-Video
(Separated Video hoặc Supper Video) sử dụng 2 dây, một cho độ chói và một cho tín
hiệu mầu. Kết quả là, có ít xuyên nhiễu giữa các thông tin về màu sắc và mức độ xám.

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


62


Hình 3.18: Cáp S-Video

3.1.7.2. Video tương tự

Phần lớn các TV hiện nay vẫn gửi và nhận tín hiệu Video tương tự. Một tín hiệu
tương tự f(t) lấy mẫu một ảnh biến đổi theo thời gian. Một quá trình quét tuần tự (lũy
tiến) từng dòng một từ trên xuống dưới theo hết một ảnh (một khung) trong một khoảng
thời gian nào đó được gọi là chu kỳ (tốc độ) quét -

t s/ảnh . Màn hình máy tính có độ
phân giải cao thường có chu kỳ (tốc độ) quét


t
= 1/72 sec.

Trong TV cũng như trong nhiều chuẩn đa phương tiện khác, quét xen kẽ được sử
dụng mà ở đó các dòng lẻ được quét đầu tiên và sau đó đến các dòng chẵn. Kết quả là các
mành "chẵn" và "lẻ" tạo nên một khung hình.

Trong thực tế, các dòng lẻ được quét bắt đầu ở trên cùng bên trái mành, các dòng
chẵn được bắt đầu quét ở giữa mành. Hình 3.19 minh họa biểu đồ quét. Trước tiên đường
liền nét (lẻ) được quét từ P đến Q, sau đó R đến S, và kết thúc tại T - sau đó các mành
chẵn bắt đầu từ U và kết thúc ở V. Sự nhảy từ Q đến R trong hình 3.19 được gọi là quét
ngược ngang. Sự nhảy từ T đến U hoặc V tới P được gọi là quét ngược đứng.

Hình 3.19: Quét mành xen kẽ

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


63

Cần phải lưu ý rằng nếu yêu cầu video có độ phân giải (cả không gian và thời
gian) cao, ví dụ như truyền hình độ nét cao HDTV thì cần phải sử dụng chế độ quét liên
tục. Mặc dụ các video được quét theo kiểu xen rẽ cũng đã là một lựa chọn tốt cho tín hiệu
truyền hình, song nó không thích hợp cho việc hiển thị trên màn hình máy tính với đặc
điểm là khoảng cách giữa màn hình và người dùng là nhỏ. Nếu như các hình ảnh trên TV
được sử dụng cho máy tính sẽ gây cảm giác khó chịu bởi độ rung giữa các dòng, cuộn
dòng… Để tránh các hiện tượng này, các máy tính sử dụng các màn hình có chế độ hiển
thị liên tục với tốc độ lớn hơn 50/60 khung/s, thông thường là 72 khung/s.
Hình 3.20 minh họa một tín hiệu điện tử cho một dòng quét video tổ hợp theo
chuẩn NTSC. Tín hiệu “mức trắng-White” có giá trị đỉnh 0,714 V; tín hiệu “mức đen-

Black” là 0,055 V; tín hiệu “xóa-Blank” là 0 V. Khoảng thời gian cho các xung xóa trong
tín hiệu cũng được sử dụng cho việc đồng bộ với giá trị tín hiệu đồng bộ (Sync) xấp xỉ -
0,286V.



Hình 3.20: Tín hiệu điện cho một dòng quét NTSC

Chuẩn NTSC (National Television System Committee)

Chuẩn TV NTSC (Uỷ ban Tiêu chuẩn Truyền hình quốc gia) được sử dụng phổ biến ở
Bắc Mỹ và Nhật Bản từ năm 1953. NTSC áp dụng tỷ lệ ảnh 4:3; 525 dòng quét/60Hz cho
một khung (Quét xen kẽ, 262.5 dòng / mành) và tốc độ khung là 30 khung hình/sec; mô
hình màu là YIQ. NTSC cấp phát băng thông 4,2 MHz cho độ chói Y; 1.6 MHz cho I và
0,6 MHz cho Q do mắt người ít nhạy cảm hơn đối với các chi tiết về mầu sắc so với độ
chói. Ưu điểm chính của hệ thống chuẩn này này là: đơn giản, thiết bị mã hóa và giải mã
không phức tạp, giá thành thấp khi xây dựng hệ thống thiết bị. Tuy nhiên dễ bị sai màu
khi hệ thống truyền tín hiệu không lý tưởng và có nhiễu.

Chuẩn PAL (Phase Alteration Line)

Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


64

Chuẩn PAL được phát triển từ năm 1962 ở Đức. PAL dùng tỷ lệ ảnh 4:3; 625 dòng
quét/50Hz (Quét xen kẽ,312.5 dòng/mành), 25 khung hình/giây; mô hình màu YUV với
băng thông cho Y là 5.5 MHz và U, V là 1,8MHz. Chuẩn hệ PAL có méo pha nhỏ hơn
hẳn so với hệ NTSC, không có hiện tượng xuyên lẫn màu, thuận tiện cho việc ghi băng

hình hơn hệ NTSC, nhưng máy thu hình hệ PAL phức tạp hơn, tính kết hợp với hệ truyền
hình đen trắng kém hơn hệ NTSC

Chuẩn SECAM (Sequentiel Couleurs a Memoire – Sequential Color with Memory)

SECAM được triển từ năm 1956 ở Pháp. SECAM cũng sử dụng 625 dòng quét/50Hz cho
mỗi khung hình, 25 khung hình / giây, với tỉ lệ 4:3 và quét mành xen kẽ. SECAM cũng
sử dụng mô hình màu YUV với băng thông 6MHz cho Y và 2MHz cho U và V. Chuẩn
hệ SECAM có tính chống nhiễu tương đối cao; kém nhạy với méo pha, méo biên độ.

3.1.7.3. Video số

Video dù thuộc dạng RGB hay YUV đều có dạng số. Trong trường hợp này, các
mẫu rời rạc của tín hiệu video tương tự được số hóa tạo ra chuỗi các từ mã biểu diễn các
điểm ảnh. Các từ mã này được phân thành ba trường biểu diễn cho từng tín hiệu một của
RGB hay YUV. Phạm vi của các chiều dài là 16 bit hoặc 24 bit. Với 24 bit thì trong đó R
= G = B = 8 bit; còn với 16 bit thì Y = 8 bit và U = V = 4 bit.

Video số có nhiều ưu điểm so với Video tương tự, cụ thể như sau:

• Lưu trữ video trên các thiết bị số hoặc trong bộ nhớ, sẵn sàng để được xử lý (loại
bỏ nhiễu, cắt và dán, …) và tích hợp vào nhiều các ứng dụng đa phương tiện khác
nhau.
• Truy cập trực tiếp, và làm cho biên tập video trở nên đơn giản.
• Lặp đi lặp lại việc xử lý hình mà không làm giảm chất lượng hình ảnh.
• Dễ dàng mật mã hóa.

Các chuẩn CCIR cho Video số

CCIR là Uỷ ban tư vấn quốc tế về Radio và một trong các tiêu chuẩn quan trọng

nhất cho Video số là CCIR-601 cho tín hiệu Video số thành phần. Chuẩn này đã trở thành
chuẩn ITU-R-601, một tiêu chuẩn quốc tế cho các ứng dụng video chuyên nghiệp.

Chuẩn NTSC có 525 dòng quét; mỗi một dòng có 858 điểm ảnh (với 720 điểm ảnh
nhìn thấy và số còn lại không nhìn thấy trong chu kỳ xóa). Do NTSC dùng mô hình lấy
mẫu 4:2:2, mỗi điểm ảnh tương ứng với hai bytes (8 bit cho Y và 8 bit thay đổi giữa Cb
và Cr) nên tốc độ bit dữ liệu Video số xấp xỉ 216 Mbps
(525×858×30×2bytes×8bits/byte≈216Mbps).
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


65

Bảng 3.2 dưới đây mô tả các tham số đặc trưng của Video số theo các chuẩn khác
nhau. Lưu ý các chuẩn đều áp dụng tỷ lệ ảnh 4:3.


Bảng 3.2: Thông số video số
3.2. Cơ sở kỹ thuật xử lý ảnh
3.2.1. Cơ sở của cảm nhận thị giác
Việc xử lý hình ảnh trong các ứng dụng có mục chính là để giúp đỡ con người
quan sát thông tin trong một hình ảnh. Vì vậy, điều quan trọng là phải hiểu được hệ thống
thị giác của con người. Hệ thống thị giác của con người tập trung chủ yếu vào mắt (cảm
biến hình ảnh hay camera), thần kinh thị giác (đường dẫn hình ảnh), và não (các khối
thông tin xử lý về ảnh…). Cấu tạo của mắt người được minh họa ở hình 3.21 dưới đây.

Hình 3.21: Cấu tạo của mắt người
Mắt người có cấu trúc gần dạng hình cầu với đường kính trung bình khoảng
20mm. Mắt người gồm có các thành phần chủ yếu sau:
Giác mạc: Là phần trước lồi trong suốt của lớp xơ phía ngoài con ngươi mà bao bọc

mống mắt và đồng tử.
Màng cứng: Bọc ở phía ngoài có sợi trắng cứng bao trùm tất cả con ngươi trừ giác mạc.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh


66

Mô mạc: Choàng lấy mạch máu nâu tối của mắt giữa màng cứng và võng mạc bao gồm
các màng máu cung cấp dinh dưỡng cho mắt.
Mống mắt: Mống mắt mở rộng hoặc thu gọn nhằm điều khiển lượng ánh sáng chiều vào
mắt.
Thấu kính: Được tạo ra từ những lớp đồng tâm của những tế bào có sợi, chứa 60-70%
lượng nước.
Võng mạc: Mảnh dẻ, nhiều lớp, màng nhạy cảm và được nối bởi thần kinh thị giác tới
não. Là nơi nhạy cảm với ánh sáng và mầu sắc.
Mắt hoạt động như một camera, với thấu kính tập trung hình ảnh vào võng mạc. Võng
mạc có chứa các tế bào hình que (rods) và ba loại tế bào hình nón (cones) theo như hình
dáng của chúng. Các tế bào hình que (có khoảng 75-150 triệu) được phân bố xung quanh
hoàng điểm (điểm vàng), rất nhậy cảm về ánh sáng nhưng không cảm thụ màu sắc. Các
tế bào hình nón (có khoảng 6,5 triệu) được tập trung tại hoàng điểm, kém nhậy cảm với
ánh sáng, nhưng cảm thụ và phân biệt được màu sắc tương ứng với ba loại tế bào hình
nón nhậy cảm với 3 mầu khác nhau: Đỏ, Xanh lá cây và Xanh lơ.

Mắt người nhạy cảm nhất với ánh sáng ở vùng giữa của phổ nhìn thấy được. Giống
như thuộc tính phân bố năng lượng quang phổ (SPD) của một nguồn ánh sáng, như trong
hình 3.15, chúng ta thấy độ nhạy tương đối là hàm của bước sóng. Hình 3.22 minh họa
hàm độ nhạy của mắt người V(
λ
) (đường đứt nét) và là tổng của các đường cong đáp
ứng phổ của các mầu đỏ, xanh lá cây, và xanh lam. Theo đó, mắt người không nhạy cảm

đồng đều với các màu sắc có bước sóng khác nhau và nhạy cảm nhất vùng xanh lá cây-
vàng (
λ
≈ 555nm).

Gọi q
R
(
λ
),q
G
(
λ
) và q
B
(
λ
) là các hàm độ nhạy phổ của các màu cơ bản R, G, và B,
khi đó chúng ta có hàm vector q(
λ
), với các thành phần:


(3.10))

Các phản ứng trong từng kênh màu trong mắt người tỷ lệ với số lượng tế bào thần
kinh liên quan. Đối với các kênh màu đỏ, bất kỳ ánh sáng nào rơi xuống bất cứ nơi nào ở
phần khác không của hàm độ nhạy của tế bào hình nón - nhạy cảm với màu đỏ trong hình
3.22 sẽ tạo ra một số phản ứng.
Xử lý âm thanh và hình ảnh Chương 3:Kỹ thuật xử lý ảnh



67


Hình 3.22: Đáp ứng phổ (độ nhạy) của mắt người

Đáp ứng tổng hợp của kênh màu đỏ là tổng tất cả ánh sáng rơi vào võng mạc nơi
có các tế bào hình nón nhạy cảm với màu đỏ đang cảm nhận. Nếu chúng ta xem các hàm
độ nhạy là liên tục, thì các màu sắc cơ bản có thể được xác định bởi biểu thức (3.11).


(3.11
)

Vì tín hiệu hình ảnh được truyền đi có ba thành phần mầu cơ bản nên các mầu sắc
hình thành một không gian vector ba chiều.

Biểu thức (3.11) ở trên thực tế chỉ áp dụng khi chúng ta xem một đối tượng tự phát
sáng (nghĩa là một nguồn ánh sáng). Trong phần lớn các trường hợp, chúng ta nhìn thấy
hình ảnh của một vật thể là do ánh sáng phản xạ từ bề mặt của vật thể đó đến mắt chúng
ta. Các bề mặt phản xạ các lượng ánh sáng khác nhau ở các bước sóng khác nhau, bề mặt
sẫm thì phản xạ năng lượng ít hơn các bề mặt sáng. Hàm phản xạ được ký hiệu là S(
λ
).

Tình huống hình thành hình ảnh được mô tả như sau. Ánh sáng từ nguồn sáng với
phân bố năng lượng quang phổ (SPD) - E(
λ
) đến bề mặt của vật thể, có hàm phản xạ phổ

bề mặt S(
λ
) và sau đó được lọc bởi các hàm độ nhạy phổ tương ứng với các tế bào hình
nón q(
λ
) – Hình 3.23. Hàm C(
λ
) được gọi là tín hiệu màu sắc và tich của E(
λ
) và S(
λ
).

Các biểu thức hình thành màu sắc tương tự như biểu thức (3.12) mà có tính đến các
mô hình hình thành hình ảnh là:

×