Tải bản đầy đủ (.docx) (11 trang)

Đề cương Xử lí ảnh HaUI có Python

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.99 MB, 11 trang )

Câu 1: Mơ hình màu là gì? Liệt kê một vài mơ hình màu thơng dụng. Trình bày
các cơng thức chuyển đổi giữa các mơ hình màu?
Trong xử lý ảnh và đồ họa, mơ hình màu là một chỉ số kỹ thuật của một hệ tọa độ
màu 3 chiều có thể dùng để biểu diễn tất cả các màu. Ví dụ như mơ hình màu RGB (Red,
Green, Blue): là một đơn vị tập các màu thành phần sắp xếp theo hình lập phương của hệ
trục tọa độ Đề các.

a) 1 số mơ hình màu thơng dụng
- RGB
- CMYK
- HSV
b) Cơng thức chuyển đổi:



Câu 2: Mơ hình màu CMYK là gì? CMY khác RGB ở chỗ nào?
CMYK (hay còn gọi là YMCK) là tên bảng mã màu và bao gồm 4 màu
chính là cyan- magenta (hồng sẫm-yellow-key(đen)
Bảng màu RGB là tên viết tắt của 3 màu cơ bản gồm Red (đỏ), Green
(xanh lá) và Blue (xanh dương). Đây cũng là 3 màu chính của ánh sáng trắng
sau khi được tách ra bởi lăng kính.
Điểm khác nhau:
Khác với RGB là màu cộng, thì CMYK là màu trừ. CMYK làm việc dựa
trên nguyên lý hấp thụ ánh sáng. Do đó, thay vì tăng thêm độ sáng để tạo ra
những màu sắc khác nhau, hệ màu CMYK sẽ loại trừ ánh sáng từ nguồn ánh
sáng gốc là màu trắng để tạo ra các màu sắc khác.
Câu 3:

-

Khác nhau: ?



Câu 4: Tại sao người ta phát triển nên hệ màu HSV và HSL? Nêu ý nghĩa của từng
chữ cái thể hiện từng thành phần của HSV và HSL (H là gì, S là gì...).
Vì Các mơ hình màu RGB, CMY có thể hiển thị được tất cả các mầu cần thiết, tuy vậy
rất khó khămn để con người có thể phối mầu trên hai hệ màu này. Để phối mầu dễ dàng hơn
Smith định nghĩa mơ hình màu HSV của hay HSL
Trong đó:
HSV:

-

H: Hue – sắc màu
S: Saturation - Bão hòa
V Value - giá trị


HSL:
-

H: Hue- sắc màu
S: Saturation - Bão hòa
L: Lightness (Độ sáng)

5. Trình bày khái niệm và phương pháp phân loại ảnh số?
- kn ảnh số: Ảnh số thực tế là biểu diễn số học của hình ảnh trong máy và có 2
dạng biểu diễn là dạng vector và dạng ma trận

6. Trình bày phương pháp phóng to (Zooming) và thu nhỏ (Shrinking) ảnh số?
a) zooming: là phép phóng to ảnh.
Các bước zooming:



Các bước shrinking:

11. Cân bằng tần suất là gì? Tại sao phải cân bằng tần suất?
13. Biên là gì? Phát hiện biên trực tiếp là gì? Nêu một vài ví dụ (phương pháp)
về cách phát hiện biên trực tiếp? và 14 gián tiếp


Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự biến thiên
mức xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là kỹ thuật lấy
đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy
đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace. Ngồi ra cịn có một số các tiếp
cận khác

Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các
vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dị biên và phân vùng
ảnh là hai bài tốn đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà
khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân
vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được
biên.
Ví dụ:
Trực tiếp:


Gián tiếp

15.Biên là gì? Nhiễu là gì? Làm thế nào để phân biệt biên và nhiễu?

Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh. Cho đến

nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo
khác nhau về biên, một trong các độ đo đó là độ đo về sự thay đổi đột ngột về cấp xám. Ví
dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất
một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên biên hay đường bao của đối
tượng.

Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lân
cận có sự biến đổi liên tục về mức xám. Như vậy sau quá trình số hố thì trong
mỗi cửa sổ đang xét các điểm ảnh đều có giá trị gần bằng như nhau. Thực tế
quan sát có những điểm ảnh có giá trị khác hơn nhiều so với các điểm ảnh xung
quanh. Đó chính là nhiễu. Như vậy, nhiễu trong ảnh số được xem như là sự dịch
chuyển đột ngột của tín hiệu ảnh trên một khoảng
cách nhỏ.
16. Tại sao chúng ta phải nén ảnh? Trình bày sơ lược một số phương pháp nén
ảnh thông dụng?
Nén ảnh là kỹ thuật nhằm giảm thiểu khơng gian lưu trữ. Có hai hướng tiếp cận chính là nén
có bảo tồn và khơng bảo tồn thơng tin. Nén khơng bảo tồn thì thường có khả năng nén cao
hơn nhưng không phục hồi được ảnh gốc, ngược lại nén có bảo tồn cho phép khơi phục hồn
tồn ảnh gốc. Nén ảnh nói chung có 4 cách tiếp cận cơ bản:


Python:
1. Đọc ghi ảnh.
Cv2.imread(r’path’, parameter)
Cv2.imwrite(path. Đuôi, name)
2. Resize(shrinking, zooming)
cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])

Src: source
Dsize: kích thước mong muốn ảnh ouput

Fx, fx: tỉ lệ scale x/y
Interpolation: phép nội suy
o Shrinking: cv2.INTER_AREA
o Zooming: cv2.INTER_CUBIC (slow); cv2.INTER_LINEAR.
o By default, the interpolation method cv2.INTER_LINEAR is used
for all resizing purposes
3. Threshold
-

cv.THRESH_BINARY
cv.THRESH_BINARY_INV
cv.THRESH_TRUNC
cv.THRESH_TOZERO
cv.THRESH_TOZERO_INV
4. Biến đổi hình thái Type of Morphological Transformations


a) Erosion:
cv2.erode(src, kernel[, dst[, anchor[, iterations[, borderType[, borderValue]]]]])
src: source
kernel: Nhân dùng cho ero
dst: output same size and type
anchor: Nó là một biến kiểu số nguyên đại diện cho điểm neo và giá trị mặc định
của nó. Điểm là (-1, -1) có nghĩa là điểm neo nằm ở tâm kernel.
borderType: Nó mơ tả loại đường viền sẽ được thêm vào. Nó được định nghĩa
bởi các flag như cv2.BORDER_CONSTANT, cv2.BORDER_REFLECT, etc.
iterations: Đó là số lần xói mịn được áp dụng.
borderValue: Đó là giá trị đường viền trong trường hợp đường viền không đổi.
Return Value: Nó trả về một hình ảnh.


Code basic nhất: (đọc ảnh xám)


b) dilation
cv.dilate(src, kernel[, dst[, anchor[, iterations[, borderType[, borderValue]]]]])
src: source
kernel: Nhân dùng cho ero
dst: output same size and type
anchor: Nó là một biến kiểu số nguyên đại diện cho điểm neo và giá trị mặc định
của nó. Điểm là (-1, -1) có nghĩa là điểm neo nằm ở tâm kernel.
borderType: Nó mơ tả loại đường viền sẽ được thêm vào. Nó được định nghĩa
bởi các flag như cv2.BORDER_CONSTANT, cv2.BORDER_REFLECT, etc.
iterations: Đó là số lần xói mịn được áp dụng.
borderValue: Đó là giá trị đường viền trong trường hợp đường viền không đổi.
Return Value: Nó trả về một hình ảnh.

Code basic

c) opening
opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)

d) closing
closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)




×