Tải bản đầy đủ (.docx) (51 trang)

HỆ THỐNG CẢNH báo CHÁY BẰNG VIDEO (có code)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.42 MB, 51 trang )

ĐỒ ÁN TỐT NGHIỆP

HỆ THỐNG CẢNH BÁO CHÁY BẰNG
VIDEO


MỤC LỤC


DANH MỤC CÁC HÌNH VẼ


DANH MỤC CÁC BẢNG BIỂU


DANH MỤC CÁC TỪ VIẾT TẮT

BG

Background

CCTV

Closed Circuit Television

FG

Foreground

FPS


Frame per second

GUI

Graphic User Interface

HSV

Hue Saturation Value

JPEG

Joint Photographic Experts Group

MPEG

Moving Picture Experts Group

RGB

Red Green Blue


ĐỒ ÁN TỐT NGHIỆP
Trang 6/50

CHƯƠNG 1.

TỔNG QUAN VỀ HỆ THỐNG


1.1 Giới thiệu về đề tài
Cháy là thảm họa có thể xảy ra bất kỳ thời gian nào, bất cứ nơi đâu và để lại những
hậu quả vô cùng nghiêm trọng nếu không được phát hiện kịp thời. Trong thực tế
cuộc sống và sản xuất, có rất nhiều nguồn nhiệt có thể gây cháy. Ví dụ như: ngọn
lửa trực tiếp, ngọn lửa do các máy móc, ngọn lửa do các chất hóa học…
Hiện này, tình hình cháy nổ ở nước ta diễn ra rất phức tạp. Các vụ cháy nổ ở các
nhà máy xí nghiệp, các chung cư… diễn ra ngày càng nhiều gây rất nhiều thiệt hại
về tài sản và tính mạng con người. Vì vậy, vấn đề phát hiện lửa và hệ thống cảnh
báo cháy sớm đang là một nhu cầu thiết yếu nhằm tăng cường khả năng phòng
chống cháy nổ cho doanh nghiệp, công ty và các hộ gia đình.
Do đó, trên thế giới có rất nhiều nhà khoa học đã và đang nghiên cứu để giải quyết
vấn đề này. Hiện nay, có rất nhiều công nghệ, kỹ thuật được dùng để phòng chống
và chữa cháy như: dùng các đầu báo cháy, thị giác máy tính…
1.2 Tình hình nghiên cứu
Trong nền khoa học ngày càng phát triển, có rất nhiều công nghệ, kỹ thuật cảnh báo
cháy và chữa cháy được nghiên cứu và phát triển. Hiện nay, có 2 phương pháp chủ
yếu được dùng là: dùng các loại cảm biến và xử lý ảnh. Trong những thập kỷ qua,
các cảm biến khác nhau được phát triển, chẳng hạn như cảm biến nhiệt độ và cảm
biến khói đã được sử dụng để cảnh báo lửa và dự báo cháy.
1.1.1 Cảm biến nhiệt độ và khói
Cảm biến nhiệt độ: là loại đơn giản nhất, cấu tạo gồm cảm biến nhiệt độ đo nhiệt độ
không khí xung quanh môi trường. Ngưỡng nhiệt độ hoạt động sẽ tùy thuộc yêu cầu
mà nhà sản xuất đưa ra.

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 7/50


Hình 1-1: Cảm biến nhiệt độ thường dùng

Cảm biến khói: Đầu báo khói quang học được chế tạo theo nguyên lý khuếch tán và
hấp thụ ánh sáng bởi các phân tử khói khi ánh sáng truyền trong không khí. Khói
được tạo ra bởi đám cháy sẽ ảnh hưởng tới dòng ánh sáng truyền qua trong không
khí. Khói có thể ngăn hoặc che khuất các ánh sáng, là nguyên nhân khiến các tia
sáng bị lệch hoặc khuất xạ. Đầu báo khói quang học được thiết kế dựa trên nguyên
lý của ánh sáng và ảnh hưởng khói đến chúng.

Hình 1-2: Nguyên lý hoạt động của đầu báo cháy quang học

Dựa vào các tính năng có thể chia hệ thống cảnh báo cháy dùng cảm biến chia thành
2 loại cụ thể. Các hệ thống cảnh báo cháy sẽ được lắp đặt tùy thuộc vào nhu cầu của
đối tượng sử dụng. Với môi trường nhỏ như các hộ gia đình, việc cảnh báo cháy và
chữa cháy dễ quản lý hơn. Nhưng với các công ty, nhà máy xí nghiệp hay chung cư
thì việc cần biết được chính xác vị trí cháy sẽ quan trọng hơn trong khâu chữa cháy
và khắc phục hậu quả.
Đầu báo cháy thường: chỉ có khả năng phát hiện cháy, không có khả năng xác định
các thông số như: độ bẩn của cảm biến, vị trí… Vì thế các đầu báo thường được sử

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 8/50

dụng lắp theo dạng kênh, khi có một đầu báo cháy sẽ cho biết kênh nào đó cháy chứ
không xác định được chính xác vị trí có cháy.

Hình 1-3: Đầu báo cháy thường hãng Hochiki


Đầu báo cháy địa chỉ: ngoài khả năng báo cháy còn có khả năng tự động đo được
một số thông số như độ bẩn cảm biến, tình trạng thiết bị, định vị trí, rồi gửi về tủ
trung tâm nhờ có bộ nhớ EPROM thông minh tích hợp trong đầu báo.

Hình 1-4: Đầu báo cháy địa chỉ

Ưu nhược điểm của hệ thống báo cháy dùng cảm biến:
• Ưu điểm: đơn giản, dễ lắp đặt, cảm biến khói có thể phát hiện sớm.
• Nhược điểm: chỉ phát hiện được khi đám cháy xảy ra gần vị trí đặt cảm biến,
độ chính xác không cao, không có hình ảnh hiện trường cháy, vùng giám sát

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 9/50

nhỏ và công tác điều tra nguyên nhân gặp nhiều khó khăn. Thêm vào đó, việc
ứng cứu chưa kịp thời cũng là nguyên nhân gia tăng thiệt hại do các đám
cháy gây ra. Do phương thức báo cháy chủ yếu bằng điện thoại làm mất
nhiều thời gian để xác minh và lấy thông tin nên khâu chữa cháy hiệu quả
không cao.
Nhận xét: Với phương thức sử dụng các cảm biến khói và lửa thì các hình ảnh tại
hiện trường sẽ không được ghi lại nên sẽ gây ra các khó khăn về việc điều tra, tìm
ra nguyên nhân. Cùng với đó, hệ thống chỉ cảnh báo cháy báo khi có ngọn lửa gần
nơi đặt cảm biến sẽ gây ra vấn đề về việc cảnh báo và phòng ngừa nên các hậu quả
sẽ không được giảm thiểu tối đa.
1.1.2 Thị giác máy tính
Ngày nay với sự phát triển mạnh mẽ của công nghệ xử lý ảnh, con người ngày càng

phát triển hơn trong lĩnh vực thị giác máy tính nhằm giải quyết các vấn đề của con
người, xã hội. Phát hiện lửa trong cảnh báo cháy cũng không nằm trong vấn đề này,
nếu có thể dùng công nghệ xử lý ảnh để phân tích và phát hiện cháy thì chúng ta
hoàn toàn có thể ngăn chặn, giảm thiểu thiệt hại gây ra về vật chất và người khi xảy
ra các vụ cháy.
Phương pháp cảnh báo cháy bằng thị giác máy tính sẽ sử dụng các camera giám sát
được lắp đặt sẵn để theo dõi sự xuất hiện của lửa và khói ở bất kỳ nơi nào trong
phạm vi giám sát của camera. Với phương pháp này, thông tin được cung cấp sớm
sẽ giúp các cơ quan chức năng có biện pháp xử lý một cách kịp thời. Cùng với đó,
công tác điều tra nguyên nhân sẽ thuận lợi hơn khi có hình ảnh hiện trường và vùng
giám sát phương pháp này rộng hơn phương pháp dùng đầu báo. Ngọn lửa có các
tính chất đặc biệt như màu sắc, chuyển động, hình dạng tăng trưởng và hành động
khói.
1.3 Mục tiêu và nhiệm vụ đề tài
Trong đồ án tốt nghiệp này, em tập trung nghiên cứu những giải thuật để phát hiện
cháy một cách chính xác nhất có thể dựa vào tính chất màu sắc của ngọn lửa. Bên
cạnh việc nhận dạng được ngọn lửa dựa vào tính chất thì cũng đưa ra các cơ chế

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 10/50

cảnh báo cháy phù hợp tùy theo mức độ cháy cho người dùng và đưa ra được hướng
khắc phục một cách hiệu quả để tránh những thiệt hại nặng nề về người và tài sản.
Trong đề tài này, em sẽ dùng hình ảnh từ các video được thu từ các camera an ninh.
Các camera này sẽ được gắn sẵn ở các khu vực đông dân như khu dân cư, các khu
công nghiệp… Sau khi thu được các đoạn video, các chuỗi hình ảnh sẽ được tách ra
từ các đoạn video trên. Từ các chuỗi hình ảnh này, em sẽ xử lý và khoanh vùng các

khu vực bị nghi là có cháy dựa trên các đặc tính màu sắc của ngọn lửa. Sau khi
khoanh vùng được các khu vực bị nghi là có lửa, em sẽ đề ra các biện pháp cảnh
báo cháy.
Nội dung nghiên cứu của đồ án tốt nghiệp gồm các phần như sau:
• Tìm hiểu về các công nghệ, kỹ thuật phát hiện cháy được sử dụng hiện nay.
• Tìm hiểu giải thuật về việc phát hiện lửa dựa vào các mô hình không gian
màu để nhận dạng ngọn lửa.
• Xây dựng và thu thập tập cơ sở dữ liệu bao gồm các hình ảnh tĩnh chuẩn
RGB để nhận dạng.
• Sử dụng mô hình không gian màu RGB và YCbCr để chọn ngưỡng và tách
ngưỡng cho dữ liệu thu thập được.
• Thực hiện việc phát hiện lửa bằng các thuật toán được xây dựng trong 2 mô
hình màu.
• Xây dựng hệ thống với giao diện, tính năng và cảnh báo cháy khi phát hiện
cháy (phát loa, gửi tin nhắn, gọi điện thoại…).
• Dùng giải thuật luồng quang kết hợp không gian màu để phân biệt những vật
thể không chuyển động có cùng màu với lửa.
Do đề tài này chỉ thực hiện ở mức độ đánh giá các giải thuật phát hiện cháy qua
video để cảnh báo cháy nên cơ sở dữ liệu được sử dụng với hình ảnh rõ nét, trong
cùng môi trường, ít ánh sáng, không bóng mờ…

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 11/50

CHƯƠNG 2.

GIỚI THIỆU VỀ XỬ LÝ ẢNH


1.4 Tổng quan về xử lý ảnh
Từ những năm 1970, năng lực tính toán của máy tính ngày càng trở nên mạnh mẽ
hơn. Các máy tính lúc này có thể xử lý được những tập dữ liệu lớn như các hình
ảnh, các đoạn phim thì khái nhiệm về kỹ thuật xử lý ảnh ngày càng được nhắc đến
và nghiên cứu nhiều hơn cho tới ngày nay.
Hiện nay, xử lý ảnh (image processing) là một lĩnh vực khá mới mẽ bao gồm các
phương pháp thu nhận ảnh, xử lý ảnh kỹ thuật số, phân tích và nhận dạng đối tượng.
Xử lý ảnh bao gồm lý thuyết và các kỹ thuật liên quan nhằm mục đích tạo ra hệ
thống nhân tạo có thể tiếp nhận thông tin từ các hình ảnh thu được hoặc các tập dữ
liệu đa chiều. Đối với con người, quá trình nhận thức thế giới bên ngoài là một điều
dễ dàng. Thông qua quá trình sống, quá trình nhận thức của mỗi người sẽ được
“học” dễ dàng. Tuy nhiên với các vật vô tri như máy tính, robot… thì điều đó là một
bước tiến khó khăn. Các thiết bị ngày nay không chỉ nhận thông tin ở dạng tín hiệu
đơn lẻ mà nay còn có thể có cái “nhìn” thật với thế giới bên ngoài. Cái “nhìn” này
qua quá trình phân tích, kết hợp với các mô hình như máy học, mạng nơ-ron… sẽ
giúp cho thiết bị tiến dần tới một hệ thống nhân tạo có khả năng ra quyết định linh
hoạt và đúng đắn hơn rất nhiều. Lĩnh vực nghiên cứu của thị giác máy tính rất rộng,
và đặc điểm chung là các bài toán về xử lý ảnh đều không có một đề tài chung và
cách giải duy nhất. Mỗi giải pháp giải quyết vấn đề được một kết quả nhất định cho
những trường hợp cụ thể. Xử lý ảnh là một môn khoa học, kỹ thuật có liên quan đến
các lý thuyết đằng sau các hệ thống nhân tạo được trích xuất từ các thông tin từ các
hình ảnh. Các chuỗi video, các cảnh từ camera, hay dữ liệu đa chiều từ máy quét ý
học là các dạng thường gặp của dữ liệu hình ảnh. Xử lý ảnh tìm kiếm việc áp dụng
các mô hình và các lý thuyết để xây dựng các hệ thống xử lý ảnh.
1.1.3 Khái niệm ảnh số
Ảnh số: là hình ảnh được ghi nhận bởi bộ cảm biến điện tử và lưu lại dưới dạng dữ
liệu trong bộ nhớ của máy (có thể là thẻ nhớ, đĩa,…). Ảnh số chỉ là ma trận 2 chiều,

Hệ thống cảnh báo cháy bằng video



ĐỒ ÁN TỐT NGHIỆP
Trang 12/50

và việc xử lý chúng chỉ là những thao tác trên ma trận này sao cho ra kết quả hợp lý.
Ví dụ một bức ảnh có độ phân giải 480x360 có nghĩa là chiều ngang có 480 điểm
ảnh (pixel), chiều dài có 360 điểm ảnh (pixel), và mỗi điểm ảnh được biểu diễn
bằng một con số.
Tùy theo giá trị dùng để biểu diễn, ảnh số được chia thành 3 loại chính:
• Ảnh nhị phân (binary image): là một ảnh đen hoặc trắng. Giá trị tại mỗi điểm
ảnh (pixel) là 0 hoặc 1.
• Ảnh xám (gray image): giá trị mỗi điểm ảnh nằm trong dãi có giá trị từ 0 đến
255, nghĩa là cần 8 bits hay 1 byte.
• Ảnh màu (color image): mỗi điểm ảnh có giá trị bao gồm màu đỏ (red), xanh
lục (green), xanh dương (blue). Mỗi màu có giá trị từ 0 đến 255, nghĩa là mỗi
điểm ảnh cần 24 bits hay 3 bytes để biểu diễn.

Hình 2-1: Ảnh LENA ở ảnh màu được biến đổi sang ảnh xám và ảnh nhị phân

Điểm ảnh (Picture Element): là phần tử của ảnh số. Tại tọa độ của mỗi điểm (x,y)
có giá trị với mức độ xám hoặc một màu nhất định. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
Độ phân giải: là chỉ số các điểm ảnh hiển thị được chứa trong một tập tin ảnh kỹ
thuật số được hiển thị hoặc được in ra trên các thiết bị. Sao cho mắt người có thể
Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 13/50


nhìn thấy ảnh một cách liên tục, độ phân giải của ảnh sẽ được phân bố theo x và y
trong không gian.
1.1.4 Các thang màu trong ảnh số
Trong thí nghiệm của bác học Newton thì sau khi chùm tia sáng trắng đi qua lăng
kính thì nó trở thành một quang phổ, gồm nhiều màu đơn sắc sắp xếp cạnh nhau,
gọi là hiện tượng tán sắc ánh sáng. Bác học Newton cho rằng, ánh sáng mặt trời
được cấu tạo bằng vô số những tia bức xạ lan rộng từ màu Đỏ đến màu Tím. Mỗi
loại tia sáng tạo ra màu có bước sóng dài ngắn khác nhau, tia sáng có bước sóng
ngắn thì sẽ bị khúc xạ nhiều hơn loại có tia sáng có bước sóng dài. Từ bảy màu trên
quang phổ cầu vòng: Đỏ, Cam, Vàng, Lục, Lam, Chàm, Tím người ta có thể phân
biệt rất nhiều màu chuyển tiếp, trung gian, nối liền bảy màu này. Do đó về mặt
quang học, có thể khẳng định, màu sắc là ánh sáng, hay có thể gọi màu sắc là con đẻ
của ánh sáng, là hiệu quả hiển thị của các loại ánh sáng có bước sóng dài ngắn khác
nhau. Ngoài ra, màu sắc còn là do sự phản chiếu của ánh sáng trên những vật thể.
Như vậy, thì bản thân màu sắc là ánh sáng và bản thân vật thể ấy cũng có màu sắc.
• Hệ thống RGB: là từ viết tắt tiếng anh của cơ chế hệ màu cộng gồm: Đỏ
(Red), Xanh lục (Green), Xanh dương (Blue), thường được sử dụng để hiển
thị màu trên các màn hình kỹ thuật số). Nguyên lý làm việc của hệ RGB là
phát xạ ánh sáng, hay còn gọi là mô hình ánh sáng bổ sung (các màu được
sinh ra từ 3 màu RGB sẽ sáng hơn các màu gốc). Nếu CYMK là nơi bắt đầu
từ một tờ giấy trắng và sau đó thêm các màu khác thì RGB hoạt động ngược
lại. Ví dụ, khi màn hình TV tắt thì nó tối đen, khi bật nó lên sẽ thêm các màu
đỏ, xanh lá cây, xanh dương cộng thêm hiệu ứng tích lũy và màu trắng để
phát ra ánh sáng và hình ảnh. Chế độ màu RGB có một gam màu lớn hơn
nhiều so với CYMK, đặc biệt trong vùng các màu huỳnh quang sáng. Khi
biểu diễn dưới dạng số, các giá trị RGB trong mô hình bpp thông thường ghi
bằng ba số nguyên có giá trị từ 0 đến 255, mỗi giá trị đại diện cho cường độ
của màu đỏ, xanh lá cây, xanh dương. Số lượng màu tối đa là 256 x 256 x
256 = 16 777 216 màu.


Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 14/50

Ví dụ: (255,0,0) là màu đỏ.
(0,255,0) là màu xanh lá cây.
(0,0,255) là màu xanh dương.
• Không gian màu HSV: Hệ không gian màu HSV và HSL là hai hình dạng
phổ biến nhất của các điểm trong một mô hình màu RGB. Được phát triển
vào những năm 1930 cho các ứng dụng truyển hình màu, không gian màu
HSL cho phép thêm thông tin màu vài các tín hiệu đen trắng hiện tại, có
nghĩa là không giống như các hệ thống màu trước đó, máy thu đơn sắc có thể
nhận tín hiệu màu phát bằng HSL. HSV và HSL được sử dụng ngày nay
trong tất cả các hệ thống mã hóa truyền hình kỹ thuật số, bộ chọn màu, phần
mềm chỉnh sửa hình ảnh, và ít phổ biến hơn trong phân tích hình ảnh và tầm
nhìn máy tính. Hệ không gian màu này dựa vào 3 thông số sau để mô tả màu
sắc: H = Hue (màu sắc), S = Saturation (độ đậm đặc, sự bão hòa), V = Value
(giá trị cường độ sáng). Không gian màu này thường được biểu diễn dưới
dạng hình trụ hoặc hình nón.

Hình 2-2: Không gian màu HSV

Theo đó, đi theo vòng tròn 0-360 độ là trường biểu diễn màu sắc (Hue).
Trường này bắt đầu từ màu đỏ đầu tiên (Red primary) tới màu xanh lục đầu
tiên (Green primary) nằm trong khoảng từ 0-120 độ, từ 120-240 độ là màu
xanh lục tới xanh lơ (Green primary – Blue primary). Từ 240-360 độ là từ
màu đen tới màu đỏ.


Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 15/50

Hình 2-3: Hình tròn biểu diễn màu sắc (Hue)

Theo như cách biểu diễn không gian màu theo hình trụ như trên, đi từ giá trị
độ sáng (V) được biểu diễn bằng cách đi từ dưới đáy hình trụ đi lên và nằm
trong khoảng từ 0 – 1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh
hình trụ là độ sáng lớn nhất (V=1). Đi từ tâm hình trụ ra mặt trụ là giá trị bão
hòa của màu sắc (S). S có giá trị từ 0 -1, S = 0 ứng với tâm hình trụ là chỗ
mà màu sắc nhạt nhất, S = 1 ở ngoài mặt trụ là nơi mà giá trị màu sắc là đậm
đặc nhất. Như vậy với mỗi giá trị (H,S,V) sẽ cho ta một màu sắc mà ở đó mô
tả đầy đủ thông tin về màu sắc, độ đậm đặc và độ sáng của màu đỏ.
• Không gian màu CMYK: là không gian màu được sử dụng phổ biến trong
ngành công nghiệp in ấn. Ý tưởng cơ bản của hệ không gian màu này là dung
4 màu sắc cơ bản để phục vụ cho việc pha trộn mực in. Trên thực tế, người ta
dùng 3 màu là C = Cyan (xanh lơ), M = Magenta (hồng sẫm) và Y = Yellow
(vàng) để biểu diễn các màu sắc khác nhau. Nếu lấy màu hồng sẫm cộng với
màu vàng sẽ ra màu đỏ, màu sẫm kết hợp với màu xanh lơ sẽ cho màu xanh
lam… Sự kết hợp của 3 màu trên sẽ cho màu đen ở đây không phải là đen
tuyệt đối và thường có độ tương phản lớn, nên trong ngành in, để tiết kiệm
mực in người ta thêm vào màu đen để in những chi tiết có màu đen thay vì
phải kết hợp 3 màu sắc trên, và như vậy ta có hệ màu CYMK, chứ K ở đây là
để kí hiệu màu đen (black).
Nguyên lý làm việc của hệ màu như sau: trên một nền giấy trắng, khi mỗi
màu này được ịn lên sẽ loại bỏ dần đi thành phần màu trắng, 3 màu C, M, Y


Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 16/50

khác nhau được in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó
một cách khác nhau và cuối cùng cho ta màu sắc cần in. Khi cần in màu đen,
thay vì phải in cả 3 màu thì người ta dùng màu đen để in lên. Nguyên lý này
khác với nguyên lý làm việc của hệ RGB ở chỗ hệ RGB là sự kết hợp của
các thành phần màu, còn hệ CMYK là sự loại bỏ lẫn nhau của các thành
phần màu.

Hình 2-4: Không gian màu CMYK

• Hệ màu YUV: mô hình YUV quy định một không gian màu được tạo bởi một
độ sáng và hai thành phần màu (chrominance). Mô hình YUV giúp tạo ra
màu đúng với nhận thức của con người chuẩn hơn thang màu RGB, là loại
được dùng trong các thiết bị đồ họa máy tính, nhưng không chuẩn bằng
thang màu HSV. Y đại diện cho thành phần độ sáng, U và V là đại diện cho
các thành phần màu. Không gian màu YCbCr hay YPbPr được sử dụng nhiều
trong các thiết bị phát hình, đều xuất phát từ YUV (Cb/Pb và Cr/Pr là những
biến thể của U và V), và đôi khi bị gọi một cách không chính xác là “YUV”.
Các tín hiệu YUV đều xuất phát từ các nguồn RGB. Các giá trị trọng số của
R, G và B được cộng lại với nhau để tạo ra một tín hiệu Y đơn, biểu diễn cho
độ sáng chung tại một điểm đó. Tín hiệu U sau đó được tạo ra bằng cách trừ

Hệ thống cảnh báo cháy bằng video



ĐỒ ÁN TỐT NGHIỆP
Trang 17/50

Y khói tín hiệu xanh lam (B của RGB), và được nhân với một tỉ lệ có sẵn;
còn V được tính bằng cách trừ Y khỏi màu đỏ (R của RGB), và nhân tỉ lệ với
một hệ số khác.
Không gian màu YCbCr được sử dụng nhiều trong các hệ thống ảnh số,
video hay các chuẩn nén JPEG và MPEG. Vì không gian màu RGB chỉ thuận
tiện cho hiển thị màn hình nhưng lại không thuận tiện cho việc lưu trữ và
chuyển đổi nên người ta đề xuất ra không gian này để thuận lợi cho việc nén
và chuyển đổi.
Không gian màu YCbCr mô tả màu sắc bằng 3 thông số là Y – biểu diễn
thành phần độ sáng, Cb – biểu diễn sắc tố xanh dương, Cr – biểu diễn sắc tố
đỏ. YCbCr là dạng biểu diễn số của hệ thống màu, có nghĩa là các thành
phần Y, Cb, Cr nhận được các giá trị số nguyên.
Công thức để chuyển đổi từ không gian màu RGB sang YCbCr phát biểu
dưới dạng ma trận:
(1)

Hình 2-5: Hình ảnh minh họa chuyển đổi từ RGB sang YCbCr

1.5 Các bước xử lý ảnh
Thu ảnh

Rời rạc/Số hóa
Lượng tử hóa
Nén
Hệ thống cảnh báo cháy bằng video



ĐỒ ÁN TỐT NGHIỆP
Trang 18/50

Tăng cường ảnh

Phân đoạn ảnh

Chọn đặc trưng

Biểu diễn ảnh

Giải thích ảnh
Hình 2-6: Các bước cơ bản trong xử lý ảnh

Các bước cơ bản trong xử lý ảnh được diễn ta như sau: ảnh đầu vào sẽ được thu
bằng thiết bị thu ảnh, sau đó chuyển dữ liệu của ảnh thành rời rạc, nén để có hiệu
quả trong lưu trữ hoặc truyền. Sau khi đã rời rạc, số hóa, ảnh sẽ được cải thiện chất
lượng như tăng độ tương phản, khử mờ hoặc nhiễu. Tiếp theo là bước phân đoạn
ảnh. Bước này sẽ chia ảnh thành các đối tượng hoặc các phần tử, rồi từ đó dựa vào
các đặc trưng thích hợp hoặc bộ mô ra để phân chia các lớp đối tượng. Sau khi đã
chọn đặc trưng các đối tượng, các đối tượng này sẽ được gán nhãn dựa trên thông
tin của bộ mô tả. Rồi từ đó sẽ gán ý nghĩa cho các đối tượng được nhận dạng.
1.6 Kỹ thuật phân vùng theo ngưỡng [1]
Biên độ của các thuộc tính vật lý của ảnh (như độ phản xạ, độ truyền sáng, màu
sắc…) là một đặc tính đơn giản và hữu ích. Kỹ thuật phân ngưỡng theo biên độ rất
Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP

Trang 19/50

hữu ích với những ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang
nếu biên độ đủ lớn đặc trưng cho phân đoạn ảnh. Ví dụ biên độ của bộ cảm biến
hồng ngoại có thể phản ánh được nhiệt độ thấp hay nhiệt độ cao. Bước quan trọng
của giải thuật này là việc chọn ngưỡng để phân đoạn. Thông thường sẽ tiến hành
theo các bước chung như sau:
• Xác định đỉnh và khe dựa trên xem xét lược đồ xám của ảnh, nếu như ảnh có
nhiều đỉnh và khe có thể sử dụng để chọn ngưỡng.
• Chọn ngưỡng Th sao cho một phần xác định trước của toàn bộ số mẫu sẽ
thấp hơn Th.
• Xét lược đồ của các điểm lân cận để điều chỉnh ngưỡng.
• Xem xét lược đồ xám của những điểm tiêu chuẩn đã chọn để chọn ngưỡng.
Giải thuật phân vùng theo ngưỡng có thể hiểu một cách đơn giản là các đối tượng
mà ta quan tâm trên nền tối (background), một tham số ngưỡng Th sẽ chọn được
một ảnh F(x,y) nếu:
(2)
Có rất nhiều thuật toán chọn ngưỡng: ngưỡng cố định, dựa trên lược đồ, sử dụng
Entropy, sử dụng tập mờ, chọn ngưỡng thông qua sự không ổn định của lớp và tính
thuần nhất của vùng.
Chọn ngưỡng cố định: đây là một phương pháp chọn ngưỡng độc lập với dữ liệu
ảnh. Nếu biết trước được là chương trình ứng dụng sẽ làm việc với các ảnh có độ
tương phản khá cao, trong đó các đối tượng quan tâm rất tối còn nền gần như đồng
nhất và rất sáng thì việc chọn ngưỡng Th = 128 (dựa theo thang độ sáng từ 0 đến
255) là một giá trị chọn khá chính xác. Chính xác ở đây hiểu theo nghĩa là số các
điểm ảnh bị phân lớp sai là cực tiểu.
Chọn ngưỡng dựa trên lược đồ: kỹ thuật này chọn ngưỡng tự động xuất phát từ lược
đồ xám. Kỹ thuật này tận dụng được những lợi thế do sự làm trơn dữ liệu lược đồ
ban đầu nhằm loại bỏ những giao động nhỏ về độ sáng. Một số thuật toán thường
gặp là: thuật toán đẳng hiệu, thuật toán đối xứng nền, thuật toán tam giác, chọn

ngưỡng theo biểu đồ Histogram…

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 20/50

• Thuật toán đẳng hiệu: là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và
Calvard đưa ra.
Thuật toán này được mô tả như sau:
-

Bước 1: Chọn giá trị ngưỡng khởi động
Bước 2: Tính các trung bình mẫu ( của những điểm ảnh thuộc đối tượng

-

và của những điểm ảnh nền.
Bước 3: Tính ngưỡng trung gian theo công thức:
(3)

- Bước 4: Nếu kết thúc và dừng thuật toán. Ngược lại: thực hiện từ bước 2.
• Thuật toán đối xứng nền: kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh
phân biệt trong lược đồ đối xứng qua đỉnh có giá trị lớn nhất trong phần lược
đồ thuộc về các điểm ảnh nền. Kỹ thuật này có thể tận dụng ưu điểm của
việc làm trơn được mô tả trong chương trình. Đỉnh cực đại max tìm được
nhờ tiến hành tìm giá trị cực đại trong lược đồ. Sau đó thuật toán sẽ áp dụng
ở phía không phải là điểm ảnh thuộc đối tượng ứng với giá trị cực đại đó
nhằm tìm ra giá trị độ sáng a ứng với giá trị phần trăm p% mà: P(a)=p%,

trong đó P(a) là hàm phân phối xác suất về độ sáng.

Hình 2-6: Hình minh họa thuật toán đối xứng nền

Giả thiết là ảnh có các đối tượng tối trên nền sáng. Giả sử mức là 5% thì có
nghĩa là ta phải ở bên phải đỉnh max một giá trị a sao cho P(a)=95%. Do tính
đối xứng đã giả định, ta sử dụng độ dịch chuyển về phía trái của điểm cực
đại tìm giá trị ngưỡng T: T=max – (a – max). Kỹ thuật này dễ dàng điều
chỉnh được cho phù hợp với tình huống ảnh có các đối tượng sáng trên một
nền tối.

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 21/50

• Thuật toán tam giác: Khi một ảnh có các điểm ảnh thuộc đối tượng tạo nên
một đỉnh yếu trong lược đồ ảnh thì thuật toán tam giác hoạt động rất hiệu
quả. Thuật toán này do Zack đề xuất và được mô tả như sau:
- Bước 1: Xây dựng đường thẳng là đường nối 2 điểm ( và (. Trong đó là
-

điểm Histogram ứng với độ sáng nhỏ nhất .
Bước 2: Tính khoảng cách d từ của lược đồ (ứng với điểm sáng b) đến .

-

Trong đó, .
Bước 3: Chọn ngưỡng T = Max.


Hình 2-7: Hình minh họa thuật toán tam giác

Chọn ngưỡng đối với Bimodal Histogram: Ngưỡng T được chọn tại vị trí cực tiểu
của Histogram nằm giữa hai đỉnh của Histogram. Điểm cực đại của Histogram có
thể dễ dàng được phát hiện bằng cách sử dụng biến đổi chóp mũ (top hat) do Meyer
đưa ra: phụ thuộc vào tình huống phải làm việc là đối với đối tượng sáng trên nền
tối hay đối tượng tối trên nền sáng mà phép biến đổi top hat sẽ có một trong hai
dạng sau:
• Các đối tượng sáng: .
• Các đối tượng tối: .

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 22/50

Hình 2-8: Bimodal Histogram

Nếu Histogram bị nhiễu thì việc tính toán giá trị cực tiểu sẽ rất khó khăn. Do đó
trường hợp này nên làm trơn Histogram.
Phương pháp phân đoạn dựa trên ngưỡng cục bộ thích nghi: số ngưỡng cục bộ và
giá trị của chúng không được chỉ định trước mà được trích lọc thông qua quá trình
kiểm tra các thông tin cục bộ. Giải thuật gồm các bước tuần tự như sau:
-

Áp dụng giải thuật Watershed chia ảnh thành nhiều vùng con.
Trộn các vùng và đồng thời phát hiện ngưỡng cục bộ. Ngưỡng được tính
từ thông tin cục bộ của vùng và các vùng lân cận.


1.7 Kỹ thuật phát hiện chuyển động
Hệ thống giám sát chuyển động được ra đời từ những năm 1960, là một trong
những hệ thống trợ giúp đắc lực nhất cho con người thực hiện theo dõi và giám sát.
Từ các hình ảnh thu được từ những nơi được quan sát, con người có thể phát hiện
được chuyển động của các đối tượng trong các khung hình, có thể xác định được
đối tượng đó là người, phương tiện hay vật thể. Minh họa rõ hơn, với một bài toán
giám sát giao thông một hệ thống giám sát thông minh có thể cho ta biết được số
lượng phương tiện lưu thông qua đoạn đường được theo dõi, đưa ra thông tin về tốc
độ chuyển động, đường đi của đối tượng được theo dõi. Với một bài toán phát hiện,
dự đoán, hệ thống giám sát thông minh có thể phát hiện một đám cháy, tự động
cảnh báo cháy ở nơi được quan sát và theo dõi.
Hiện nay, trên thế giới các hệ thống giám sát thông minh bằng video đã được phát
triển và chứng minh được hiệu quả nhất định trên một số lĩnh vực như giám sát hoạt
động của con người, giám sát giao thông,… Song các hệ thống vẫn gặp phải một số
tồn tại như hiệu quả của việc quan sát luôn phụ thuộc vào điều kiện môi trường
quan sát, kiểu chuyển động của đối tượng hay các lý do khách quan khác. Chính vì
thế mà việc nghiên cứu và phát triển các giải phát, công nghệ mới vẫn đang được
tiến hành nhằm đáp ứng được yêu cầu về một hệ thống giám sát thông minh hoàn
thiện nhất. Bên cạnh sự phát triển của các thiết bị phần cứng, hệ thống giám sát đòi
hỏi con người thường trực 24/24 để giảm sát các màn hình theo dõi. Một phút lơ là
của con người có thể để đối tượng đột nhập vào mục tiêu. Kỹ thuật xử lý ảnh số thu
Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP
Trang 23/50

được từ các thiết bị quan sát sẽ tự động phân tích và đưa ra cảnh báo khi có một đối
tượng đột nhập vào mục tiêu, đông thời hệ thống sẽ lưu lại hình ảnh đối tượng và

theo dõi dấu đối tượng trong vùng quan sát. Căn cứ vào cảnh báo tự động đó, con
người sẽ biết để có biện pháp xử lý đảm bảo mục tiêu an toàn.
1.1.5 Phương pháp trừ nền
Phương pháp chung để nhận dạng đối tượng chuyển động là trừ nền, ở đây mỗi
khung video được so sánh với mô hình tham chiếu hoặc mô hình nền. Các pixel
trong frame ảnh hiện thời mà lệch đáng kể so với nền sẽ được xem như là đối tượng
chuyển động. Một giải thuật trừ nền tốt phải xử lý được sự thay đổi độ sáng, sương
mù, tuyết, đổi bóng… Ngoài ra, nó phải tính toán nhanh và có yêu cầu bộ nhớ ít,
trong khi vẫn có khả năng xác định những đối tượng chính xác trong video. Bốn
bước chính trong giải thuật trừ nền là: tiền xử lý, mô hình hóa nền, phát hiện đối
tượng và hợp lệ hóa dữ liệu.
Tiền xử lý: bao gồm những tác vụ xử lý ảnh đơn giản cho video đầu vào tạo điều
kiện cho xử lý trong những bước tiếp theo.
Mô hình hóa nền: sử dụng những frame video mới để tính toán và cập nhật một mô
hình nền. Mô hình nền này cung cấp phần mô tả thống kê của toàn bộ cảnh nền.
Dò tìm đối tượng: xác định những pixel trong frame video không tương ứng với mô
hình nền.
Hợp lệ hóa dữ liệu: khảo sát mặt nạ thích hợp này, loại bỏ những pixel không tương
ứng với mô hình nền.
Thuật toán trừ nền xác định mức xám của ảnh Video từ một camera tĩnh. Phương
pháp trừ nền này khởi tạo một nền tham khảo với một số frame đầu tiên của Video
đầu vào. Sau đó, nó trừ giá trị cường độ của mỗi điểm ảnh trong ảnh hiện thời cho
giá trị tương ứng trong ảnh nền tham khảo.
Thuật toán trừ nền được thực hiện như sau: gọi là biểu diễn của giá trị cường độ
mức xám ở điểm ảnh có vị trí (x) và ở trường hợp thứ n của dãy Video I thuộc trong
đoạn [0,255]. Gọi là giá trị cường độ nền tương ứng cho điểm ảnh ở vị trí (x) ước
lượng theo thời gian từ ảnh Video đến .

Hệ thống cảnh báo cháy bằng video



ĐỒ ÁN TỐT NGHIỆP
Trang 24/50

Một điểm ảnh ở vị trí (x) trong ảnh hiện thời thuộc thành phần nổi trội nếu nó thỏa
mãn: . Trong đó là giá trị ngưỡng có khả năng thích hợp được khởi tạo cùng với
ảnh Video đầu tiên ,, và ngưỡng được khởi tạo bởi giá trị đã được xác định trước.
Nền cơ sở và các ảnh ngưỡng phải được cập nhật liên tục từ các ảnh đầu vào. Sự
phối hợp cập nhật này là khác nhau đối với các vị trí điểm, chẳng hạn như một điểm
thì sẽ khác với :
(4)
(5)
Trong đó là các hằng số chỉ ra rằng có bao nhiêu thông tin từ các ảnh vào được đẩy
vào nền và các ảnh ngưỡng.
Nói cách khác, nếu mỗi điểm ảnh nền được coi như là chuỗi các lần, các ảnh nền là
một giá trị trung bình của trọng số vùng theo thời gian của chuỗi các ảnh đầu vào và
ảnh ngưỡng là giá trị trung bình trong số vùng của lần khác nhau của các ảnh đầu
vào và nền đó.

Hình 2-9: Hình minh họa phương pháp trừ nền [1][2][3]

1.1.6 Phương pháp Optical Flow
Hiện nay, có rất nhiều kỹ thuật được sử dụng để phát hiện đối tượng chuyển động,
một trong những kỹ thuật đang được sử dụng rộng rãi hiện nay là kỹ thuật Optical
Flow.

Hệ thống cảnh báo cháy bằng video


ĐỒ ÁN TỐT NGHIỆP

Trang 25/50

Optical Flow (giải thuật luồng quang) là khái niệm chỉ sự chuyển động tương đối
của các điểm trên bề mặt của một đối tượng, vật thể nào đó gây ra dưới góc quan sát
của một điểm mốc (ví dụ: mắt, camera,…). Sự chuyển động của các vật thể (mà
thực tế có thể coi là sự chuyển động của các điểm trên bề mặt vật thể ấy) trong
không gian 3 chiều, khi được chiếu lên một mặt phẳng quan sát 2D được gọi là
motion field. Nhìn chung, mục đích của Optical Flow là xác định (xấp xỉ) motion
field từ một tập các frame ảnh thay đổi theo thời gian, chúng được sử dụng rộng rãi
trong các bài toán phát hiện, nhận dạng đối tượng, tracking…

Hình 2-9: Hình minh họa Optical Flow [4][5]

Phương pháp Lucas – Kanade là một phương pháp khác biệt được sử dụng rộng rãi
cho đánh giá Optical Flow được phát triển bởi Bruce D. Lucas và Takeo Kanade.
Thuật toán Lucas – Kanade dựa vào thông tin tại chỗ mà được từ vài window nhỏ
quanh mỗi điểm quan tâm. Tuy nhiên, với trường hợp các chuyển động là lớn dẫn
đén có thể di chuyển các điểm ra ngoài local window và do đó thuật toán sẽ không
thể tìm thấy. Vấn đề này dẫn đến sự phát triển thuật toán Pyramidal Lucas Kanade:
theo vết bắt đầu từ mức cao nhất của một image pyramid (chi tiết thấp nhất) và làm
việc xuống đến mức thấp nhất (chi tiết tốt hơn). Theo trên các Image pyramid cho
phép các chuyển động lớn có thể được bắt bởi các local window. Ý tưởng cơ bản
của thuật toán Lucas Kanade dựa vào giả thiết:
-

Mức sáng của các điểm ảnh không có thay đổi từ frame thứ n sang frame

-

thứ n+1: (6)

Chuyển động ảnh của một khối bề mặt thay đổi chậm theo thời gian.

Hệ thống cảnh báo cháy bằng video


×