Tải bản đầy đủ (.doc) (20 trang)

TÌM HIỂU PHƯƠNG PHÁP NHẬN DẠNG CÁC ĐỐI TƯỢNG 3D VÀ ĐỀ XUẤT ĐỊNH HƯỚNG ỨNG DỤNG CÔNG NGHỆ NHẬN DẠNG 3D TRONG THỰC TẾ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (428.57 KB, 20 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

TIỂU LUẬN MÔN HỌC
CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
Tên đề tài:
TÌM HIỂU PHƯƠNG PHÁP NHẬN DẠNG CÁC ĐỐI
TƯỢNG 3D VÀ ĐỀ XUẤT ĐỊNH HƯỚNG ỨNG DỤNG
CÔNG NGHỆ NHẬN DẠNG 3D TRONG THỰC TẾ
Giáo viên HD : GS.TSKH. Hoàng Văn Kiếm
Họ tên học viên : Nguyễn Trọng Ngân
Mã số học viên : CH1101107
Cao học : Khóa 6
Chuyên ngành : Khoa học máy tính - Mã số: 60.48.01
Tháng 05/2012
LỜI CÁM ƠN
Trong quá trình thực hiện bài tiểu luận, với sự hướng dẫn nhiệt tình của thầy
Hoàng Văn Kiếm và những ý kiến đóng góp của bạn bè đã cho em nguồn động viên lớn
để hoàn thành nhiệm vụ của bài tiểu luận. Qua đó, bản thân đã đạt được nhiều tiến bộ về
kiến thức và hoạch định được hướng nghiên cứu, tìm hiểu để phát triển thành luận văn
tốt nghiệp trong tương lai.
Em chân thành cám ơn quý Thầy Cô trong khoa Khoa học máy tính, phòng đào tạo
sau đại học, trường đại học Công nghệ thông tin – đại học Quốc gia Tp Hồ Chí Minh đã
tận tình giảng dạy, hướng dẫn, giúp đỡ và tạo điều kiện cho em thực hiện tiểu luận này.
Mặc dù rất cố gắng, song tiểu luận vẫn còn nhiều thiếu sót. Em mong nhận được
nhiều sự thông cảm và góp ý của thầy Hoàng Văn Kiếm.
Xin chân thành gửi lời cám ơn sâu sắc đến quý thầy.
Tp.Hồ Chí Minh, ngày 31 /5 / 2012
NHẬN XÉT CỦA GIẢNG VIÊN
NHẬN XÉT CỦA GIẢNG VIÊN




















NHẬN XÉT CỦA GIẢNG VIÊN
MỤC LỤC
LỜI CÁM ƠN ii
NHẬN XÉT CỦA GIẢNG VIÊN iii
MỤC LỤC iv
DANH MỤC CÁC HÌNH v
1. CHƯƠNG 1 – GIỚI THIỆU CHUNG 1
1.1. Thông tin chung về môn học 1
1.2. Giới thiệu về đề tài tiểu luận và lý do chọn đề tài 1
2. CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT 3
2.1. Giới thiệu về kỹ thuật đồ họa 2D, 2.5D và 3D 3
2.2. Thuật toán ICP (Iterative Closest Point) và nhận dạng gương mặt 3D 8

2.3. Nhận dạng gương mặt 3D trên nền tảng thuật toán ICP 8
3. CHƯƠNG 3 – ĐỀ XUẤT HƯỚNG NGHIÊN CỨU VÀ CÁC HƯỚNG ỨNG
DỤNG TRIỂN KHAI TRONG THỰC TẾ 12
3.1. Ứng dụng triển khai trong thực tế 12
3.2. Đề xuất hướng nghiên cứu, phát triển 13
4. TÀI LIỆU THAM KHẢO 15
DANH MỤC CÁC HÌNH
DANH MỤC CÁC HÌNH
Hình 1-1 Các điểm tương đồng và điều kiện xuất hiện của các đối tượng 3D 2
Hình 2-2 Thu thập ảnh 2.5D 9
Hình 2-3 Quy trình nhận dạng gương mặt 3D 9
Hình 2-4 Tinh chỉnh thô giữa mô hình thăm dò và mô hình bên trong Database 10
Hình 3-5 Mô hình giám sát an ninh 12
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
1. CHƯƠNG 1 – GIỚI THIỆU CHUNG
1.1. Thông tin chung về môn học
Môn học Công nghệ tri thức và ứng dụng là một môn học thuộc dạng bắt buộc trong
nội dung chương trình khung đào tạo cao học tại trường đại học Công nghệ thông tin.
Môn học cung cấp cho học viên các khái niệm về công nghệ tri thức, nền tảng nghiên
cứu, nâng cao hiệu quả ứng dụng máy tính thông qua các hệ thống máy tính thông minh,
có thể xữ lý một phần các công việc như con người.
1.2. Giới thiệu về đề tài tiểu luận và lý do chọn đề tài
1.2.1. Tình hình nghiên cứu nhận dạng đối tượng 3D trên thế giới
Hiện nay, việc nghiên cứu nhận dạng trên các đối tượng đồ họa 2D và đã có nhiều
ứng dụng được triển khai phát triển trên nền tảng công nghệ này như ứng dụng trong việc
xác thực người dùng trong các máy tính xách tay, ứng dụng trong lĩnh giám sát. Tuy
nhiên, việc tham gia nghiên cứu công nghệ nhận dạng trên các đối tượng 3D chỉ đang
triển khai trong các phòng thí nghiệm và chưa đưa ra phổ biến trong các ứng dụng trên
thực tế.
1.2.2. Tình hình nghiên cứu ảnh nhận dạng đối tượng 3D trên

trong nước
Nghiên cứu nhận dạng đối tượng đồ họa 3D tại Việt Nam chưa được phổ biến rộng
rãi. Gần như không có hoặc có rất ít công trình nghiên cứu được công bố thông qua các
tạp chí khoa học trong nước.
1.2.3. Lý do chọn đề tài
Nhận dạng đối tượng nói chung là một phạm vi nghiên cứu khá rộng. Vì vậy trong
đề tài này, em chỉ giới hạn tìm hiểu các kỹ thuật, phương pháp và thao tác nhận dạng
gương mặt người.
Công nghệ nhận dạng gương mặt 2D đã được ứng dụng trong rất nhiều lĩnh vực như
xác thực người dùng trong máy tính cá nhân, ứng dụng trong các tài liệu điện tử như
passport, Identity card, phát hiện mặt người trong các máy ảnh số… Tuy nhiên, công
nghệ này đã bộc lộ một số điểm yếu như:
- Các đối tượng có các đăt điểm tương đồng, xuất hiện với các đặc điểm tương tự
như: cha-con trai, anh-em song sinh…. Vì vậy, để máy tính có thể tạo ra những mô
tả cho các đối tượng này để nhận dạng một cách chính xác là một điều khó khăn.
- Điều kiện xuất hiện của các đối tượng (ánh sáng, sắc thái, biểu lộ của nét mặt)ảnh
hưởng rất lớn đến kết quả nhận. Minh họa theo hình bên dưới. Trong thực tế, việc
điều chỉnh ảnh đầu vào của các hệ thống nhận dạng thông qua kỹ thuật xữ lý ảnh số
không làm tăng đáng kể hiệu quả nhận dạng của máy tính.
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
Hình 1-1 Các điểm tương đồng và điều kiện xuất hiện của các đối tượng 3D
- Máy tính không thể phân biệt được ảnh đầu vô được chụp hay đang phân tích trực
tiếp từ gương mặt người dùng. Năm 2008, trung tâm Bkis đã công bố kết quả kiểm
định trên các chương trình xác thực mặt người của một số hãng máy tính nỗi tiếng
(Asus, Lenovo và Toshiba). Hàng rào xác thực người dùng thông qua kỹ thuật nhận
dạng gương mặt (được thiết lập ở mức an ninh cao nhất) đã dễ dàng bị đánh lừa
bằng các hình chụp của người sử dụng
[L-1]
Vì các hạn chế đã phân tích ở trên và sự phát triển của các thiết bị công nghệ thông
tin hiện nay ( có nhiều thiết bị hỗ trợ ảnh 3D…), đề tài này em sẽ tập trung và việc nghiên

cứu, tiếp thu công nghệ nhận dạng gương mặt trên nền tảng ảnh 3D nhằm khắc phục được
các nhược điểm của công nghệ nhận dạng gương mặt trên ảnh 2D đồng thời đề xuất các
xu hướng áp dụng công nghệ nhận dạng 3D vào trong việc phát triển các ứng dụng thực
tế.
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
2. CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT
2.1. Giới thiệu về kỹ thuật đồ họa 2D, 2.5D và 3D
2.1.1. Đồ họa 2D và nhận dạng ảnh trên ảnh 2D
Đồ họa máy tính 2D là một thế hệ ảnh kỹ thuật số trên nền tảng máy tính. Đồ họa
2D là dạng biểu diễn các điểm, mô hình trên không gian 2 chiều. Nghiên cứu về đồ họa
2D là một nhánh của ngành khoa học máy tính. Hiện nay, đồ họa máy tính 2D đã có được
nhiều công trình nghiên cứu và được áp dụng khá phổ biến trong cuộc sống. Đồ họa 2D
chủ yếu được sử dụng trong các ứng dụng được phát triển theo công nghệ in ấn truyền
thống và vẽ: kiểu chữ, bản đồ, bản vẽ kỹ thuật, quảng cáo…
Trong vài thập kỷ gần đầy, việc phân tích, đo lường, mô tả, phát hiện gương mặt
thông qua các đặc điểm sinh trắc học đã được áp dụng rộng rãi trong nhiều ứng dụng như:
tài liệu điện tử như passport, Identity card, phát hiện mặt người trong các máy ảnh số…
Từ năm 2002, công nghệ xác định gương mặt đã nâng độ chính xác lên khá cao
(khoảng từ 90%95%) và được ứng dụng rộng rãi trong các máy chụp ảnh kỹ thuật số.
Để nhận dạng mặt người, trước hết phải tiến hành phát hiện gương mặt và chụp lại
ảnh gương mặt và so sánh với các hình ảnh lưu trong cơ sở dữ liệu. Việc chụp ảnh này
ảnh hưởng rất lớn đến kết quả nhận dạng (độ sang, nét mặt ). Độ chính xác này chỉ đạt
khoảng 30% 35%,bộ lộ nhiều khiếm khuyết do các đặc điểm sinh trắc học con người để
nhận dạng không được thể hiện trên không gian hai chiều. Vì vậy, các phần mềm nhận
dạng mặt người được áp dụng trong các dòng máy tính xách tay tung ra thị trường đã bộ
lộ nhiều lỗ hỏng về mặt an ninh
[L-1]
.
2.1.1.1 Nhận dạng dựa trên các đặc trưng khuôn mặt
Đây là phương pháp nhận dạng khuôn mặt dựa trên việc xác định các đặc trưng hình

học của các chi tiết trên một khuôn mặt (như vị trí, diện tích, hình dạng của mắt, mũi,
miệng,…), và mối quan hệ giữa chúng (như khoảng cách của hai mắt, khoảng cách của
hai lông mày,…).
Ưu điểm của phương pháp này là nó gần với cách mà con người sử dụng để nhận
biết khuôn mặt. Hơn nữa với việc xác định đặc tính và các mối quan hệ, phương pháp này
có thể cho kết quả tốt trong các trường hợp ảnh có nhiều nhiễu như bị nghiêng, bị xoay
hoặc ánh sáng thay đổi.
Nhược điểm của phương pháp này là cài đặt thuật toán phức tạp do việc xác định
mối quan hệ giữa các đặc tính đòi hỏi các thuật toán phức tạp. Mặt khác, với các ảnh kích
thước bé thì các đặc tính sẽ khó phân biệt do đó khó tính toán được các đặc trưng trên
khuôn mặt.
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
2.1.1.2 Nhận dạng dựa trên xét toàn diện khuôn mặt:
Nhận dạng đựa trên toàn diện khuôn mặt, có nghĩa mình sẽ không đi xét đến từng
thành phần đặc trưng trên khuôn mặt nữa… Khuôn mặt là một không gian cụ thể và có
thể tìm những đặc trưng, những đặc điểm chính trên không gian đó.
Nội dung chính của hướng tiếp cận này là xem mỗi ảnh có kích thước RxC là một
vector trong không gian RxC chiều. Ta sẽ xây dựng một không gian mới có chiều nhỏ
hơn sao cho khi biểu diễn trong không gian đó các đặc điểm chính của một khuôn mặt
không bị mất đi. Trong không gian đó, các ảnh của cùng một người sẽ được tập trung lại
thành một nhóm gần nhau và cách xa các nhóm khác.
Hai phương pháp thường được sử dụng là trong hướng tiếp cận này:
• PCA (Principle Components Analysis)
• LDA (Linear Discriminant Analysis)
Ngoài ra, hiện nay đã có nhiều phương pháp kết hợp mạng neural và thuật toán PCA
để làm tăng độ chính xác của nhận dạng.
2.1.2. Đồ họa 2.5D, 3D
Đồ họa máy tính 3D là một dạng đồ họa máy tính dựa trên không gian 3 chiều để
biểu diễn một đối tượng hình học 3D lưu trữ trong máy tính và được thể hiện cho người
xem trong thời gian thực. Đồ họa máy tính 3D cũng dựa trên các thuật toán cơ bản của đồ

họa 2D.
2.1.2.1 Lưu trữ các file đồ họa 3D
Hiện nay có rất nhiều định dạng cho phép lưu trữ các file dạng số trong máy tính
như định dạng PLY, OBJ, VRML…Tuy nhiên, trong bài báo cáo( và trong định hướng
thực hiện luận văn về sau), em sẽ tập trung thao tác trên dạng dữ liệu PLY và sẽ thực hiện
chuyển đổi từ các dạng dữ liệu khác về dạng PLY để tiến hành nhận dạng, so sánh…
2.1.2.2 Cấu trúc file đồ họa 3D dưới định dạng .PLY
PLY là một dạng file số lưu trữ trong máy tính để biểu diễn, lưu trữ thông tin của cá
đối tượng đồ họa 3D. Kỹ thuật nhận dạng các ảnh 3D (được trình bày ở phần sau) sẽ tập
trung xữ lý các đối tượng 3D được lưu trữ dạng file .PLY. Cấu trúc file PLY còn được
biết đến như là Polygon File Format hay là Stanford Triangle Format. File PLY được phát
triển bởi Greg Turk và các cộng sự tại phòng thí nghiệm Stanford graphics vào giữa
những thập niên 90. Các tập tin được tổ chức gồm phần tiêu đề(header), các yếu tố xác
định thuộc tính của các Mesh như danh sách đỉnh(Vertex), danh sách các mặt (Face).
Ngoài ra còn có thể kèm theo các tập hợp các yếu tố riêng. Thông thường các yếu tố riêng
này là các cạnh, mẫu của các vùng bản đồ, các dải tam giác …
Cấu trúc file PLY cơ bản bao gồm các thành chính:
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
- Header: chứa các thông tin chung của file
- Vertex List: danh sách các đỉnh
- Face List: Danh sách các mặt của đối tượng đồ họa
- Lists of other elements: các danh sách về các thuộc tính khác.
Hiện tại, có 2 dạng phiên bản của file .PLY: file dạng nhị phân (binary file) và file
dạng ký tự mã ASCII.
Sau đây là mô tả cho một file PLY đơn giản:
ply
format ascii 1.0
comment made by anonymous
element vertex 8
property float32 x

property float32 y
property float32 z
element face 6
property list uint8 int32 vertex_index
end_header
0 0 0
0 0 1
0 1 1
0 1 0
1 0 0
1 0 1
1 1 1
1 1 0
4 0 1 2 3
4 7 6 5 4
4 0 4 5 1
4 1 5 6 2
4 2 6 7 3
4 3 7 4 0
2.1.2.2.1. Header
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
Header của cả 2 dạng file (binary và ASCII) đều được thể hiện bằng dạng ký tự
thông thường (text). Phần thuộc tính dữ liệu phía header sẽ được thể hiện khác nhau( bằng
mã ASCII hoặc dạng binary). Dưới đây là mô tả một header của một file PLY đơn giản:
ply
format ascii 1.0
comment made by anonymous
element vertex 8
property float32 x
property float32 y

property float32 z
element face 6
property list uint8 int32 vertex_index
end_header
Bắt đầu header của một file PLY bằng từ khóa “Ply”. Dòng tiếp theo cho biết file
thuộc dạng nào (binary hay ASCII). Cho đến hiện nay, các phiên bản đang là 1.0 theo 3
dạng như sau:
format ascii 1.0
format binary_little_endian 1.0
format binary_big_endian 1.0
Sau phần mô tả về thông tin phiên bản và loại định dạng file. Dòng kế tiếp sẽ mô tả
các dòng ghi chú (comment). Các thông tin ghi chú sẽ được viết sau từ khóa comment:
comment This is a comment!
Từ khóa “element” ở dòng tiếp theo chỉ ra các thành phần của file như danh sách
đỉnh, danh sách các mặt:
element vertex 8
property float32 x
property float32 y
property float32 z
Định nghĩa trên cho ta thấy file .PLY này sẽ bao gồm 8 đỉnh và các thuộc tính sau
đó sẽ định nghĩa kiểu dữ liệu cho từng đỉnh. Trong phần mô tả trên đang sử dụng hệ trục
Oxyz và kiểu dữ liệu ứng với từng trục tọa độ là float32.
element face 6
property list uint8 int32 vertex_index
Tiếp theo, sẽ là thành phần các mặt. Hiện tại, đang có 6 mặt trong mô tả trên.
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
end_header
Kết thúc phần header sẽ được đánh dấu bằng từ khóa “end_header”
2.1.2.2.2. Vertex List
0 0 0 { start of vertex list }

0 0 1
0 1 1
0 1 0
1 0 0
1 0 1
1 1 1
1 1 0
Bắt đầu phần danh sách tọa độ các đỉnh theo hệ trục “xyz”. Trong mô tả trên, số
lượng các đỉnh dang là 8.
2.1.2.2.3. Face List
4 0 1 2 3 { start of face list }
4 7 6 5 4
4 0 4 5 1
4 1 5 6 2
4 2 6 7 3
4 3 7 4 0
2.1.2.2.4. Các thành phần do người dùng định nghĩa
Ngoài các thành phần đã giới thiệu ở trên. Định dạng file .PLY còn cho phép người
dùng có thể tự định nghĩa các thành phần theo cấu trúc tương tự các phần định nghĩa đỉnh,
mặt. Các thành phần này phải được đặt trong phần Header của file. Dưới đây là một số
thành phần do người dùng định nghĩa:
element material 6
property ambient_red uint8 { ambient color }
property ambient_green uint8
property ambient_blue uint8
property ambient_coeff float32
property diffuse_red uint8 { diffuse color }
property diffuse_green uint8
property diffuse_blue uint8
property diffuse_coeff float32

TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
property specular_red uint8 { specular color }
property specular_green uint8
property specular_blue uint8
property specular_coeff float32
property specular_power float32 { Phong power }
2.2. Thuật toán ICP (Iterative Closest Point) và nhận dạng gương
mặt 3D
2.2.1. Thuật toán ICP
Thuật toán ICP
[ B-3]
(Iterative Closest Point) được Paul J. Besl và Neil D. Mackay
giới thiệu tại tạp chí khoa học IEEE lần đầu tiên vào tháng 2 năm 1992. ICP được sử dụng
để làm giảm tối đa sự khác biệt giữa hai tập hợp điểm. ICP được ứng dụng rộng rãi trong
việc tinh chỉnh các ảnh trong không gian 3 chiều, tái tạo bề mặt của các ảnh 2D, 3D…
2.2.1.1 Thuật toán ICP
function ICP(Scene,Model)
begin
E`  + ∞;
(Rot,Trans)  In Initialize-Alignment(Scene,Model);
repeat
E  E`;
Aligned-Scene  Apply-Alignment(Scene,Rot,Trans);
Pairs  Return-Closest-Pairs(Aligned-Scene,Model);
(Rot,Trans,E`)  Update-Alignment(Scene,Model,Pairs,Rot,Trans);
Until |E`- E| < Threshold
return (Rot,Trans);
end
2.3. Nhận dạng gương mặt 3D trên nền tảng thuật toán ICP
2.3.1. Thu thập dữ liệu

Để có thể tiến hành việc nhận dạng gương mặt thông qua kỹ thuật đồ họa 3D. Việc
đầu tiên là phải xây dựng cơ sở dữ liệu ảnh 3D. Hiện nay, trên thị trường chưa có máy
ảnh hỗ trợ chụp ảnh 3D (chỉ có rất ít dòng hỗ trợ việc chụp ảnh 2.5D). Tuy nhiên, việc thu
thập dữ liệu 3D sẽ được thực hiện thông qua các máy quét 3D đã xuất hiện khá nhiều trên
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
thị trường. Ngoài ra, việc thu thập ảnh 3D có thể gắn kết, ghép nối các ảnh chụp ở nhiều
khía cạnh khác nhau (trước, trái, phải, sau) để tạo ra ảnh 3D hoàn chỉnh.
Sau khi thu thập được ảnh 3D vào cơ sở dữ liệu, hình ảnh để đưa vào để nhận dạng
gương mặt người có thể sử dụng ảnh 2.5D (chụp ở 3 hướng khác nhau: trái, phải, trước).
Hình 2-2 Thu thập ảnh 2.5D
Quy trình khái quát của phương pháp thu thập và nhận dạng gương mặt 3D được mô
tả ở hình bên dưới:
Hình 2-3 Quy trình nhận dạng gương mặt 3D
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
2.3.2. Ứng dụng ICP cho nhận dạng gương mặt
Việc nhận dạng mặt người thông qua ảnh 3D cơ bản sử dụng các chiều thông tin mà
ảnh 2D không thể hiện được để nâng cao độ chính xác và khắc phục các bất lợi của việc
nhận dạng trên nền tảng ảnh 2D đã được nêu ở phần trên.
Ngoài ra, ta không thể tiến hành phép so sánh 1-1 từ những điểm ảnh thu thập(2.5D)
được và các điểm của tập ảnh 3D từ cơ sở dữ liệu. Việc làm này sẽ chiếm rất nhiều thời
gian và tài nguyên của máy tính khi thực hiện. Kết quả thực hiện lại có thể sẽ không như
mong muốn. Trạng thái của người, thể hiện của nét mặt sẽ làm sai lệch quá trình nhận
dạng.
Vì vậy, để tiến hành nhận dạng một gương mặt người, ta cần có các bước tinh chỉnh
nhằm giảm thiểu tiêu tốn về mặt thời gian trong khi tiến hành nhận dạng.
Quá trình nhận dạng trên cơ sở thuật toán ICP theo các bước như sau:
2.3.3. Tinh chỉnh thô
Việc tinh chỉnh sẽ được thực hiện một cách tự động. Tuy nhiên, trong mô tả này sẽ
tập trung minh họa việc tinh chỉnh thông qua việc lựa chọn từ 2 điểm tương ứng trở lên
trên các mô hình thăm dò so sánh và mô hình được lưu trữ bên trong cơ sở dữ liệu thông

qua biến đổi ridid
[L-2]
. Thao tác này sẽ tạo ra một trạng thái tốt trước khi tiến hành nhận
dạng. Hình sau sẽ mô tả cách thức tiến hành tinh chỉnh
Hình 2-4 Tinh chỉnh thô giữa mô hình thăm dò và mô hình bên trong Database
2.3.4. Tinh chỉnh lại, nhận dạng
Sau khi các mô hình thăm dò đã được tinh chỉnh sơ bộ, việc tinh chinh lại và nhận
dạng sẽ sử dụng thuật toán ICP đã được đề cập ở trên. Thuật toán ICP sẽ lập lại các thao
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
tác làm giảm thiểu tối đa sai số bình phương trung bình của điểm với các điểm tương ứng
gần nó nhất.
Bắt đầu từ hai tập hợp điểm P={p
i
} là tập tra cứu và X={y
i
} là tập dữ liệu kiểm tra.
Chúng ta cần tìm ra một biến đổi rigid (R,T) dịch chuyển và xoay sao cho khoảng cách
giữa hai tập điểm dang xét là nhỏ nhất. Để xác định khoảng cách tối thiểu giữa mỗi điểm
p
i
và điểm tương tự, gần giống nó nhất trong tập X theo các xác định khoảng cách giữa
điểm và mặt trong không gian Eclidean. Biến đổi rigid sẽ được tính toán và áp dụng cho
từng điểm trong P.
Việc thực hiện này sẽ được lập đi lập lại luân phiên đến khi nó được hội tụ lại( sai số
nhỏ nhất và ổn định). Thuật toán ICP với thao tác như trên luôn luôn hội tụ đơn điệu trên
1 khoảng của tập xác định. Tuy nhiên, trong trường hợp các thông số khởi tạo trước khi
thực hiện thuật toán ICP thì nó sẽ hội tụ hoàn toàn trên tập xác định. Vì vậy, nếu sai số là
nhỏ hơn một ngưỡng nào đó (do người dùng thiết lập) thì chúng ta có thể kết luận được
ảnh khảo sát có thuộc một trong các ảnh có trong cơ sở dữ liệu.
2.3.5. Một số biến thể của thuật toán ICP để nâng cao độ chính

xác khi nhận dạng
Để tối ưu việc nhận dạng, ta có thể lựa chọn ra một số đặc điểm sinh trắc khác nhau
ở từng người như cằm, miệng, mắt… để tiến hành phân tích và nhận dạng. Điều này sẽ
giúp quá trình xử lý diễn ra nhanh hơn.
Ngoài ra, còn có thể kết hợp mạng neural nhân tạo, training việc so khớp ảnh để
phát hiện ra các điểm đặc trưng nhất của tường gương mặt để làm cơ sở cho việc nhận
dạng được chính xác hơn.
Trên thế giới hiện nay còn xuất hiện thêm một xu hướng về sử dụng ICP để nhận
dạng nhưng không kết hợp với các biến đổi rigid. Tuy nhiên đây là một nhánh rẽ khác
biệt và em chưa nghiên cứu tài liệu và các bài báo liên quan nên chưa thể đánh giá toàn
diện về xu hướng này.
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
3. CHƯƠNG 3 – ĐỀ XUẤT HƯỚNG NGHIÊN CỨU VÀ CÁC
HƯỚNG ỨNG DỤNG TRIỂN KHAI TRONG THỰC TẾ
3.1. Ứng dụng triển khai trong thực tế
3.1.1. Ứng dụng trong lĩnh vực giám sát an ninh, xác thực người
dùng
Trong các ứng dụng về giám sát an ninh hiện nay, chủ yếu phải do yếu tố con người
giám sát theo mô hình mô tả như sau:
Hình 3-5 Mô hình giám sát an ninh
Người theo dõi hệ thống luôn phải quan sát màn hình và phát hiện ra đối tượng khả
nghi. Tuy nhiên hạn chế của các hệ thống giám sát này phụ thuộc rất lớn vào yếu tố con
người. Người giám sát không thể tìm kiếm trong kho các dữ liệu khổng lồ về con người,
Vùng giám sát
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
tội phạm để nhận biết khi có đối tượng khả nghi rơi vào vùng giám sát. Với hệ thống nhận
dạng gương mặt 3D, các camera hỗ trợ chụp ảnh người dưới dạng 2.5D trong vùng giám
sát. Sau đó, các dữ liệu đầu vào sẽ được chuyển tải về hệ thống máy tính trung tâm để tìm
kiếm và làm phép toán so sánh các ảnh trong Cơ sở dữ liệu (ví dụ như CSDL về tội
phạm…) và sẽ gửi các thông tin đến bộ phận an ninh.

3.1.2. Ứng dụng trong lĩnh vực điều khiển, robot thông minh, các
hệ chuyên gia trong y tế
Ngoài lĩnh vực giám sát an ninh, công nghệ nhận dạnh ảnh 3D còn có thể ứng dụng
trong việc phát triển robot và các hệ máy học thông minh.
Robot được thiết kế với 2 camera (tương tự 2 mắt của con người) để thu thập ảnh
2.5D. Ngoài ra, cần bố trí một hệ thống vi xữ lý mạnh để có thể xữ lý các ảnh đầu vô và
nhận dạng với các đối tượng có trong cơ sở dữ liệu. Sau khi xác định được đối tượng,
robot có thể thao tác với các đối tượng theo các chỉ thị được lập trình. Ví dụ, các cuộc thi
robotcon hiện nay, chủ yếu xác định đối tượng thông qua màu hoặc thông qua các đường
cảm biến được thiết kế sẵn để di chuyển, thực hiện các lệnh được lập trình sẵn. Tuy nhiên
nếu được trang bị hệ thống nhận dạng đối tượng 3D, robot có thể thực hiện các thao tác
này mà không phụ thuộc màu sắc của đối tượng, không phụ thuộc các đường line cảm
biến để dẫn đường….
Ngoài ra, công nghệ này còn có ý nghĩa thực tiễn rất quan trong trong lĩnh vực y
khoa. Các hệ chuẩn đoán y khoa, hình ảnh đang sử dụng, nghiên cứu hiện nay đều được
thực hiện trên nền tảng ảnh chụp 2D. Ví dụ như đề tài nghiên cứu khoa học về hệ y khoa
chuẩn đoán hình ảnh tại bệnh viện đa khoa Phú giáo- tỉnh Bình Dương. Bản thân bệnh
nhân khi tiến hành chụp ảnh, siêu âm hỗ trợ 3D, do đó khi áp dụng các kỹ thuật nhận
dạng 3D, máy tính có thể tiến hành việc nhận dạng, so sánh các ảnh chụp bệnh nhân ở
nhiều thời điểm khác nhau để chuẩn đoán, dự đoán các chiều hướng phát triển của bệnh
tật thông qua sự biến đổi kích cỡ, hình dạng các đối tượng nội tạng, các cơ quan bên trong
cơ thể người….
3.2. Đề xuất hướng nghiên cứu, phát triển
Ngày nay, có càng nhiều sản phẩm hỗ trợ định dạng 3D như TV 3D, camera 3D
[L-3]
…Do đó cần đầu tư nghiên cứu nhiều hơn về các kỹ thuật tương tác và nhận dạng trên nền
tảng ảnh 3D. Hiện nay việc nhận dạng này dang là nghiên cứu trong các phòng phòng thí
nghiệm của các trường đại học. Đối với Việt Nam, hầu như chưa có công trình nghiên
cứu nào đề cập đến vấn đề này. Trong bài thu hoạch này, em chỉ phát thảo sơ bộ về nhận
dạng 3D. Ngoài ra, thời gian thực hiện tương đối ít nên chưa thể đào sâu tìm hiểu. Trong

tương lai việc theo đuổi định hướng này, em có thể gặp nhiều khó khăn, thậm chí thất bại
vì hạn chế về mặt thiết bị hỗ trợ thu thập ảnh, cơ sở dữ liệu ảnh 3D, tài liệu nghiên cứu…
Tuy nhiên em vẫn quyết tâm theo đuổi mục tiêu vì các lý do:
TIỂU LUẬN MÔN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
- Thiết bị hỗ trợ công nghệ 3D đang được chú tâm phát triển từ các nhà sản xuất
phần cứng.
- Việt Nam có rất ít/chưa có công trình nghiên cứu nào liên quan.
- Công nghệ này đang được nghiên cứu trên thế giới, nếu thành công đưa vào ứng
dụng thì các nhà khoa học sẽ ưu tiên phát triển vào các ứng dụng của nước họ. Nếu được
chuyển giao thì nó đã trở nên lạc hậu và không thể tạo nên tính đột phá trong việc đưa vào
ứng dụng trong thực tế.
Do đó, chúng ta không nghiên cứu sẽ rất khó tiếp cận các công nghệ mới này. Trong
thời gian tới, em rất mong được Thầy hướng dẫn em phát triển ý tưởng này thành luận
văn tốt nghiệp. Ý kiến góp ý của Thầy sẽ là nguồn động viên để em có thêm tự tin, phấn
đấu để có thể phát triển ý tưởng trên
Định hướng của đề tài, em sẽ nghiên cứu việc nhận dạng gương mặt 3D trên tập
CSDL có sẵn (do các trường đại học và các nhà khoa học đang nghiên cứu về lĩnh vực
này cung cấp) và đánh giá độ chính xác của việc nhận dạng này. Em rất cám ơn Thầy và
chúc Thầy sức khỏe.
TÀI LIỆU THAM KHẢO

4. TÀI LIỆU THAM KHẢO
[B-1] GS.TSKH. Hoàng Kiếm, Giải một bài toán trên máy tính như thế nào, 2004.
[B-2] GS.TSKH. Hoàng Kiếm, Bài giảng môn Công nghệ tri thức và ứng dụng, Đại học
Công nghệ thông tin, 2012.
[B-3] Paul J. Besl and Neil D. MacKay, A Method for Registration of 3D-Shapes, IEEE
Transactions on Pattern Analysis and Machine Inteligence, Vol 14, No 2, February 1992.
[B-4] Ajmal Saeed Mian, Thesis for the degree of Ph.D of The University of Western
Australia School of Computer Science and Software Engineering, 2006.
[B-5] Boulbaba Ben Amor, Karima Ouji, Mohsen Ardabilian and Liming Chen, 3D Face

recognition by ICP-based shape matching, Lyon Research Center for Images and
Intelligent Information Systems, Centrale Lyon, France, 2006.
[L-1] />trong-cong-nghe-nhan-dang-khuon-mat-cua-may-tinh-xach-tay-02-12-08
[L-2]
[L-3] />ho-tro-chup-hinh-3D-cua-Fujifilm/2031877.epi
[L-4]

×