Tải bản đầy đủ (.docx) (25 trang)

PYTHON VÀ COMPUTER VISION

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.26 MB, 25 trang )

BỘ MÔN TIN HỌC TRONG KỸ THUẬT
---------------  ---------------

TIỂU LUẬN
PYTHON VÀ COMPUTER VISION

GVHD

: Lê Thanh Tùng

Mã môn học :
Mã lớp học

:

SVTH

: Nhóm 10

DANH SÁCH NHĨM THAM GIA
VIẾT TIỂU LUẬN
HỌC KỲ I NĂM HỌC 2021-2022


Tên đề tài: PYTHON VÀ COMPUTER VISION
Nhóm: 10 (Lớp thứ 2 tiết 12-15 )
STT

HỌ VÀ TÊN

MÃ SỐ



TỶ LỆ %

SỐ ĐIỆN

SINH VIÊN

SINH VIÊN

HỒN THÀNH

THOẠI

01

Lê Đức Tài

100 %

02

Huỳnh Hửu Trí

20143107

100 %

03

Trần Nguyễn Phúc Luân


20143157

100 %

Ghi chú:
- Tỷ lệ % = 100 %
- Trưởng nhóm:
Nhận xét của giảng viên:
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
.................................................................................................................................................
Ngày … tháng… năm 2021
Giảng viên chấm điểm


MỤC LỤC
PHẦN 1: GIỚI THIỆU SƠ LƯỢC VỀ PYTHON................................................2
1. Sơ lược về Python...........................................................................................2
2. Đặc điểm của Python......................................................................................2
2.1

Ngơn ngữ lập trình đơn giản, dễ học – dễ học........................................2

2.2


Miễn phí, mã nguồn mở..........................................................................2

2.3

Khả năng di động linh hoạt.....................................................................3

2.4

Khả năng mở rộng và có thể nhúng........................................................3

2.5

Ngơn ngữ thơng dịch cấp cao..................................................................3

2.6

Thư viện tiêu chuẩn lớn để giải quyết những tác vụ phổ biến................4

2.7

Hướng đối tượng.....................................................................................4

2.8

Ưu điểm, nhược điểm và mức độ sử dụng..............................................4

PHẦN 2: TỔNG QUAN VỀ COMPUTER VISION............................................5
1. Khái niệm về computer vision.......................................................................5
2. Lịch sử phát triển của Computer Vision......................................................5

3. Cách thức hoạt động của Computer Vision.................................................7
4. Computer Vision trong xu thế ngày nay.....................................................11
5. Ứng dụng của Computer Vision cho một số lĩnh vực................................12
5.1

Nhận diện chữ, khuôn mặt của Camera................................................12

5.2

Vận hành tự động..................................................................................13

5.3

Quản lý chất lượng công nghiệp...........................................................13

5.4

Phát hiện các khiếm khuyết...................................................................13

5.5

Xử lí dữ liệu..........................................................................................14

5.6

Lĩnh vực y tế.........................................................................................14

5.7

Ngân hàng.............................................................................................14


PHẦN 3: MỘT VÍ DỤ VỀ COMPUTER VISION.............................................15
TÀI LIỆU THAM KHẢO.....................................................................................20



PYTHON VÀ COMPUTER VISION
PHẦN 1: GIỚI THIỆU SƠ LƯỢC VỀ PYTHON
1. Sơ lược về Python
NGÔN NGỮ PYTHON được Guido van Rossum tạo ra cuối năm 1990. Python khá
giống Perl, Ruby, Scheme, Smalltalk và Tcl. Python được phát triển trong một dự án mã
mở do một tổ chức phi lợi nhuận Python Software Foundationquản lý. Pythonđược phát
triển để chạy trên nền Unix. Nhưng theo thời gian, nó đã "bành trướng" sang mọi hệ điều
hành từMS-DOS đến MAC OS, OS/2, Windows, Linuxvà một số điều hành khác thuộc
họ Unix. Python là ngôn ngữ bậc cao (high-level)có hình thức sáng sủa, cấu trúc rõ ràng,
thuận
Về nguồn gốc của Python, Van Rossum đã viết vào năm 1996:
Hơn sáu năm trước, vào tháng 12 năm 1989, tơi đã tìm kiếm một dự án lập trình "sở
thích" mà nó đã chiếm đóng tâm trí tơi trong suốt tuần lễ Giáng sinh. Văn phịng của tơi ...
sẽ đóng cửa, nhưng tơi đã có một máy tính ở nhà, và khơng có nhiều thứ khác trên tay.
Tơi quyết định viết một bộ thông dịch (interprester) cho ngôn ngữ kịch bản mới mà tôi đã
từng nghĩ đến: một hậu duệ của ABC có thể hấp dẫn các hacker Unix/C. Tôi đã chọn
Python như là một tiêu đề làm việc cho dự án.
2. Đặc điểm của Python
2.1 Ngôn ngữ lập trình đơn giản, dễ học – dễ học
Python có cú pháp rất đơn giản, rõ ràng. Nó dễ đọc và viết hơn rất nhiều khi so sánh
với những ngôn ngữ lập trình khác như C++, Java, C#. Python làm cho việc lập trình trở
nên thú vị, cho phép bạn tập trung vào những giải pháp chứ không phải cú pháp.
2.2 Miễn phí, mã nguồn mở
Bạn có thể tự do sử dụng và phân phối Python, thậm chí là dùng cho mục đích thương

mại. Vì là mã nguồn mở, bạn khơng những có thể sử dụng các phần mềm, chương trình


được viết trong Python mà cịn có thể thay đổi mã nguồn của nó. Python có một cộng
đồng rộng lớn, khơng ngừng cải thiện nó mỗi lần cập nhật.
2.3 Khả năng di động linh hoạt
Giả sử bạn giả sử bạn đã viết mã Python cho máy Windows của mình. Bây giờ, nếu
bạn muốn chạy nó trên máy Mac, bạn khơng cần phải thay đổi nó như cũ. Nói cách khác,
bạn có thể lấy một mã và chạy nó trên bất kỳ máy nào, không cần phải viết mã khác nhau
cho các máy khác nhau. Điều này làm cho Python trở thành một ngôn ngữ di động. Tuy
nhiên, bạn phải tránh mọi tính năng phụ thuộc hệ thống trong trường hợp này. Nó chạy
liền mạch trên hầu hết tất cả các nền tảng như Windows, macOS, Linux. – lap trinh web
2.4 Khả năng mở rộng và có thể nhúng
Giả sử một ứng dụng đòi hỏi sự phức tạp rất lớn, bạn có thể dễ dàng kết hợp các phần
code bằng C, C++ và những ngơn ngữ khác (có thể gọi được từ C) vào code Python. Điều
này sẽ cung cấp cho ứng dụng của bạn những tính năng tốt hơn cũng như khả năng
scripting mà những ngơn ngữ lập trình khác khó có thể làm được.
2.5 Ngơn ngữ thơng dịch cấp cao
Không giống như C/C++, với Python, bạn không phải lo lắng những nhiệm vụ khó
khăn như quản lý bộ nhớ, dọn dẹp những dữ liệu vô nghĩa,… Khi chạy code Python, nó
sẽ tự động chuyển đổi code sang ngơn ngữ máy tính có thể hiểu. Trong nội bộ, mã nguồn
của nó được chuyển đổi thành một hình thức ngay lập tức được gọi là bytecode. Vì vậy,
tất cả những gì bạn cần làm là chạy đoạn code Python của bạn mà không phải lo lắng về
việc liên kết với các thư viện và những thứ khác.


2.6 Thư viện tiêu chuẩn lớn để giải quyết những tác vụ phổ biến
Python có một số lượng lớn thư viện tiêu chuẩn giúp cho cơng việc lập trình của bạn
trở nên dễ thở hơn rất nhiều, đơn giản vì khơng phải tự viết tất cả code. Ví dụ: Bạn cần
kết nối cơ sở dữ liệu MySQL trên Web server? Bạn có thể nhập thư viện MySQLdb và sử

dụng nó. Có các thư viện cho các biểu thức thơng thường, tạo tài liệu, kiểm tra đơn vị,
trình duyệt web, phân luồng, cơ sở dữ liệu, CGI, email, thao tác hình ảnh và rất nhiều
chức năng khác. Vì vậy, bạn có thể chắc chắn rằng nó sẽ khơng làm hỏng code hay ứng
dụng của mình.
2.7 Hướng đối tượng
Mọi thứ trong Python đều là hướng đối tượng. Lập trình hướng đối tượng (OOP) giúp
giải quyết những vấn đề phức tạp một cách trực quan. Với OOP, bạn có thể phân chia
những vấn đề phức tạp thành những tập nhỏ hơn bằng cách tạo ra các đối tượng. Python
hỗ trợ cả lập trình hướng đối tượng, một trong những tính năng chính của nó. Nó cũng hỗ
trợ nhiều kế thừa, khơng giống như Java.
2.8 Ưu điểm, nhược điểm và mức độ sử dụng

 Ưu điểm
– Linh hoạt
– Ngôn ngữ tự nhiên / trực quan
– Các tài liệu hướng dẫn được đánh giá cao
– Scripted trái ngược với compiled

 Nhược điểm
Không bắt đầu với kiến thức cơ bản về lập trình

 Mức độ sử dụng
Kỹ năng code được sử dụng rộng rãi và phổ biến trong cả giáo dục kỹ thuật và sử
dụng trong kinh doanh



PHẦN 2: TỔNG QUAN VỀ COMPUTER VISION

1. Khái niệm về computer vision

Thị giác máy tính là một lĩnh vực trong Artificial Intelligence (Trí tuệ nhân tạo) và
Computer Science (Khoa học máy tính) nhằm giúp máy tính có được khả năng nhìn và
hiểu giống như con người.
Computer vision (thị giác máy tính) được xem là đôi mắt của thiết bị công nghiệp. Là
1 khái niệm về công nghệ lưu trữ và xử lý hình ảnh được lấy từ thế giới thực, trực tiếp.
Nói dễ hiểu đây là sự liên kết của chuối hoạt động thu nhận, xử lý hình ảnh, nhận dạng và
đưa ra phân tích. Từ đó truyền đến bộ xử lý trung tâm đưa ra quyết định cho việc vận
hành cơ cấu tiếp theo.
Trong thời đại công nghệ 4.0 này, máy móc đang là trọng tâm phát triển. Mỗi ngày
cơng nghệ đều thay đổi, máy móc lại càng thơng minh. Để có được 1 cỗ máy hồn hảo,
các kỹ sư ln mơ phỏng nó với chính con người. Các vi điều khiển, PLC, PC controller,
… được ví như bộ não của máy móc. Những cánh tay Robot được ví như chân tay con
người. Cịn Computer Vision được xem là đơi mắt, giúp nhận định và đưa ra quyết định

chính xác.

2. Lịch sử phát triển của Computer Vision


Các thí nghiệm ban đầu về thị giác máy tính diễn ra vào những năm 1950, sử dụng
một số mạng nơ-ron đầu tiên để phát hiện các cạnh của vật thể và sắp xếp các vật thể đơn
giản thành các loại như hình trịn và hình vng.
Đến những năm 1970, việc sử dụng
thương mại đầu tiên của thị giác máy
tính đã diễn giải văn bản được đánh máy
hoặc viết tay bằng cách sử dụng nhận
dạng ký tự quang học (Optical Character
Recognition – OCR). Sự tiến bộ này
được sử dụng để giải thích văn bản viết
cho người mù.

Khi internet phát triển vào những năm 1990, khiến cho một lượng lớn hình ảnh sẵn có
trên mạng sử dụng cho các chương trình nhận dạng và phân tích khn mặt phát triển
mạnh mẽ. Những tập dữ liệu này ngày càng gia tăng, đã giúp máy móc có thể xác định
những người cụ thể trong ảnh và video.
Ngày nay, một số yếu tố đã hội tụ đã mang lại sự “phục hưng” trong thị giác máy
tính:
+ Cơng nghệ di động với camera tích hợp đã làm bão hịa của thế giới hình ảnh
và video.
+ Sức mạnh tính tốn đã trở nên hợp lý hơn và dễ dàng tiếp cận hơn.
+ Phần cứng được thiết kế cho Computer Vision và kỹ thuật phân tích được phổ
biến rộng rãi hơn.


+ Các thuật toán mới như mạng nơ-ron hội tụ có thể tận dụng các khả năng của
phần cứng và phần mềm

Tác động của những tiến bộ này đối với lĩnh vực Computer Vision thật đáng kinh
ngạc. Tỷ lệ chính xác để xác định và phân loại đối tượng đã tăng từ 50% lên 99% trong
vòng chưa đầy một thập kỷ – và các hệ thống ngày nay chính xác hơn con người trong
việc phát hiện và phản ứng nhanh chóng với các đầu vào trực quan.
3. Cách thức hoạt động của Computer Vision
Q trình mơ phỏng thị giác con người được chia thành 3 giai đoạn nối tiếp (tương tự
cách con người nhìn): mơ phỏng mắt (thu nhận - khó), mơ phỏng vỏ não thị giác (xử lý rất khó) và mơ phỏng phần cịn lại của bộ não (phân tích - khó nhất). Computer vision
hoạt động theo ba bước cơ bản:
Thu nhận hình ảnh: Hình ảnh, thậm chí cả tập hợp lớn, có thể được thu thập trong
thời gian thực thơng qua video, hình ảnh hoặc cơng nghệ 3D để phân tích.
Mơ phỏng mắt là lĩnh vực đạt được nhiều thành công nhất. Chúng ta đã tạo ra
các cảm biến, vi xử lý hình ảnh giống khả năng nhìn của mắt người và thậm chí cịn tốt
hơn.



Camera có thể chụp hàng ngàn ảnh mỗi giây và nhận diện từ xa với độ chính xác cao.
Tuy nhiên cảm biến camera tốt nhất cũng không thể nhận diện được một quả bóng chứ
đừng nói là bắt được chúng. Nói cách khác, phần cứng bị giới hạn khi khơng có phần
mềm đến giờ vẫn là khó khăn lớn nhất. Tuy vậy, camera ngày nay cũng khá linh hoạt và
làm nền tảng tốt để nghiên cứu.

Xử lý hình ảnh: Các mơ hình học sâu tự động hóa phần lớn quy trình này, nhưng các
mơ hình này thường được đào tạo bởi lần đầu được cung cấp hàng nghìn hình ảnh được
gắn nhãn hoặc được xác định trước.
Bộ não được xây dựng từ con số 0 với các hình ảnh dần dần lấp đầy tâm trí, nó làm
nhiệm vụ liên quan tới thị giác nhiều hơn bất kì cơng việc nào khác và việc này đều
xuống tới cấp độ tế bào. Hàng tỉ tế bào phối hợp để lấy ra các hình mẫu, bắt được tín hiệu.
Một nhóm nơ-ron sẽ báo cho nhóm khác khi có sự khác biệt dọc theo một đường
thẳng (theo một góc nào đó, như chuyển động nhanh hơn hay theo một hướng khác).
Nghiên cứu đầu tiên về thị giác máy tính cho rằng mạng lưới nơ-ron phức tạp tới nỗi
không thể hiểu nổi khi tiếp cận theo hướng lý giải từ trên xuống dưới. Với một số đối
tượng thì cách này cũng hiệu quả nhưng khi mơ tả từng đối tượng, từ nhiều góc nhìn,
nhiều biến thể về màu sắc, chuyển động và nhiều thứ khác thì hãy hình dung sẽ khó thế
nào. Ngay cả mức nhận thức của một em bé cũng sẽ cần lượng dữ liệu lớn vô cùng. Cách


tiếp cận từ dưới lên bắt chước cách não bộ hoạt động có vẻ hứa hẹn hơn. Những năm qua
chứng kiến sự bùng nổ của các nghiên cứu và sử dụng hệ thống này trong việc bắt chước
não người. Quá trình nhận diện hình mẫu vẫn đang tăng tốc và chúng ta vẫn liên tục đạt
được tiến bộ.

Nhận biết hình ảnh: Bước cuối cùng là bước diễn giải, nơi một đối tượng được xác
định hoặc phân loại.
Ta có thể xây dựng một hệ thống nhận diện được một quả táo, từ bất cứ góc nào,

trong bất kì tình huống nào, dù đứng im hay chuyển động nhưng chúng không thể nhận
diện được một quả cam, khơng thể nói cho ta quả táo là gì, có ăn được khơng, lớn nhỏ ra
sao hay dùng để làm gì. Như vậy phần cứng và phần mềm tốt cũng khơng làm được gì
nếu khơng có hệ điều hành.
Đó chính là phần cịn lại của bộ não: bộ nhớ ngắn/dài hạn, dữ liệu từ các giác quan,
sự chú ý, nhận thức, bài học khi tương tác với thế giới… được viết lên mạng lưới nơ-ron
kết nối phức tạp hơn bất cứ thứ gì chúng ta từng thấy, theo cách mà chúng ta khơng thể
hiểu. Đó là nơi mà khoa học máy tính và trí tuệ nhân tạo gặp mặt.


Dù mới trong thời kì sơ khai, thị giác máy tính vẫn vơ cùng hữu ích. Nó có mặt trong
camera nhận diện khn mặt (Face ID) và nụ cười. Nó giúp xe tự lái nhận diện biển báo,
người đi đường. Nó nằm trong các robot trong nhà máy, nhận diện sản phẩm, truyền cho
con người

Ví dụ, nếu bạn cung cấp cho máy tính một triệu hình ảnh về lồi chim cánh cụt, thị
giác máy tính sẽ tuân theo tất cả các thuật tốn cho phép chúng phân tích màu sắc trong
ảnh, các hình dạng và khoảng cách giữa các bộ phận. Khi kết thúc thuật tốn, máy tính sẽ
có thể ứng dụng trải nghiệm của nó nếu được cung cấp các hình ảnh khơng nhãn khác để
định dạng những hình ảnh của chim cánh cụt.
Các hệ thống AI ngày nay có thể tiến thêm một bước nữa và thực hiện các hành động
dựa trên sự hiểu biết về hình ảnh. Có nhiều loại Computer Vision được sử dụng theo
những cách khác nhau:


Phân đoạn hình ảnh: phân vùng hình ảnh thành nhiều vùng hoặc nhiều

mảnh để kiểm tra một cách riêng biệt.





Phát hiện đối tượng: xác định một đối tượng cụ thể trong ảnh. Tính năng

phát hiện đối tượng nâng cao sẽ nhận dạng nhiều đối tượng trong một hình ảnh:
sân bóng, cầu thủ tấn cơng, cầu thủ phịng thủ, quả bóng, v.v. Các mơ hình này sử
dụng tọa độ X, Y để tạo hộp giới hạn và xác định mọi thứ bên trong hộp.


Nhận dạng khuôn mặt: là một loại phát hiện đối tượng nâng cao không chỉ

nhận dạng khuôn mặt người trong ảnh mà còn nhận dạng một cá nhân cụ thể.


Phát hiện cạnh: là một kỹ thuật được sử dụng để xác định cạnh bên ngoài

của một đối tượng hoặc phong cảnh để xác định rõ hơn những gì có trong ảnh.


Phát hiện mẫu: là một q trình nhận dạng các hình dạng, màu sắc và các

chỉ số thị giác khác được lặp lại trong hình ảnh.


Phân loại hình ảnh: nhóm các hình ảnh thành các loại khác nhau.



So khớp đặc tính: là một loại phát hiện mẫu phù hợp với các điểm tương


đồng trong hình ảnh để giúp phân loại chúng.

4. Computer Vision trong xu thế ngày nay
Từ nhận dạng khuôn mặt cho đến xử lý hành động trực tiếp của một trận bóng đá, thị
giác máy tính có thể cạnh tranh và vượt qua khả năng thị giác của con người trong nhiều
lĩnh vực. Bằng cách kết hợp với những lĩnh vực khác trong khoa học AI (Artificial
Intelligent – Trí tuệ nhân tạo), đã thúc đẩy Computer Vision trở thành một trong những
ngành “hot” nhất trong thời đại ngày nay.


Deep Learning (Học sâu) và Computer Vision: Học sâu huấn luyện máy tính nhìn
như thế nào? Tìm hiểu cách hoạt động của các loại mạng nơ-ron khác nhau và cách chúng
được sử dụng cho thị giác
máy tính. Học sâu là một
loại học máy huấn luyện
máy tính thực hiện các tác
vụ giống như con người,
chẳng hạn như nhận dạng
giọng nói, xác định hình
ảnh hoặc đưa ra dự đốn.
Thay vì tổ chức dữ liệu để
chạy thơng qua các phương trình được xác định trước, học sâu thiết lập các tham số cơ
bản về dữ liệu và huấn luyện máy tính tự học bằng cách nhận dạng các mẫu sử dụng
nhiều lớp xử lý.
Phân tích hình ảnh và AI: Xem và giới thiệu về phân tích hình ảnh và tìm hiểu các
kỹ thuật phân tích mà bạn
có thể áp dụng cho dữ
liệu hình ảnh. “Nhận
dạng khn mặt” là một
hệ thống sinh trắc học.

Hệ thống thường là một
đường ống gồm 4 giai
đoạn: phát hiện, sắp xếp,
đại diện và phân loại.
Khám

phá

cách

một

miếng dán mặt được biến đổi thành một vectơ đặc trưng hoặc một tập hợp các điểm phúc
tinh và vị trí tương ứng của chúng.
5. Ứng dụng của Computer Vision cho một số lĩnh vực
5.1 Nhận diện chữ, khuôn mặt của Camera


Chắc thời điểm hiện tại mỗi người ai cũng sẽ có cho mình 1 chiếc SmartPhone. Và
đây cũng là mơi trường hoàn hảo nhất để Computer Vision thực hiện chức năng của mình.
Camera điện thoại hiện nay với các thuật tốn hiện đại ln tạo cho người dùng 1 trải
nghiệm hết sức thú vị.
+ Mở khóa màn hình bằng nhận diện khn mặt.
+ Thanh tốn tất cả các dịch vụ thông qua việc quét QR code.
+ Nhận diện chữ để có thể dịch trên các ứng dụng từ điện nước ngoài.

5.2 Vận hành tự động
Chắc ai cũng đã từ nghe mà biết đến những chiếc xe không người lái, taxi khơng
người lái. Thì đây cũng có thể xem là 1 ứng dụng của Computer Vision. Xe khơng người
lái xe có hệ thống Camera giám sát đưa ra phân tích, truyền đến công nghệ AI để tránh

vật cản. Vision này luôn ở chế độ live, đưa ra vị trí và khoảng cách giữa xe đến vật phía
trước. Chúng giúp nhận diện màu sắc để phân tích tín hiệu giao thơng.


5.3 Quản lý chất lượng công nghiệp
Trong công nghiệp Vision cũng chiếm 1 vị trí hết sức quan trọng. Đối với các dây
chuyền sản xuất lớn nếu có sai số trong việc thiết lập cơ khí thiết bị, nó sẽ ảnh hưởng trực
tiếp đến chất lượng sản phẩm. Vision sẽ nhận diện và đưa ra phán định liên tục để nhận
diện lỗi sớm nhất. Qua đó giảm thiểu tỷ lệ lỗi ảnh hưởng đến tài chính doanh nghiệp.
5.4 Phát hiện các khiếm khuyết
Đây có lẽ là ứng dụng phổ biến nhất của thị giác máy tính. Cho đến bây giờ thì việc
phát hiện ra các yếu tố bị lỗi thường được tiến hành bởi những người giám sát chỉ định và
mở rộng hơn họ khơng thể nào kiểm sốt được tồn bộ cả một quy trình hệ thống được.
Với thị giác máy tính, chúng ta có thể kiểm tra tất cả các lỗi nhỏ nhất từ vết nứt kim
loại, lỗi sơn, bản in xấu, có kích thước nhỏ hơn 0,05mm. Việc xử lý này còn nhanh và tốt
hơn mắt thường của con người gấp nhiều lần. Thuật toán này được thiết kế và đào tạo đặc
biệt cho từng ứng dụng cụ thể thơng qua hình ảnh có khiếm khuyết và khơng có khuyết
tật
5.5 Xử lí dữ liệu
Để hỗ trợ con người thực hiện các nhiệm vụ nhận dạng và tổ chức thơng tin, các cơng
cụ Computer Vision và mơ hình Deep Learning đã được đưa vào nghiên cứu, đòi hỏi khối
lượng dữ liệu lớn được dán nhãn. Khi các thuật toán Deep Learning phát triển, chúng chủ
yếu thay thế quy trình gắn thẻ thủ cơng thơng qua một phương pháp tiếp cận được gọi là
nghiên cứu dữ liệu đám đông – thu thập theo thời gian thực tự động và gắn thẻ dữ liệu do
các chuyên gia tạo ra và từ đó máy học sẽ bắt đầu quy trình nhận dạng các đối tượng.
5.6 Lĩnh vực y tế
Những tiến bộ lớn liên tục xuất hiện trong các lĩnh vực nhận dạng mẫu và xử lý hình
ảnh. Đồng thời, khơng có gì đáng ngạc nhiên khi cộng đồng y tế và các chuyên gia trong
lĩnh vực chăm sóc sức khỏe cho rằng hình ảnh y khoa (kỹ thuật tạo hình ảnh trực quan về
bên trong của cơ thể để phân tích lâm sàng và can thiệp y tế, cũng như biểu thị trực quan

chức năng của một số cơ quan hoặc mô sinh lý học) đã trở thành một phần thiết yếu trong


cách thức làm việc của họ, hướng đến các công cụ chẩn đoán tốt hơn và tăng đáng kể khả
năng đưa ra các hành động hiệu quả hơn
5.7 Ngân hàng
Khi nói đến việc liên kết các cơng nghệ AI với ngân hàng, chúng ta chủ yếu nghĩ đến
việc phát hiện gian lận. Mặc dù đó là một lĩnh vực tập trung đặc biệt cho công nghệ tiên
tiến trong lĩnh vực này, thị giác máy tính có thể cải tiến nhiều thứ hơn nữa. Các ứng dụng
nhận dạng hình ảnh sử dụng học máy để phân loại và trích xuất dữ liệu phục vụ cho việc
giám sát quá trình xác thực các tài liệu như thẻ căn cước hoặc giấy phép lái xe có thể
được sử dụng để cải thiện trải nghiệm của khách hàng từ xa và tăng cường bảo mật.


PHẦN 3: MỘT VÍ DỤ VỀ COMPUTER VISION
Mơi trường thử nghiệm:


Python phiên bản 3.6.5.



OpenCV phiên bản 3.4.1.

Các thư viện cần thiết:
Sử dụng cửa sổ Command Prompt và thực viện dòng lệnh sau đây
pip install opencv-python

Sử dụng OpenCV trong bài toán nhận diện khuôn mặt
Phần giới thiệu đã đề cập đến dùng hình ảnh/dữ liệu để giảm chi phí cho việc nghiên

cứu thuật toán và những dữ liệu này đã được đúc kết thành tệp tin xml.
Haar Cascade là dữ liệu được sử dụng phổ biến nhất, tôi chỉ sử dụng riêng một tệp tin
trong bộ Haar Cascade là haarcascade_frontalface_default.xml và ngồi ra cịn có các tệp
tin về phát hiện mắt, miệng, hình dáng cơ thể trong bộ Haar Cascade.
Đầu tiên khai báo những thư viện sau
import cv2

Bước 1: Đầu vào sẽ là bức ảnh và tệp tin xml
image 

= cv2.imread("images/Bill Gates.jpg")

face_cascade = cv2.CascadeClassifier("Haar
Cascade/haarcascade_frontalface_default.xml")

Bước 2: Tạo một bức ảnh xám từ bức ảnh gốc
grayImage = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×