Tải bản đầy đủ (.pdf) (47 trang)

tiểu luận khả năng tài chính của các hệ thống chăm sóc sức khỏe cho người cao tuổi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1002.91 KB, 47 trang )

Chương I. Tổng quan
Sự cải thiện của chăm sóc sức khỏe trong những thập kỷ qua đã dẫn đến tỷ lệ tử
vong thấp hơn và sống lâu hơn, nhiều người có tuổi thọ dài hơn 100 năm. Tuy nhiên,
dân số già đòi hỏi nhiều điều chỉnh cả về kinh tế và xã hội, đặc biệt là trong lĩnh vực lao
động, lương hưu và các viện chăm sóc sức khỏe. Số người cao tuổi từ 65 tuổi trở lên
tăng nhanh, trong khi đó số trẻ em (dưới 15 tuổi) giảm. Ngày nay, tỷ lệ người trẻ tuổi so
với người cao tuổi đã giảm từ sáu xuống ba trẻ so với một người cao tuổi. Sự tăng
trưởng dự kiến của người cao tuổi sẽ dẫn đến tỷ lệ số người cao tuổi nhiều hơn người trẻ
tuổi. Do vấn đề này, nhiều câu hỏi đã được đặt ra về khả năng tài chính của các hệ thống
chăm sóc sức khỏe cho người cao tuổi. [CITATION TZh06 \l 4105 ].
Dân số người cao tuổi gia tăng dẫn đến tăng chi phí chăm sóc sức khỏe, nhưng
với số lượng người trẻ tuổi giảm, nhân viên điều dưỡng giảm, nhiều người cao tuổi sẽ
không được chăm sóc sức khỏe đầy đủ. Việc này dẫn đến xu hướng mới khi dịch vụ
chăm sóc người cao tuổi được chuyển từ các viện chăm sóc sức khỏe tập trung (viện
dưỡng lão) sang chăm sóc sức khỏe tại nhà. Bên cạnh những lợi ích về tài chính, người
cao tuổi cũng duy trì sự độc lập của họ, cho phép họ sống trong mơi trường gia đình của
chính họ. Để đáp ứng sự chuyển dịch này cần có các hệ thống cơng nghệ mới có thể
cung cấp thơng tin cần thiết cho việc chăm sóc sức khỏe đầy đủ. Các hệ thống giám sát
như vậy sẽ cải thiện chất lượng cuộc sống cho người cao tuổi và trì hỗn thời điểm
chuyển sang các cơ sở đắt tiền.
1. Chấn thương do ngã của người cao tuổi
Một vấn đề phổ biến trên toàn thế giới, sẽ gia tăng do dân số già, là chấn thương
do ngã của người cao tuổi. Khoảng 30% những người từ 65 tuổi trở lên sống trong cộng
đồng và hơn 50% những người sống trong các cơ sở chăm sóc nội trú hoặc viện dưỡng
lão bị ngã hàng năm, và khoảng một nửa số người rơi vào tình trạng như vậy nhiều
lần[ CITATION NDa05 \l 4105 ]. Mặc dù không phải tất cả các cú ngã đều dẫn đến chấn
thương, nhưng khoảng 20% cần được chăm sóc y tế, 5% dẫn đến gãy xương và các chấn
thương nghiêm trọng khác, chẳng hạn như chấn thương nặng ở đầu, biến dạng khớp và
trật khớp, phát sinh các vết bầm tím, va chạm và rách mô mềm trong 5–10% số ca phát
sinh. Tỷ lệ phần trăm này có thể tăng hơn gấp đôi đối với phụ nữ từ 75 tuổi trở lên (xem
Hình 1) [ CITATION Har01 \l 4105 ] Chấn thương là nguyên nhân gây tử vong đứng hàng thứ


năm ở người cao tuổi, và hầu hết các chấn thương gây tử vong này đều liên quan đến
ngã. Ngã chiếm hơn 80% số ca nhập viện liên quan đến chấn thương của những người
trên 65 tuổi. Một cú ngã và chấn thương liên quan, hoặc thậm chí là nỗi sợ hãi về hậu


quả của chúng, chẳng hạn như khơng cịn khả năng tiếp xúc xã hội, mất tính độc lập và
tự tin, cần đưa vào cơ sở chăm sóc dài hạn, có thể gây ra trầm cảm và lo lắng nghiêm
trọng. Ở Hà Lan, 92.000 người cao tuổi cần được chăm sóc y tế sau khi ngã, 36.000
người trong số họ phải nằm viện và gần 1.800 bệnh nhân tử vong mỗi năm. Điều này
dẫn đến chi phí kinh tế là 5600 €; cho mỗi sự cố [17].

Hình 1: Biểu đồ số ca cấp cứu

2. Các yếu tố rủi ro
Gần một nửa số vụ té ngã của người cao tuổi diễn ra trong nhà của họ. Có rất
nhiều yếu tố khác nhau làm tăng khả năng xảy ra sự cố. Do lực cơ và tốc độ di chuyển
giảm dần nên việc giữ thăng bằng cho cơ thể sẽ khó hơn. Bên cạnh đó, thời gian phản
ứng giảm khiến người cao tuổi khơng thể phán đốn kịp thời các tình huống nguy hiểm.
Hầu hết người cao tuổi ngã do vấp hoặc va chạm vào đồ vật. Các yếu tố rủi ro có thể
được chia thành các yếu tố bên trong và bên ngoài.
Các yếu tố rủi ro nội sinh:
+ Sinh lý
+ Thần kinh
+ Bệnh lý
Các yếu tố rủi ro ngoại sinh:
+ Môi trường sống của ngôi nhà


+ Phong cách sống
+ Phịng cơng cộng

+ Phản ứng bất lợi với thuốc
Để tránh cho người cao tuổi bị ngã, một số yếu tố quan trọng có thể được tác
động. Người ta có thể tác động đến trạng thái sinh lý của con người, học cách dự đoán
hành vi của con người, thực hiện các điều chỉnh của môi trường xung quanh, điều chỉnh
phong cách sống và / hoặc điều chỉnh trong y học.
3. Hệ thống giám sát
Nhiều cơ sở chăm sóc gia đình và chăm sóc đã triển khai các loại hệ thống báo
động khác nhau. Các cảnh báo thường được sử dụng nhất là các nút áp suất có thể đeo
và dây kéo được gắn vào sẽ báo động cho người chăm sóc khi được kích hoạt. Tuy
nhiên, những thiết bị này yêu cầu người cao tuổi kích hoạt bằng tay, điều này trong một
số trường hợp là không thể. Các hệ thống tiên tiến hơn được thiết kế để tự động nhận ra
các tình huống báo động. Ưu điểm chính của các hệ thống như vậy là chúng khơng cần
người dùng kích hoạt báo động, khi tình huống báo động xảy ra. Những hệ thống này sẽ
bảo vệ người cao tuổi và có thể giúp đỡ khi cần thiết. Khi sử dụng hệ thống giám sát tích
cực, người ta cũng có thể áp dụng chăm sóc phịng ngừa cho người cao tuổi. Người cao
tuổi được theo dõi và cảnh báo khi có hành động nguy hiểm hoặc bất thường. Khi áp
dụng theo dõi lâu dài, người ta có thể sử dụng hoạt động bình thường như một chỉ số về
sức khỏe của người cao tuổi. Các nghiên cứu gần đây chứng minh rằng các hành động
có thể được giám sát bằng hệ thống camera thông minh. Các hệ thống này được đánh giá
trong mơi trường phịng thí nghiệm, trong đó văn phịng được chuyển đổi thành phịng
khách. Trong luận án này, phương pháp tiếp cận của được đánh giá bằng cách sử dụng
dữ liệu thực tế được ghi lại tại các ngôi nhà của người cao tuổi bao gồm nhiều hành
động do người cao tuổi thực hiện trong các hoạt động bình thường hàng ngày của họ.
4. So sánh camera tồn hướng và camera thơng thường
Cách đây vài năm, camera đa hướng là một điều mới lạ. Tuy nhiên, ngày nay,
cơng nghệ này đã có bước nhảy vọt trở thành xu hướng chủ đạo. Camera 360 độ đại diện
cho một trong những lĩnh vực phát triển mạnh nhất trong cơng nghệ giám sát, với lượng
xuất xưởng tồn cầu theo dự báo của IHS sẽ tăng hơn 60% so với cùng kỳ năm ngoái.
Camera đa hướng so với camera truyền thống
Cả hai camera giám sát 360 và 180 độ đều cung cấp tầm nhìn tồn cảnh, giúp

giảm số lượng camera trường quan sát hẹp truyền thống cần thiết trong một lần lắp đặt.
Camera đa hướng cũng có thể được sử dụng kết hợp với camera PTZ hoặc thay thế


chúng hoàn toàn tùy thuộc vào ứng dụng. Điều này khơng chỉ giúp nâng cao nhận thức
về tình huống mà cịn giảm chi phí tổng thể của camera, lắp đặt và bảo trì.
So với camera PTZ, camera đa hướng có lợi thế là có thể xoay, nghiêng và phóng
to xung quanh trong cả video trực tiếp, cũng như video được lưu trữ, có nghĩa là người
vận hành có thể xác định chính xác các vấn đề trong thời gian thực, đảm bảo các sự cố
có thể được giải quyết nhanh chóng và hiệu quả, đồng thời quay lại video 360 độ đã lưu
trữ để tiến hành điều tra.
Tùy chọn phủ sóng 180 và 360 độ từ một camera đơn được phân phối qua ống
kính chuyên dụng trên một cảm biến hoặc camera tích hợp nhiều cảm biến với các ống
kính thông thường được căn chỉnh để cung cấp phạm vi bao phủ góc siêu rộng. Camera
một ống kính hoặc “mắt cá” sử dụng một ống kính chuyên dụng gọi là ống kính mắt cá,
khi so sánh với ống kính thơng thường, sử dụng các kỹ thuật thiết kế quang học khác
nhau có thể dẫn đến sự biến dạng của hình ảnh đã chụp khi xem ngoài trường ngang 90
độ -của tầm nhìn. Với điều này, "sự biến dạng thùng" có thể xảy ra, khi một hình ảnh
trịn được tạo ra và một đường thẳng trong hình ảnh đã chụp có vẻ cong. Phần mềm
‘Dewarping’ phải được sử dụng để điều chỉnh ảo ảnh quang học này.
Do đặc điểm riêng của thiết kế ống kính trong camera mắt cá 180 và 360 độ, hình
bầu dục hoặc hình trịn được tạo ra. Vì cảm biến hình ảnh được sử dụng trong camera
giám sát là hình vng hoặc hình chữ nhật, một số bộ phận của cảm biến không được sử
dụng.
Các giải pháp ngày càng hợp lý
Khi công nghệ của những loại camera này tiếp tục được cải thiện, chúng ngày
càng trở nên có giá cả phải chăng hơn đối với một phân khúc rộng lớn hơn của thị
trường giám sát video. Tương tự, độ phân giải cao hơn và dung lượng lưu trữ phù hợp
hơn cho dữ liệu video giúp giá cả phải chăng hơn để có được mức độ phủ sóng và chi
tiết tăng cùng một lúc.

Như đã đề cập trước đây, việc tiết kiệm chi phí cũng có thể được thực hiện khi
một camera 360 độ duy nhất thay thế ba đến bốn camera cố định, kết quả có thể được tái
tạo ở các khu vực hoặc phòng ban khác trong tổ chức để giúp tiết kiệm thêm chi phí.
Mắt cá so với đa cảm biến
Camera mắt cá và camera đa cảm biến đều tạo ra hình ảnh tồn cảnh, nhưng theo
cách khác nhau. Camera mắt cá ghi lại toàn bộ cảnh trong một chế độ xem duy nhất mà
không cần phải ghép ảnh, do đó chế độ xem đầy đủ của cảnh quay video đã chụp có độ
sáng, độ sắc nét và độ tương phản nhất quán trên toàn bộ cảnh. Camera mắt cá cũng


mang lại một số lợi ích khác: độ tin cậy cao hơn do bố trí một cảm biến, camera và ống
kính duy nhất; khơng có điểm mù; tiêu điểm cố định, giúp cài đặt nhanh hơn; chi phí
thấp hơn; và một hệ số hình thức nhỏ hơn, ít gây khó chịu hơn. Ngồi ra, việc làm cong
hình ảnh được thực hiện trong hệ thống quản lý video hoặc máy ghi video mạng, cho
phép tốc độ khung hình cao hơn ở bất kỳ băng thông nhất định nào. Tuy nhiên, camera
mắt cá có thể có ít điểm ảnh hơn trên mỗi foot, tùy thuộc vào tổng độ phân giải và các
loại camera này yêu cầu làm mờ phía máy khách để đạt được đầy đủ lợi ích của việc
điều chỉnh hình ảnh hồi cứu - nghĩa là làm mờ video được lưu trữ để kiểm tra.
Mặt khác, camera đa cảm biến có thể cung cấp tổng độ phân giải cao hơn tùy
thuộc vào độ phân giải riêng của từng cảm biến trong máy ảnh. Ở đây, không bắt buộc
phải làm cong vì mỗi cảm biến về bản chất là một camera trường nhìn hẹp. Tuy nhiên,
camera đa cảm biến có nhiều cảm biến, điều này có thể dẫn đến chi phí bảo trì tổng thể
cao hơn và với bốn camera trở lên cần thiết để bao phủ một khu vực cụ thể, sẽ tăng nguy
cơ một hoặc nhiều cảm biến có thể hoạt động sai - về bản chất, độ tin cậy thấp hơn. Việc
lắp đặt camera đa cảm biến cũng phức tạp hơn và tốn nhiều thời gian hơn. Ngoài ra, bản
thân các đơn vị có thể lớn và cồng kềnh, và phức tạp để vận hành và quản lý - mỗi chế
độ xem phải được ghép lại với nhau, có nghĩa là hình ảnh được chụp phải được hiệu
chỉnh cẩn thận với độ sáng, màu sắc, độ tương phản và độ sắc nét chính xác để hình ảnh
được rõ ràng và liền mạch khi nó cần cho mục đích xem và làm bằng chứng.



Chương 2
1. Hiển thị và thu nhận hình ảnh
Hình ảnh kỹ thuật số là một tín hiệu rời rạc hai chiều (2D). Về mặt tốn học, các
tín hiệu như vậy có thể được biểu diễn dưới dạng hàm của hai biến độc lập - ví dụ, hàm
độ sáng của hai biến khơng gian. Hình ảnh kỹ thuật số đơn sắc f(x,y) là một dãy các giá
trị độ chói 2D. Mỗi phần tử của mảng được gọi là một pel (phần tử ảnh), hay phổ biến
hơn là một điểm ảnh. Hình ảnh kỹ thuật số màu thường được biểu thị bằng bộ ba giá trị,
một giá trị cho mỗi kênh màu, như trong bảng màu RGB thường được sử dụng. Các giá
trị màu riêng lẻ hầu như là giá trị 8 bit, dẫn đến tổng cộng 3 byte (hoặc 24 bit) trên mỗi
điểm ảnh. Điều này làm tăng gấp ba lần yêu cầu lưu trữ cho hình ảnh màu so với đơn
sắc. Đương nhiên, có một số phương pháp thay thế để lưu trữ dữ liệu hình ảnh. Được sử
dụng rộng rãi nhất là cái gọi là định dạng điểm ảnh xen kẽ (hoặc lưới) và xen kẽ màu
(hoặc phẳng). Phương pháp xen kẽ theo hàng hoặc theo cột ít được sử dụng hơn. Ở định
dạng xen kẽ điểm ảnh, mỗi điểm ảnh hình ảnh được biểu diễn bằng danh sách ba giá trị.
Các cảm biến hình ảnh đóng vai trị quan trọng trong việc thu nhận hình ảnh. Cấu
tạo và hoạt động của mắt rất giống với camera điện tử, thường được sử dụng để thu hình
ảnh trong thế giới thực. Cả hai đều dựa trên hai thành phần chính: cụm ống kính và cảm
biến hình ảnh. Cụm ống kính thu nhận một phần ánh sáng phát ra từ một vật thể và tập
trung nó vào cảm biến hình ảnh. Sau đó, cảm biến hình ảnh chuyển dạng ánh sáng thành
tín hiệu video, điện tử hoặc thần kinh. Thuật ngữ tiêu điểm có nghĩa là có một đối sánh
một của mọi điểm trên đối tượng với một điểm tương ứng trên màn hình. Ví dụ, hãy
xem xét một vùng 1mm trên đối tượng. Trong ánh sáng rực rỡ, có khoảng 100 nghìn tỷ
photon ánh sáng chiếu vào khu vực một milimét vuông mỗi giây. Tùy thuộc vào các đặc
điểm của bề mặt, từ 1 đến 99 phần trăm các photon ánh sáng tới sẽ bị phản xạ theo các
hướng ngẫu nhiên. Chỉ một phần nhỏ các photon phản xạ sẽ đi qua thấu kính. Ví dụ, chỉ
khoảng một phần triệu ánh sáng phản xạ sẽ đi qua một thấu kính có đường kính một cm
nằm cách vật thể 3 mét.
Sự khúc xạ trong thấu kính thay đổi hướng của các photon riêng lẻ, tùy thuộc vào
vị trí và góc mà chúng chạm vào mặt phân cách thủy tinh / không khí. Những thay đổi

hướng này làm cho ánh sáng mở rộng từ một điểm để trở lại một điểm trên màn hình
chiếu. Tất cả các photon phản xạ từ vật thể và đi qua thấu kính được đưa trở lại "vật thể"
trong ảnh được chiếu. Theo cách tương tự, một phần ánh sáng đến từ bất kỳ điểm nào
trên vật thể sẽ đi qua thấu kính và được hội tụ đến một điểm tương ứng trong hình ảnh
được chiếu.


Cảm biến hình ảnh phổ biến nhất được sử dụng trong camera điện tử là thiết bị
ghép nối điện tích (CCD). CCD là một mạch tích hợp thay thế hầu hết các camera ống
chân không trong những năm 1980, giống như các bóng bán dẫn đã thay thế các bộ
khuếch đại ống chân không hai mươi năm trước. Trái tim của CCD là một tấm mỏng
silicon, thường khoảng 1cm hình vng. Tuy nhiên, cảm biến hình ảnh CMOS mới hứa
hẹn cuối cùng sẽ trở thành cảm biến hình ảnh được lựa chọn. Cả hai cảm biến hình ảnh
CCD và CMOS đều thu ánh sáng trên một lưới các điểm ảnh nhỏ trên bề mặt của chúng.

Hình 2. Cảm biến hình ảnh đơn

Đầu ra của hầu hết các cảm biến là tín hiệu điện liên tục có biên độ và hành vi
không gian liên quan đến hiện tượng vật lý được cảm nhận. Để tạo một hình ảnh kỹ
thuật số, chúng ta cần chuyển đổi dữ liệu cảm nhận liên tục sang dạng kỹ thuật số. Điều
này liên quan đến hai q trình: lấy mẫu và lượng tử hóa. Một hình ảnh có thể liên tục
đối với các tọa độ x và y- và cả theo biên độ. Để chuyển nó sang dạng số, chúng ta phải
lấy mẫu hàm theo cả tọa độ và biên độ. Số hóa các giá trị tọa độ được gọi là lấy mẫu. Số
hóa các giá trị biên độ được gọi là lượng tử hóa. Kết quả của việc lấy mẫu và lượng tử
hóa là một ma trận các số thực. Mỗi phần tử của mảng ma trận này được gọi là phần tử
ảnh, phần tử ảnh hoặc điểm ảnh như đã nêu ở trên.
Cảm biến hình ảnh đen trắng và camera chỉ có thể làm điều này đối với cảm giác
độ sáng; nhận thức rất phong phú về màu sắc địi hỏi thơng tin bổ sung. Để có hiệu suất
tốt nhất, camera màu được chế tạo bằng cách cung cấp quang học tách chùm tia đặc biệt
và bằng cách bố trí ba cảm biến hình ảnh đen trắng để chúng nhìn thấy một phần giống

hệt nhau của một cảnh. Mỗi cảm biến hình ảnh được bao phủ bởi bộ lọc màu riêng, như
vừa mô tả và ba cảm biến hình ảnh cùng nhau thu thập thông tin đo màu đầy đủ về một


cảnh. Camera màu ba chip như vậy được sử dụng trong camera chuyên nghiệp và studio.
Chúng khá đắt. Vì những lý do này, rất mong muốn nhận ra một camera màu chỉ có một
cảm biến hình ảnh đen trắng duy nhất và một mẫu bộ lọc màu riêng lẻ từng điểm ảnh
phù hợp. Trong số các bộ lọc được sử dụng nhiều nhất thuộc về bộ lọc màu khảm 2-D
hoặc mẫu Bayer. Loại cảm biến hình ảnh này chủ yếu được sử dụng ngày nay.
2. Cảm biến toàn cảnh
Một loạt các hệ thống đa hướng đã được phát triển cho các mục đích điều hướng
robot di động, giám sát hình ảnh hoặc tham khảo từ xa. Các hệ thống được trình bày bao
gồm camera và gương cầu lồi trên các loại giá đỡ khác nhau. Cảm biến toàn cảnh được
hiểu là cảm biến có trường nhìn rất lớn. Những cảm biến mới này giới thiệu khả năng
thú vị mới trong việc tạo ra các hình ảnh đại diện mơi trường lớn hơn nhiều so với
những gì có thể có với các camera tiêu chuẩn.
Phịng thí nghiệm Thị giác Máy tính của Khoa Khoa học Máy tính tại Đại học
Columbia do Giáo sư Shree K. Nayar đứng đầu đã phát triển OMNICAMERA [Hình.
3a]. Hệ thống quang học của cảm biến đã được thiết kế để đảm bảo rằng tất cả các điểm
đều được chiếu qua một tâm chiếu duy nhất. Điều này cho phép phần mềm của họ tạo ra
hình ảnh phối cảnh thuần túy ở tốc độ video cho bất kỳ hướng xem và độ phóng đại nào
do người dùng lựa chọn. Trung tâm Nhận thức máy ở Praha đã cố gắng tích hợp cơng
nghệ quang học, quang điện tử, phần cứng và phần mềm để tạo ra một cảm biến thị giác
thơng minh [Hình. 3b]. Đặc biệt, ý định của họ là thiết kế và hiện thực hóa một camera
kỹ thuật số thu nhỏ, chi phí thấp thu được hình ảnh tồn cảnh (360 độ) [Hình. 3c] và
thực hiện xử lý mức thấp hữu ích đối với luồng hình ảnh đến trong thời gian thực. Các
ứng dụng mục tiêu bao gồm giám sát, kiểm soát chất lượng và điều hướng xe và robot di
động. Cảm biến tầm nhìn đa hướng (ODVS) được phát triển bởi Khoa Khoa học Máy
tính & Truyền thông, Đại học Wakayama, Nhật Bản gần đúng trực tiếp đại diện tồn
cảnh của mơi trường.

Rất nhiều cơng ty sản xuất các hệ thống bổ sung để thu được trường xem lớn hơn.
Ống kính 0-360 có thể là một trong số đó. Thiết bị này [Hình. 3d] là phần đính kèm ống
kính tồn cảnh của camera được thiết kế đặc biệt, với bộ phản xạ quang học độc quyền
giúp chụp toàn bộ toàn cảnh 360 độ chỉ với một lần chụp.


Hình 3. a) Camera tồn hướng được phát triển bởi Giáo sư Shree K. Nyar b) Camera
thông thường với gương hyperbol c) Ống kính O-360 d) ODVS từ đại học Wakayama
Chương này chỉ trình bày một phần của tất cả các hệ thống hiện có. Nhiều trường
đại học, phịng thí nghiệm và công ty khác nhau tham gia vào việc phát triển và khai
thác camera toàn cảnh và sản xuất một số loại hệ thống như vậy.
3. Lịch sử của cảm biến toàn cảnh
Camera toàn cảnh đã được sản xuất ít nhất 160 năm với nhiều loại và kích cỡ khác
nhau trên khắp thế giới. Hầu hết các mục lịch sử này được thành lập trong thư viện bằng
sáng chế của Hoa Kỳ. Danh sách sau đây chỉ chứa những điều thú vị nhất và tương ứng
với chủ đề của tác phẩm này.
Năm 1843
Joseph Puchberger ở Retz, Áo, đã được cấp bằng sáng chế cho một camera tồn
cảnh ống kính xoay điều khiển bằng tay quay sử dụng các tấm daguerrotype dài từ 19
đến 24 inch. Camera có ống kính tiêu cự 8 inch và bao phủ một vòng cung 150 độ.
Năm 1909
Louis Henry Kleinschmidt đã được cấp bằng sáng chế cho một bộ máy để tạo ra
các khung cảnh địa hình, về cơ bản là một camera được kết hợp với một gương hình
nón, nhưng camera này cũng được thiết kế để xoay.
Năm 1927
James C. Karnes đã được cấp bằng sáng chế cho Kính Omniscope, có vẻ như là
một kính tiềm vọng được trang bị gương parabol để xem toàn cảnh, với một lỗ trên
parabol, nơi người xem sẽ nhìn thấy chính họ. Lỗ này đã được gia tăng bằng lăng kính,



để vùng này có thể chứa hình ảnh của một thứ hữu ích, chẳng hạn như phần khơng nhìn
thấy của cảnh hoặc la bàn.
Năm 1939
Bằng sáng chế của James S. Conant mô tả một số cảm biến catadioptric, sử dụng
gương cầu, gương parabol và hình nón, cũng như một số phát minh về phép chiếu / màn
hình. Conant đề xuất sử dụng gương hình nón để camera khơng xuất hiện trong ảnh và
để phim được sử dụng hiệu quả hơn. (Mặc dù vậy, Conant có nghĩa là hình nón là bất kỳ
tấm gương nào là bề mặt cách mạng không có tiếp tuyến ngang tại điểm thấp nhất của
nó.) Đây có thể là lần đầu tiên xuất hiện cảm biến được thiết kế để tối đa hóa chất lượng
hình ảnh.
Năm 1943
Frank Benford đã được cấp bằng sáng chế cho một thiết bị được sử dụng trong
việc chiếu sáng máy tính. Đây là một trong những điều thú vị nhất trong số các bằng
sáng chế cũ. Benford quan tâm đến phép đo bức xạ - mục tiêu là xây dựng một cảm biến
catadioptric có dạng gương được thiết kế để giúp dễ dàng đo lượng chiếu sáng từ nguồn
sáng. Mặc dù khơng đưa ra phương trình rõ ràng, nhưng anh ấy nói rằng độ cong của
gương sao cho diện tích hình ảnh của nguồn hình cầu phải tỷ lệ với một hình chiếu nào
đó khác của nguồn, có liên quan đến độ rọi của nó.

Hình 4. Thiết bị được sử dụng để tính tốn độ chiếu sáng
Năm 1961
Ernest Stechemesser chỉ ra rằng vấn đề độ phân giải không đồng nhất xảy ra khi
hình ảnh được tạo ra bằng cách sử dụng gương cầu, gương parabol hoặc hình nón và
được chiếu lại trên màn hình hình cầu hoặc hình trụ. Giải pháp mà ông đề xuất là sử


dụng như một tấm gương làm bề mặt cách mạng có đáy nhọn, tức là bề mặt được hình
thành bằng cách quay một đường cong về một trục và đường cong khơng bình thường
với trục tại điểm giao nhau. Một đường cong rõ ràng không được đề cập.
Năm 1962

Donald W. Rees có lẽ là người đầu tiên, người đã sử dụng các thuộc tính điểm
nhìn duy nhất để “mở gói” một hình ảnh. Rees đề xuất kết hợp camera / gương hyperbol,
với tâm chiếu của camera được đặt ở tiêu điểm dưới của gương. Sau đó, hình ảnh được
chiếu lên một màn hình elip (360 độ) để hiển thị hình ảnh cho người vận hành.
Năm 1973
Phát minh của Pinzone “Gương phản xạ và giá đỡ cho hệ thống quang học toàn
cảnh” bao gồm một gương cầu nối với một gương hình nón nhỏ ở đáy của nó và được
hỗ trợ bởi một trụ trung tâm duy nhất được vặn vào tâm của ống kính máy ảnh.
Năm 1981
Don G. King đã được cấp bằng sáng chế cho “Lắp ráp ống kính zoom toàn cảnh”.
Thiết kế này là một tấm gương (bất kỳ bề mặt nào của cuộc cách mạng) với một hệ
thống thấu kính di động bên dưới nó có thể phóng to nó. Hình ảnh "hình khun" sẽ
được biến đổi thành hình chữ nhật với một phát minh khác của King. Hình ảnh hình
khun được chiếu lên bề mặt đích của máy quay video và được quét theo kiểu quét
ngang. Hình ảnh được tái tạo trong máy thu video là bản sao chính xác của hình ảnh
hình khun bao gồm vùng trung tâm của bề mặt raster của ống nhận video mà không
được sử dụng. Để sử dụng hiệu quả bề mặt raster của ống hình ảnh video, hình ảnh hình
khuyên được "trải rộng" hoặc chuyển đổi thành hình ảnh hình chữ nhật trong đó tồn
cảnh hồn chỉnh được khắc họa trên màn hình máy thu mà khơng bị đảo ngược hình
ảnh.


Hình 5. Gương phản xạ và phần gắn kết cho hệ thống ống kính tồn cảnh
Năm 1990
Shree K. Nayar đã được cấp bằng sáng chế cho “Hệ thống thị giác robot”. Sáng
chế này liên quan đến một hệ thống thị giác robot để xác định vị trí của các đối tượng.
Hệ thống thị giác robot bao gồm một thiết bị để ghi lại hình ảnh. Mỗi phần tử trong số n
phần tử được bố trí tại một vị trí xác định trước sao cho mỗi phần tử trong số n phần tử
nằm trong tầm nhìn của thiết bị ghi và phản xạ của các đối tượng từ mỗi phần tử trong
số n phần tử được thiết bị ghi nhận.

Năm 1993
Ian Powell đã được cấp bằng sáng chế cho “Ống kính tồn cảnh”. Hệ thống hình
ảnh tồn cảnh để chiếu trường quan sát hình trụ 360 độ lên định dạng hình khun hai
chiều có khối hình ảnh tồn cảnh với trục đối xứng đồng tâm, hai bề mặt khúc xạ và hai
bề mặt phản xạ. Bề mặt phản xạ đầu tiên là một conicoid lõm. Bề mặt khúc xạ thứ hai
(mặt cuối cùng trong đường đi của tia) là phẳng, còn mặt phản xạ thứ nhất, mặt phản xạ
thứ hai và mặt khúc xạ thứ nhất đều là hình cầu.
Năm 1997
Simon Baker và Shree K. Nyar đã trình bày lý thuyết về sự hình thành ảnh
catadioptric một góc nhìn[CITATION Nay \l 4105 ].
Năm 2001
S. Gaechter, T. Pajdla và B. Micusik đã trình bày thiết kế gương cho một camera
đa hướng với một camera biến thể khơng gian có tên là SVAVISCA [CITATION Paj00 \l
4105 ]


4. 2.4 Tình trạng hiện đại của hệ thống đa hướng
Máy quay video đa hướng ngày càng trở nên phổ biến trong thị giác máy tính.
Ngày nay, các hệ thống giám sát và giám sát video chủ yếu dựa vào các hệ thống hình
ảnh thơng thường như là nguồn thơng tin trực quan. Hệ thống hình ảnh thơng thường bị
hạn chế nghiêm trọng trong trường nhìn của nó. Nó chỉ có khả năng thu được thơng tin
trực quan thơng qua một góc cố định tương đối nhỏ được đặt phía trước máy dị hình
ảnh. Để giảm bớt vấn đề này, các hệ thống camera xoay / nghiêng / thu phóng thường
được sử dụng. Mặc dù điều này cho phép người dùng từ xa điều khiển hướng xem của
cảm biến, tại bất kỳ thời điểm nào, trường nhìn vẫn rất hạn chế. Tóm lại, các hệ thống
thơng thường có vùng mù lớn hơn nhiều vùng nhìn thấy của chúng. Mục tiêu của
chương trình nghiên cứu đa hướng tại Đại học Columbia và Đại học Lehigh là tạo ra các
cảm biến video đa hướng mới, phát triển các thuật toán để xử lý hình ảnh đa hướng và
sử dụng các cảm biến và thuật toán này để xây dựng các hệ thống giám sát thông minh
[CITATION Nay \l 4105 ]. Cách tiếp cận của họ[ CITATION Pal01 \l 4105 ] là kết hợp các bề mặt

phản xạ (gương) vào các hệ thống hình ảnh thơng thường sử dụng thấu kính . Đây là hệ
thống hình ảnh catadioptric. Dễ dàng nhận thấy rằng trường nhìn trong hệ thống đo cảm
ứng có thể thay đổi bằng cách thay đổi hình dạng của gương được sử dụng. Tuy nhiên,
tồn bộ hệ thống hình ảnh phải có một điểm nhìn hiệu quả duy nhất để cho phép tạo ra
các hình ảnh phối cảnh thuần túy từ một hình ảnh cảm biến. Tại Đại học Columbia, một
camera mới với trường nhìn bán cầu đã được phát triển. Hai camera như vậy có thể được
đặt ngược nhau mà khơng vi phạm giới hạn điểm nhìn duy nhất, để tạo ra một cảm biến
đa hướng thực sự. Camera của Columbia sử dụng thiết kế quang học tối ưu bao gồm một
gương parabol và một ống kính viễn tâm. Nó chỉ ra rằng, để đạt được hiệu suất quang
học cao (độ phân giải chẳng hạn), gương và hệ thống ống kính chụp ảnh phải phù hợp
và thiết bị phải được thực hiện cẩn thận.
Gần đây, có thể ghi nhận sự quan tâm ngày càng tăng đến tầm nhìn đa hướng đối
với các ứng dụng trong chế tạo người máy. Viện Fraunhofer giải quyết vấn đề bản địa
hóa robot trong mơi trường văn phòng trong nhà bằng cách sử dụng camera đa hướng.
Sau khi tìm hiểu mơi trường văn phịng từ các hình ảnh đào tạo, được chụp tại các vị trí
nhất định đã biết, hình ảnh hiện tại được so sánh với hình ảnh đào tạo được đặt ra bằng
cách tiếp cận gọi là “Đối sánh dựa trên ngoại hình”. Các chiến lược phân loại phù hợp
mang lại ước tính về vị trí hiện tại của robot. Đối với tác phẩm này, các hình ảnh
catadioptric ban đầu đã được chỉnh sửa và cắt bớt. Việc chia nhỏ các hình ảnh đã được
chỉnh sửa thành các khu vực đơn lẻ, được kết hợp riêng biệt dẫn đến tăng cường độ chắc
chắn đối với hai hiện tượng: sự sai lệch một phần của cảnh và sự khác biệt xoay giữa tư
thế của robot ở vị trí hiện tại so với tư thế của robot ở vị trí tham chiếu tiếp theo của quá


trình đào tạo giai đoạn. Một trong những mục đích của cơng việc này là nghiên cứu các
phương pháp tính tốn luồng quang học đáng tin cậy trên các hình ảnh catadioptric bị
bóp méo. Điều khiển robot trong mơi trường năng động cao là một nhiệm vụ thu thập và
xử lý dữ liệu giác quan theo thời gian thực. Khung cảnh xung quanh của robot đang thay
đổi nhanh chóng và cần phải liên tục tìm kiếm thơng tin liên quan nhất đến nhiệm vụ
điều hướng của robot. Sự tổng hợp thông tin cảm quan bằng cách sử dụng trọng tài bên

ngồi, ví dụ, luồng quang học được tính tốn từ hệ thống nhìn tồn diện, trong trường
hợp này có thể định hướng các tín hiệu cảm giác nhanh hoạt động trên các trường nhìn
nhỏ hơn. Trong các thí nghiệm ban đầu, việc tích hợp các phần tử xử lý VLSI tương tự
và quang học cho thấy kết quả đầy hứa hẹn và mục tiêu nghiên cứu là điều tra loại triển
khai này cho các ứng dụng robot di động dựa trên thị giác phản ứng nhanh [ CITATION
Pal01 \l 4105 ] [ CITATION Ish01 \l 4105 ][ CITATION Mic04 \l 4105 ][ CITATION Gac01 \l 4105 ].
Trung tâm Cảm nhận Máy móc ở Praha quan tâm đến một số dấu hiệu liên quan
đến tầm nhìn đa hướng. Họ tập trung vào nền tảng của tầm nhìn tồn cảnh âm thanh nổi
bằng cách trình bày phân tích hình học biểu sinh cho camera toàn cảnh. Các camera toàn
cảnh với gương cầu lồi hoặc gương parabol, cịn được gọi là camera tồn cảnh trung
tâm, cho phép hình học biểu sinh như camera phối cảnh. Ước tính chuyển động từ hình
ảnh tồn cảnh địi hỏi người ta phải thiết kế một camera tồn cảnh thực tế với một mơ
hình tốn học đơn giản. Nó đề xuất phương pháp hiệu chuẩn, phát triển hình học biểu
sinh cho hình ảnh tồn cảnh và sử dụng các thuật tốn để ước tính chuyển động. Trong
một nỗ lực để tăng tốc độ tìm kiếm và khám phá các phương pháp tìm kiếm hiệu quả
cho sự tương ứng của các hình ảnh tồn cảnh, người ta u cầu phân tích hình dạng của
các đường cong biểu thức để xác định vị trí các điểm tương ứng và nghiên cứu sự liên
kết giữa các hình ảnh tồn cảnh. Nhiệm vụ khác là ước tính mơ hình camera đa hướng từ
hình học biểu sinh. Các tác giả cố gắng ước tính các thơng số của mơ hình camera đa
hướng phi tuyến từ các tương ứng hình ảnh được thiết lập tự động [ CITATION Svo98 \l
4105 ] [ CITATION Svo99 \l 4105 ] trong khi khơng có giả định nào về cảnh, ngồi độ cứng (ví
dụ: khơng có đối tượng hiệu chuẩn) được đề cập. Trong vài năm qua, nhiều nhà nghiên
cứu đã cố gắng tìm ra nhiều cách khác nhau để giảm bớt vấn đề trong các cuộc họp.
Xerox đã phát triển một phịng họp hỗ trợ truyền thơng được trang bị camera và micrô
để ghi lại nội dung nghe nhìn. Phịng thí nghiệm Khơng gian Thơng minh NIST đã thiết
lập một phịng họp thơng minh khác. Trong nghiên cứu của Microsoft, một số nghiên
cứu đã được tiến hành về việc ghi lại các cuộc họp nhóm nhỏ bằng camera vòng. Đại
học California, San Diego cũng đã phát triển một hệ thống họp được trang bị một số
camera hiệu chỉnh cố định, một số camera hoạt động và một số camera đa hướng. Hệ
thống này có thể theo dõi mọi người trong phịng và nhận dạng khn mặt của họ.



Phịng thí nghiệm Hệ thống tương tác của Đại học Carnegie Mellon và Đại học
Karlsruhe đã phát triển công nghệ cho phịng họp thơng minh từ năm 1997 bằng cách
khai thác các hệ thống đa hướng để theo dõi người tham gia cuộc họp. Công việc này sẽ
tiếp tục theo hướng này.
5. Các loại camera catadioptric trung tâm
Có hai loại camera toàn cảnh khác nhau thường được sử dụng. Loại đầu tiên là
một camera toàn cảnh trung tâm bao gồm một camera phối cảnh thông thường và một
gương hypebol. Loại thứ hai do một camera trực quan và parabol tạo ra. Phép chiếu trực
giao trong Hình 5 có thể được mơ hình hóa bằng các tia đi song song với trục quang học.
Hình thứ hai trong Hình 5 mơ tả phép chiếu phối cảnh qua một điểm được gọi là lỗ kim.
Chỉ hệ thống bao gồm camera phối cảnh và gương được tập trung xem xét đánh giá.

Hình 6. a) Hệ thống trực giao b) Hệ thống phối cảnh
Tính đối xứng quay của các hình ảnh đa hướng ngay lập tức gợi ý sự thích hợp
của việc sử dụng phân bố điểm ảnh phân cực. Một khả năng là sử dụng cảm biến logpolar SVAVISCA được phát triển tại DIST, Đại học Genova, được đặc trưng bởi sự
phân bố điểm ảnh log-polar. Do đó, sử dụng cảm biến hình ảnh này có hai ưu điểm
chính:
Hình ảnh tồn cảnh có thể được đọc trực tiếp từ cảm biến mà không cần bất kỳ
phép biến đổi hình học nào. Hình ảnh tồn cảnh sẽ có độ phân giải ngang khơng đổi do
thực tế là cảm biến log-polar được tổ chức thành các vịng đồng tâm với số lượng điểm
ảnh khơng đổi. Mặt khác, loại cảm biến này rất đắt tiền và độ nhạy sáng phụ thuộc vào
kích thước điểm ảnh. Nó khơng đảm bảo sự trùng khớp giữa camera và gương, phát sinh
biến dạng hình ảnh và khơng thể loại bỏ.


6. Thiết kế gương
Mơ hình hình ảnh của camera đa hướng catadioptric được xác định bởi hình dạng
của gương. Người ta có thể thiết kế hình dạng của gương theo cách mà các đặc tính hình

học nhất định của thế giới sang hình ảnh được bảo tồn - mà chúng ta sẽ gọi là đặc tính
chiếu tuyến tính. Hình dạng của gương xác định hướng mà tia bắt nguồn từ camera bị
phản xạ.
Họ các hình dạng gương có thể được sử dụng "về mặt lý thuyết" để xây dựng hệ
thống thị giác catadioptric trung tâm được bắt nguồn từ [CITATION Nay \l 4105 ]. Nếu z (r)
là biên dạng của hình gương, trong đó z là chiều cao và r =√ x 2 + y 2 bán kính, họ hồn
chỉnh của gương được cho bởi các phương trình biên dạng:

trong đó c biểu thị khoảng cách giữa lỗ kim của camera và điểm ngắm hiệu quả,
và t là hằng số tích hợp. Với t > 2 và c > 0 thì thu được một hypeboloid. Một
hyperboloid được xác định bởi quỹ tích của các điểm mà tại đó khoảng cách giữa hai
điểm cố định, được gọi là F và F ’, là không đổi. Khi một hypeboloid được sử dụng để
xây dựng hệ thống thị giác catadioptric, tiêu điểm F nằm bên trong gương. Khi t → ∞, c
→ ∞ và c / t = h là hằng đẳng thức 1 mơ tả một paraboloid. Các nghiệm khác của
phương trình 1 mơ tả một mặt phẳng, một hình cầu, một hình nón và một hình elip. Nếu
t = 2 và c > 0, phương trình 1 được rút gọn thành phương trình mặt phẳng. Nếu c = 0 và
t > 0, phương trình 1 mơ tả một gương cầu, và cho c = 0 và t ̧ 2, nó mơ tả một gương
hình nón. Những hình dạng gương này khơng thể được sử dụng để xây dựng một hệ
thống cảm ứng với một điểm ngắm hiệu quả duy nhất trong thực tế vì khi c = 0 thì lỗ
kim hiệu dụng và điểm nhìn hiệu dụng trùng nhau.
Việc lựa chọn các thuộc tính cần được bảo tồn bởi hệ thống hình ảnh catadioptric
đương nhiên liên quan đến ứng dụng cụ thể. Bảng [Tab. 1] hiển thị một số cấu hình nhân
bản hiện có và thuộc tính của chúng. Gương cầu không yêu cầu tiêu cự dài để thu được
ảnh hội tụ. Đó là, gương cầu ưu việt hơn để tạo ra các hệ thống đa hướng chi phí thấp có
thể tạo ra hình ảnh rõ ràng. Tuy nhiên, ảnh thu được với gương cầu khơng có tâm chiếu
duy nhất và khơng thể chuyển thành ảnh phối cảnh bình thường. Mặc dù hệ thống có
gương như vậy có thể quan sát trên mặt phẳng nằm ngang nhưng hình ảnh bị méo ở
ngoại vi.



Gương

Chi phí

Ảnh
khơng rõ

Độ sâu
tiêu cự

Góc nhìn
dọc

Tâm
Thấu kính
chiếu đơn

Cầu

Thấp

Nhỏ

Nơng

-90..10

Khơng

Thường


Nón

Thấp

Lớn

Sâu

-45..45

Khơng

Thường

Hyperbol
với độ
cong nhỏ

Cao

Nhỏ

Nơng

-90..10



Thường


Hyperbol
với độ
cong lớn

Cao

Lớn

Sâu

-90..45



Thường

Parabol
với độ
cong nhỏ

Cao

Nhỏ

Nơng

-90..10




Telecentric

Parabol
với độ
cong lớn

Cao

Lớn

Nơng

-90..45



Telecentric

Bảng 1: So sánh giữa các loại gương

Cấu hình gương quan trọng tiếp theo là một hyperboloid, sẽ được thảo luận thêm
trong phần này. Hình ảnh được chụp bằng gương này có thể được chuyển đổi sang phối
cảnh bình thường, hình ảnh hình trụ, v.v. Hơn nữa, nếu độ cong nhỏ, độ loạn thị không
lớn như vậy. Khi đảm bảo căn chỉnh camera và gương một cách cẩn thận và lỗ kim của
camera trùng với tiêu điểm F ’, sẽ thu được cảm biến tầm nhìn đa hướng với một điểm
nhìn hiệu quả duy nhất tại F. Loại gương này tốt nhất cho các hệ thống quang học sử
dụng camera thông thường.
Một hệ thống quang học lý tưởng cũng có thể được thực hiện bằng gương parabol
và thấu kính viễn tâm. Tia đi qua tiêu điểm của paraboloid bị phản xạ theo phương song

song với trục đối xứng của gương. Paraboloid có thể được sử dụng để xây dựng hệ
catadioptric trung tâm nếu hình chiếu của gương vào hình ảnh có thể được mơ hình hóa
bằng phương pháp chỉnh hình, thay vì hình chiếu phối cảnh. Điều này có thể đạt được
bằng cách sử dụng thấu kính viễn tâm, có thể coi là thấu kính có tiêu điểm nằm ở vơ
cực. Hệ thống dựa trên paraboloid có một số ưu điểm so với hệ thống dựa trên
hyperboloid. Vì hình chiếu là trực giao, nên khoảng cách giữa gương và thấu kính có thể
được thiết lập linh hoạt trong thiết kế và thấu kính loại bỏ phản xạ bên trong của hình trụ
hoặc hình cầu thủy tinh hỗ trợ gương. Tuy nhiên, việc tạo ra một hệ thống nhỏ gọn và
chi phí thấp bằng cách sử dụng thấu kính viễn tâm là một điểm khó khăn. Loại ống kính
này thường đắt và chúng khơng hề nhỏ.


Trong một số trường hợp, chúng tôi mong đợi các thuộc tính chiếu tuyến tính, có
thể được phân loại thành ba loại chính [Hình. 7]:
Độ phân giải dọc khơng đổi - Hạn chế thiết kế này nhằm mục đích tạo ra hình
ảnh, trong đó các đối tượng ở khoảng cách được dán từ trục quang học của camera sẽ
ln có cùng kích thước trong hình ảnh, khơng phụ thuộc vào tọa độ dọc của nó. Nói
cách khác, nếu chúng ta xem xét một hình trụ bán kính C xung quanh trục quang học
của máy ảnh, chúng ta muốn đảm bảo rằng tỷ lệ khoảng cách, được đo theo phương
thẳng đứng dọc theo bề mặt của hình trụ, khơng thay đổi khi đo trong ảnh. Sự bất biến
như vậy cần đạt được bằng cách thiết kế đầy đủ mặt cắt gương.
Độ phân giải ngang không đổi - Độ phân giải ngang không đổi đảm bảo rằng mặt
đất được chụp ảnh dưới phép biến đổi Euclide theo tỷ lệ. Như vậy, nó hỗ trợ rất nhiều
cho việc đo khoảng cách và góc trực tiếp từ hình ảnh cũng như dễ dàng theo dõi các đối
tượng nằm trên mặt đường hoặc mặt bàn (phụ thuộc vào vị trí gương).
Độ phân giải góc khơng đổi - Các điểm cách đều nhau trên kinh tuyến của hình
cầu được ánh xạ tuyến tính trong mặt phẳng ảnh.
Gương hình nón là loại gương thứ hai sau gương cầu có thể dễ dàng chế tạo. Đặc
điểm của gương hình nón là phản xạ bình thường theo phương thẳng đứng. Do đó, có
thể dễ dàng kết hợp nhiều gương. Tuy nhiên, độ loạn thị lớn và ảnh thu được khơng thể

chuyển thành ảnh phối cảnh bình thường như gương cầu. Hơn nữa, nó cần độ sâu tiêu cự
dài để có được hình ảnh tập trung. Một gương cầu có tiêu điểm như thấu kính thường;
mặt khác, gương hình nón khơng có nó và cần một thấu kính được đặt gần lỗ kim.

Hình 7: So sánh các loại hình chiếu khác nhau a) dọc; b) ngang; c) góc


Sự kết hợp của hai cách tiếp cận đầu tiên được gọi là “Gương hỗn hợp”, trong đó
một phần của cảm biến hình ảnh được sử dụng để thu được hình ảnh có độ phân giải dọc
khơng đổi, trong khi phần cịn lại được sử dụng để mang lại hình ảnh có độ phân giải
ngang khơng đổi. Trong trường hợp này, cả hai ràng buộc khác biệt về hình dạng gương
do hai mục tiêu thiết kế được kết hợp với nhau trong một dữ liệu duy nhất. Một thuộc
tính rất quan trọng của hệ thống đa hướng là độ phân giải của nó. Có thể đạt được độ
phân giải đồng nhất trong một phần chế độ xem hình ảnh nếu đảm bảo rằng tỷ lệ khoảng
cách được đo theo hướng thẳng đứng dọc theo bề mặt của hình trụ sẽ khơng thay đổi khi
đo trong hình ảnh.
Một tính chất quan trọng khác của gương được thiết kế như vậy là độ nhạy
khoảng cách [CITATION 17G02 \l 4105 ]. Giá trị này xác định các thuộc tính chiếu tuyến tính
suy giảm như thế nào đối với các đối tượng đặt ở các khoảng cách khác nhau so với các
thuộc tính được xem xét cho thiết kế. Vì chúng ta biết dạng hình học của hệ catadioptric,
chúng ta có thể tính tốn hướng ánh sáng truyền qua điểm nhìn cho mỗi điểm ảnh.
Trong trường hợp này, quan điểm hiệu quả duy nhất cho phép xây dựng các hình ảnh
tồn cảnh cũng như phối cảnh chính xác về mặt hình học [CITATION Nay \l 4105 ]. Tiêu chí
đầu tiên của độ phân giải dọc không đổi cũng như độ nhạy khoảng cách sẽ rất quan
trọng đối với công việc tiếp theo.
7. Mô tả hệ thống catadioptric
Nayar (1997) đã đưa ra phương pháp xử lý chính thức đầu tiên đối với các hệ
thống catadioptric với một góc nhìn duy nhất trong bối cảnh thị giác máy tính. Dụng cụ
đo cảm ứng là một hệ thống quang học kết hợp các yếu tố phản xạ (catoptric) và khúc xạ
(dioptric) (Hecht và Zajac, 1997). Thuật ngữ cảm biến catadioptric được sử dụng cho

các cảm biến bao gồm camera và gương.
Cảm biến catadioptric đơi khi cịn được gọi là cảm biến đa hướng, mặc dù thuật
ngữ này gây hiểu lầm, vì chúng hiếm khi đa hướng theo nghĩa là chúng chụp ảnh theo
mọi hướng. Phần lớn nhưng khơng phải mọi tồn bộ, các gương quay đối xứng và cầu
lồi. Cảm biến catadioptric trung tâm loại này có một góc nhìn hiệu quả duy nhất
[ CITATION Svo99 \l 4105 ]. Một điểm nhìn duy nhất là điều kiện để tạo ra các hình ảnh phối
cảnh thuần túy từ các cảm biến hình ảnh. Điều kiện này đảm bảo rằng cảm biến hình ảnh
chỉ đo cường độ ánh sáng đi qua tâm chiếu. Rất mong muốn cảm biến đa hướng có một
tâm chiếu hiệu quả duy nhất, tức là một điểm duy nhất mà tất cả các tia sáng chính của
hệ thống hình ảnh đi qua. Tâm chiếu này đóng vai trị là lỗ kim (hoặc điểm nhìn) hiệu
quả của cảm biến đa hướng. Vì tất cả các điểm cảnh đều được "nhìn thấy" từ góc nhìn
duy nhất này, nên các hình ảnh phối cảnh thuần túy khơng bị biến dạng (giống như các


điểm được nhìn thấy từ hệ thống hình ảnh truyền thống) có thể được xây dựng thơng qua
chuyển đổi hình ảnh phù hợp.
Trong cơng trình này, hệ thống bao gồm một máy quay video phối cảnh thông
thường được trang bị nhiều gương khác nhau sẽ được nghiên cứu. Hệ thống như vậy cho
phép chụp một phần lớn góc khơng gian, thường là trường nhìn 360x105 độ.

Hình 8: a) Mơ tả chuẩn bị hệ thống với camera thông thường và giá giữ gương b) vị trí cài đặt
thấu kính và camera

Có hai thiết lập để chụp những hình ảnh như vậy: phản chiếu trên / dưới máy ảnh.
Gương phía trên camera thường được sử dụng cho robot di động để quan sát địa hình.
Thiết lập thứ hai phù hợp hơn để chụp những người ngồi quanh bàn. Trước khi xử lý
thêm, mỗi hình ảnh được chuyển đổi thành một góc nhìn tiêu chuẩn hoặc tồn cảnh.
Hình ảnh đa hướng có các tính năng khác nhau như hình ảnh được chụp bởi camera tiêu
chuẩn. Độ phân giải dọc của hình ảnh được biến đổi thường có phân bố khơng đồng đều.
Hình trịn bao gồm số điểm ảnh cao nhất được chiếu từ đường viền của gương, có nghĩa

là độ phân giải hình ảnh đã biến đổi đang giảm về phía tâm gương. Nếu hình ảnh được
trình chiếu cho con người, nó phải là hình ảnh phối cảnh / tồn cảnh để khơng bị méo.
Các vấn đề khác khi xử lý hình ảnh thêm trở nên quan trọng hơn, như độ phân giải
không gian, kích thước cảm biến và dễ dàng lập bản đồ giữa hình ảnh đa hướng và cảnh.
Các phương pháp phù hợp để chuyển đổi hình ảnh thành hình ảnh tồn cảnh hoặc hình
ảnh phối cảnh sẽ được đưa ra trong các chương tiếp theo.
8. Hiệu chuẩn hệ thống
Hiệu chuẩn camera là quá trình xác định các đặc điểm hình học và quang học bên
trong camera (thông số nội tại) và vị trí và hướng 3 chiều của khung camera so với một


hệ quy chiếu nhất định (thơng số bên ngồi). Việc hiệu chỉnh cảm biến tầm nhìn đa
hướng có thể được thực hiện theo hai bước. Đầu tiên, camera phối cảnh có thể được hiệu
chỉnh bằng phương pháp hiệu chuẩn camera thơng thường. Thơng tin chi tiết có trong
chương sau.
Bước tiếp theo liên quan đến việc định vị camera đối với gương sao cho thu được
thuộc tính điểm nhìn hiệu quả duy nhất. Svoboda [ CITATION Svo98 \l 4105 ] đề xuất
phương pháp, trong đó các thơng số gương được biết chính xác từ q trình sản xuất và
các thơng số nội tại của camera đã được ước tính một cách đáng tin cậy. Theo thiết kế,
chiều cao mong muốn và bán kính của vành gương đã được biết. Sau đó, mơ hình
camera phối cảnh có thể được sử dụng để dự đốn hình ảnh của mép gương vì nó sẽ
được quan sát khi camera được đặt đúng vị trí so với gương. Bằng cách phủ dự đoán
trong cửa sổ video trực tiếp, vị trí camera có thể được điều chỉnh theo cách thủ cơng để
có được vị trí chính xác về vành gương đã quan sát và dự đoán.
Trong một số trường hợp, giá đỡ đặc chủng có thể được sử dụng để gắn gương
chính xác vào máy ảnh. Những giá đỡ này được thiết kế để chứa nhiều loại máy ảnh,
ống kính và gương. Do đó, giá đỡ gương cho phép di chuyển hình ảnh phản chiếu trên
mặt phẳng camera theo cả ba hướng. Có nghĩa là có thể điều chỉnh khoảng cách camera
từ gương, vị trí gương dọc liên quan đến mặt phẳng camera và xoay camera theo trục
ngang. Camera cũng thường có tính năng thu phóng thủ công (cài đặt độ dài tiêu cự).

Tất cả các thông số này có thể thay đổi một chút tùy theo phiên. Thực hiện hiệu chỉnh
toàn bộ camera mỗi phiên là quá trình tốn thời gian và rườm rà. Hơn nữa, điểm chính
(hình chiếu trục Z của khung camera vào hình ảnh) được biết là khó ước lượng chính
xác. Thay vào đó, phương pháp hiệu chỉnh hệ thống tự động được đề xuất, phương pháp
này sẽ ước tính lại độ dài tiêu cự và điểm chính của camera cũng như vị trí hình ảnh
phản chiếu chính xác trên mặt phẳng máy ảnh. Q trình này được mơ tả trong phần 4.1.
Phương pháp được Bunschoten sử dụng [ CITATION Bun03 \l 4105 ] là lựa chọn thủ cơng
vành gương từ hình ảnh. Cách tiếp cận được đề xuất là hoàn toàn tự động và phục vụ
cho việc ổn định hình ảnh theo thời gian thực.
9. Hiệu chỉnh camera phối cảnh
Để hiệu chỉnh máy ảnh, cần có tọa độ 3 chiều của các điểm điều khiển tham chiếu
trên mục tiêu hiệu chuẩn và tọa độ 2-D tương ứng của quan sát hình ảnh.
Bàn cờ có hoa văn thường được sử dụng cho mục đích này, nơi các góc hoặc các
dấu khác đóng vai trị là điểm kiểm sốt. Những dấu này được chọn để phát hiện được
đơn giản và chính xác mà khơng cần sự tương tác của người dùng. Hiệu chuẩn camera
liên quan đến việc giảm thiểu sai số giữa các vị trí đo được của các điểm điều khiển và


vị trí của các điểm điều khiển theo dự đốn của kiểu camera dưới dạng một chức năng
của các thông số kiểu máy ảnh. Các phương pháp hiệu chuẩn khác nhau đã được trình
bày trong tài liệu. Phương pháp hiệu chuẩn camera được sử dụng phổ biến nhất có lẽ là
phương pháp DLT (biến đổi tuyến tính trực tiếp) được báo cáo ban đầu bởi Abdel-Aziz
và Karara (1971). Kết quả của việc hiệu chuẩn camera là một phép biến đổi rõ ràng ánh
xạ điểm thế giới 3D M =(X , Y , Z , l)T thành điểm ảnh 2D m=(u , v ,l)T . Ánh xạ này có thể
được biểu diễn bằng ma trận hình chiếu 3x4, P, bao gồm 11 tham số vật lý: góc quay R x,
Ry, Rz, biến đổi tx, ty, tz, các tọa độ của điểm (u0,v0), hai hệ sộ au, av và độ lệch giữa các
trục ảnh c.
Cần ít nhất 6 điểm cho một phương pháp, nhưng thường nhiều điểm hơn được sử
dụng trong tối ưu hóa bình phương nhỏ nhất để giảm thiểu ảnh hưởng của độ không đảm
bảo đo.

Ghi ảnh bằng camera tương đương với việc ánh xạ điểm O trong không gian vật
thể thành điểm ảnh trong mặt phẳng chiếu. Mặt phẳng chiếu gọi là mặt phẳng hình.
Điểm N là tâm hình chiếu.
Mặt phẳng
hình ảnh

Trung tâm hình
chiếu

Khơng gian
– vật thể

Hình 9: Hệ quy chiếu không gian của vật thể và hệ quy chiếu mặt phẳng hình ảnh

Hệ thống quang học của camera ánh xạ điểm O trong không gian vật thể thành
ảnh I trong mặt phẳng ảnh. [x, y, z] là tọa độ không gian đối tượng của điểm O trong khi
[u, v] là tọa độ mặt phẳng ảnh của điểm ảnh I. Các điểm I, N & O do đó thẳng hàng. Đây
là điều kiện thẳng hàng, cơ sở của phương pháp DLT[ CITATION Kwo \l 4105 ].


Hình 10: Điểm chính

Một điểm mới P, điểm chính, được giới thiệu trong Hình 10. Đường thẳng vẽ từ
tâm hình chiếu N lên mặt phẳng ảnh, song song với trục W và vng góc với mặt phẳng
hình ảnh, được gọi là trục chính và điểm chính là giao điểm của trục chính với mặt
phẳng ảnh. Khoảng cách chính d là khoảng cách giữa hai điểm P và N. Giả sử tọa độ
mặt phẳng ảnh của điểm chính là [u0, v0, 0] trí của điểm N trong hệ quy chiếu mặt
phẳng ảnh trở thành [u0, v0 , d]. Vectơ B vẽ từ điểm N đến I trở thành [u – u 0, v – v0,
−d]. Bây giờ, giả sử rằng vị trí của tâm chiếu (N) trong hệ quy chiếu vật thể-khơng gian
là [x0, y0, z0] (Hình 10). Véc tơ A được vẽ từ N đến O là [x – x 0, y – y0, z - z0]. Vì các

điểm O, I và N thẳng hàng nên các vectơ A và B tạo thành một đường thẳng duy nhất.
Điều kiện thẳng hàng đơn giản tương đương với biểu thức vectơ:
B=cA (1)

Trong đó c = một đại lượng vơ hướng. Lưu ý ở đây rằng vectơ A và B ban đầu
được mô tả trong hệ quy chiếu vật thể-không gian và hệ quy chiếu mặt phẳng hình ảnh,
tương ứng. Để liên hệ trực tiếp các tọa độ, cần phải mô tả chúng trong một hệ quy chiếu
chung. Một cách hay để làm điều này là biến đổi vectơ A thành hệ quy chiếu mặt phẳng
hình ảnh:

Từ phương trình (2) ta có:

Lưu ý rằng, u, v, u0, v0 trong phương trình (3) & (4) là tọa độ mặt phẳng hình ảnh
theo đơn vị độ dài trong đời thực, chẳng hạn như cm. Tuy nhiên, trong thực tế, hệ thống


số hóa có thể sử dụng các đơn vị độ dài khác nhau, chẳng hạn như điểm ảnh, và chúng
tôi phải đáp ứng điều này:

Trong đó [ʎu, ʎv] là hệ số chuyển đổi đơn vị đối với trục U và trục V
10. Mở gói đơn giản
Phép biến đổi đơn giản nhất sử dụng việc mở gói hình ảnh nguồn. Các thông số
hiệu chỉnh hệ thống như độ dài tiêu cự, phương trình biên dạng gương và mặt phẳng
chiếu là khơng cần thiết. Việc chuyển đổi như vậy đặc biệt hữu ích, khi chúng ta không
thể trích xuất các tham số này. Một khả năng khác là sử dụng gương có độ phân giải dọc
khơng đổi để chụp ảnh tồn cảnh, điều này khơng gây ra biến dạng trong hình ảnh thu
được. Trong các trường hợp khác, sự biến dạng có thể xảy ra và phụ thuộc vào cấu hình
gương. Các thơng số cần thiết để mở gói đơn giản là tâm và bán kính của hình trịn chiếu
từ viền gương. Sự chuyển đổi tọa độ đầu ra thành tọa độ của hình ảnh đã chụp có thể
được viết như sau:


Trong đó tham số Offset xác định nguồn gốc của hình ảnh toàn cảnh được biến
đổi. Các tham số ROUTER và RINNER là bán kính của đường viền gương chiếu bên ngoài và
bên trong, xác định giới hạn chuyển đổi. Các tham số cuối cùng CenterX và CenterY chỉ
định tâm vòng trịn, được gương chiếu lên ảnh camera. Kích thước ngang của chế độ
xem tồn cảnh được tính là chu vi) 2π (R OUTER - RINNER) và kích thước dọc được cho bởi
sự khác biệt theo chiều ngang ROUTER - RINNER

Hình 11: Biến đổi tháo cuộn tròn đơn giản


Các điểm ảnh được tính tốn trong hình ảnh camera khơng tương ứng chính xác
“1-1” với điểm ảnh của hình ảnh được chiếu, vì vậy nên sử dụng các phương pháp khử
răng cưa điểm ảnh phụ. Trong các ứng dụng được nêu trong các chương sắp tới, phương
pháp nội suy hai tuyến tính sẽ được sử dụng có thể dẫn đến răng cưa trong trường hợp
hình ảnh catadioptric được lấy mẫu thiếu. Cần có hình thức lọc biến thể khơng gian để
giải quyết vấn đề này. Vấn đề này đã ít được chú ý trong các tài liệu về tầm nhìn tồn
cảnh và có thể là một hướng đi thú vị cho các nghiên cứu trong tương lai. Vấn đề này có
thể được giải quyết bằng cách chuyển đổi quá nhiều hình ảnh. Giải pháp khác có thể là
sử dụng cạc đồ họa 3D với tính năng lọc dị hướng làm phần cứng để chuyển đổi hình
ảnh.
11.Hình thành hình học
Kiến thức hình học về hệ catadioptric với một điểm hiệu dụng duy nhất cho phép
biến đổi chính xác hình ảnh phản chiếu thành dạng phù hợp - toàn cảnh, phối cảnh, v.v.
Trước hết, tập trung vào việc biến đổi hình ảnh tồn cảnh chính xác, Một trong những
cách tiếp cận là sử dụng tính chất hình học của gương để chiếu ảnh trên mặt phẳng hình
trụ quanh trục gương chính. Do tính đối xứng quay của hệ thống, chúng ta chỉ cần biết
thơng tin về biên dạng gương. Sự hình thành ảnh có thể được biểu diễn như một thành
phần của các phép biến đổi tọa độ và phép chiếu. Chúng tơi muốn tìm mối quan hệ giữa
điểm thế giới thực và điểm trên mặt phẳng hình ảnh camera. Hệ tọa độ gương có tâm tại

tiêu điểm F và gương hypebol được xác định bởi phương trình:

trong đó a, b là các tham số gương và e= √ a 2+b 2 biểu thị độ lệch tâm. Tâm camera
phải trùng với tiêu điểm thứ hai của gương để bảo toàn điểm nhìn hiệu quả duy nhất.
Tâm chiếu hiệu dụng nằm sau gương và khoảng cách đến tâm camera bằng hai lần độ
lệch tâm. Dạng hình học của sự hình thành ảnh trong camera cảm ứng đa hướng được
thể hiện trong Hình 11. Các phép chiếu cảm giác là một tập hợp con của một loại phép
chiếu chung. Trong phép chiếu catadioptric trung tâm, đầu tiên một điểm được chiếu tới
gương qua tiêu điểm của nó và sau đó điểm này được chiếu lên một mặt phẳng ảnh từ
tiêu điểm thứ hai. Tuy nhiên, vẫn có sự biến dạng do vị trí khác nhau của các đối tượng
quan sát.
Hệ thống catadioptric trung tâm
Coi hình trụ chiếu có bán kính d, trong đó trục của hình trụ thẳng hàng với trục
quang học của camera và gương. Phép chiếu này được tính từ mặt phẳng hình trụ đến


×