Tải bản đầy đủ (.pdf) (283 trang)

GIÁO TRÌNH KỸ THUẬT SỐ HÓA TÀI LIỆU doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.79 MB, 283 trang )



GIÁO TRÌNH

KỸ THUẬT SỐ
HÓA TÀI LIỆU

Mục lục

Kỹ thuật số hoá

Chương 1: Khái quát lý thuyết

Chương 2: Khái quát kỹ thuật

Chương 3: Nghiên cứu trường hợp

Chương 4: Tạo siêu dữ liệu: từ các ảnh số đến cơ sở dữ liệu của các tư li
ệu

Chương 5: Sử dụng các dịch vụ ảnh

Chương 6: Quét ảnh chụp

Chương 7: Quét phim

Chương 8: Giải pháp kết hợp

Chương 9: Duy trì khai thác và tiếp tục bổ sung kiến thức




Chương này sẽ trình bày về những khái niệm và thuật ngữ cơ bản; ảnh
hưởng của độ phân giải, số bit và độ nén đến chất lượng ảnh; các đặc
tính của văn bản và những yếu tố khác ảnh hưởng đến quá trình chuyển
đổi chất lượng và lựa chọn cho quá trình số hoá.
Định nghĩa
Ảnh số là các "ảnh điện tử" được quét từ các tài liệu gốc. Một ảnh số có
thể thể hiện chính xác nội dung, bố cục và cách trình bày của văn bản
gốc bao gồm kiểu chữ, chú thích và ảnh minh hoạ.
Quá trình quét
Một ảnh số được lấy mẫu và vẽ dưới dạng một hệ thống các điểm hay các
nguyên tố ảnh được gọi là các pixel. Mỗi pixel thể hiện một đơn vị màu
(đen, trắng hoặc các gam màu khác) và về mặt số được biểu diễn dưới
dạng các mã nhị phân (mã chỉ gồm các số 0 và/ hoặc 1). Các chữ số nhị
phân (bit) trong mỗi pixel được ghi theo một trình tự nhất định trong
máy tính, hoặc được rút gọn thành một công thức toán học. Các số nhị
phân này sẽ được máy tính dịch và đọc để tạo ra một hình ảnh analog
hiện trên màn hình hoặc bản in.
Các ảnh số khác với các dạng tệp điện tử khác. Mặc dù cũng được gọi là
"ảnh mành" ("raster image") hoặc "ảnh nhị phân" ("bitmapped
image") song ảnh số khác với các ảnh vectơ ở chỗ đồ hoạ của chúng
không được thể hiện dưới dạng các đường thẳng và đường cong toán học
xác định mà được thể hiện dưới dạng hệ thống các điểm. Ảnh vectơ nhìn
chung là có thể được tạo ra với kích cỡ và độ chính xác bất kỳ, còn chất
lượng của ảnh số lại phụ thuộc vào độ phân giải được ấn định từ trước
khi quét.
Khác với các tệp văn bản chữ - số như ASCII, các ảnh số là những tệp
"câm" bởi vì thông tin chứa trong đó không thể duyệt hoặc điều chỉnh
được. Tuy nhiên, chúng lại có thể được sử dụng làm tệp nguồn để tạo ra
các tệp văn bản có thể đọc được thông qua các chương trình nhận dạng

chữ quang học (ORC). Độ chính xác của những chương trình như vậy vô
cùng khác nhau, tuỳ thuộc vào thuộc tính của nguyên bản và các ảnh số
được quét.
Tổng hợp các khả năng kỹ thuật
Mặc dù kỹ thuật ảnh số đã được biết đến từ khá lâu nhưng nó mới bắt
đầu được sử dụng rộng rãi từ thập niên 1990, khi những tiến bộ kỹ thuật
cho ra đời những hình ảnh rõ nét hơn, chi phí thấp hơn và khả năng truy
cập cao hơn. Các nhân tố đã tạo ra những điều kiện thuận lợi đó là:
- Sự phát triển kỳ diệu của máy tính cá nhân
- Các hệ thống mạng rộng lớn có tốc độ cao trở nên phổ biến
- Chi phí kỹ thuật giảm, đặc biệt là trong việc lưu trữ
- Sự ra đời của các máy quét có độ phân giải cao
- Sự xuất hiện của kiến trúc phục vụ khách hàng và mạng quốc tế
(World Wide Web)
Lợi ích của ảnh số
Ảnh số mang những đặc điểm ưu việt hơn hẳn ảnh analog về mặt độ nét,
độ chính xác, độ trung thực so với nguyên bản, chi phí bộ nhớ và khai
thác
Trong lưu trữ
+ trung thực so với nguyên bản
- tương đương với kỹ thuật ánh sáng thấu kính
- thay đổi được kích cỡ ảnh
- có thể chỉnh sửa ảnh
+ trung thực trong sao chép
- sản phẩm phong phú và có chất lượng
- truy cập thông tin liên tục mà không phải bảo quản phương tiện
Trong khai thác
- có thể nối mạng
- có thể truy cập nhiều ảnh cùng một lúc
- có thể tạo ra nhiều ảnh phái sinh

- có thể thao tác và sử dụng ảnh
- ít tốn kém
- tiết kiệm không gian
Những mặt hạn chế của ảnh số
Mặc dù ảnh số là một kỹ thuật mới đầy hứa hẹn, nhưng vẫn còn có rất
nhiều điều bất lợi làm hạn chế khả năng được sử dụng của nó trong công
tác thư viện và văn thư hiện nay, bao gồm:
- cơ sở kỹ thuật thay đổi nhanh chóng
- đang ở giai đoạn giao thời nên phải chấp nhận cả những cái truyền
thống và những cái mới
- chịu nhiều sức ép về mặt pháp luật, trong đó có luật bản quyền
- chưa có các tiêu chuẩn cụ thể
- chất lượng và khả năng của các phần cứng, phần mềm rất không đồng
nhất
- có những yêu cầu cao về sao chép, lưu trữ và di nhập
- nhu cầu và khả năng của các cơ sở lưu trữ chưa cao
- thiếu tính ổn định và sự hỗ trợ của các hãng dịch vụ
Khi nào vượt qua được những trở ngại này, kỹ thuật ảnh số sẽ bước vào
giai đoạn thực nghiệm tại các cơ sở văn hoá. Tuy nhiên, các cơ sở này
hiện nay đã có cơ hội để tạo điều kiện phát triển cho kỹ thuật mới này
theo hướng đáp ứng được những nhu cầu cụ thể của họ. Sự tăng số
lượng thư viện và cơ sở lưu trữ hiện đang giúp kỹ thuật ảnh số tiến đến
gần những mục đích hiện nay và trong tương lai. Song vì tiềm lực của
các cơ sở còn hạn chế, các dự án đều phải được xây dựng một cách cẩn
thận nhằm đảm bảo cho khả năng thành công cao nhất và hạn chế thất
bại. Điều này đòi hỏi các cơ sở phải đặt ra những mục tiêu không quá
tham vọng, dựa trên cơ sở đã hiểu biết đầy đủ về những thuộc tính của
các văn bản sẽ được quét, các thao tác phức tạp của quá trình quét và
mọi mặt hữu dụng của ảnh số.
Quét ảnh: chuyển từ analog sang số

Các thuộc tính của tư liệu
Khi quét ảnh số phải tính toán đến các quy trình kỹ thuật liên quan đến
việc chuyển từ ảnh analog sang ảnh số cũng như các thuộc tính của
chính các văn bản gốc như: kích thước, mức độ chi tiết, thang màu. Các
văn bản có thể được định tính bằng các quy trình kỹ thuật được sử dụng
để tạo ra nó, bao gồm các phương pháp bằng tay, bằng máy, chụp ảnh
hay mới nhất là điện tử. Hoặc toàn bộ các văn bản bằng giấy hoặc bằng
phim có thể được chia thành 4 loại sau:
+ Bản văn/Dòng (Text/line art): Gồm những hình ảnh đồng màu có ranh
giới rõ ràng, thường đơn sắc, có thể được tạo ra bằng tay, máy chữ hoặc
máy in, bao gồm: bản văn, bản viết tay, đồ thị, bản khắc gỗ, văn bản
được đánh máy hay in laser, bản thiết kế, bản đồ và bản chép nhạc.
+ Tông màu chuyển tiếp (Continuous tone): Những văn bản gồm các
gam chuyển tiếp nhau, có thể đơn sắc hoặc đa sắc, bao gồm ảnh chụp,
một số loại tranh (như bản phác hoạ bằng chì, tranh màu nước) và các
tác phẩm đồ hoạ có các thuộc tính gam chuyển tiếp như bản khắc đồng,
in đá, in chụp.
+ Nửa tông hoặc kiểu nửa tông (Halftone or halftone-like): Những hình
ảnh tạo thành từ các điểm hoặc đường nằm cách đều, có thể đơn hoặc đa
sắc, bao gồm những ảnh đồ hoạ được tạo thành từ các nét hoặc đường kẻ
song song sít nhau nằm cách đều, ví dụ bản chạm khắc hoặc khắc axit.
+ Hỗn hợp (Mixed): Tổng hợp cả 3 loại văn bản trên, đơn hoặc đa sắc,
bao gồm báo, tạp chí, sách có tranh minh hoạ.
Ba loại kỹ thuật quét
+ "đen trắng" ("bitonal"): một pixel gồm một số nhị phân thể hiện màu
trắng hoặc đen, thích hợp với các loại bản văn và một số loại nửa tông.
+ "dải xám" ("grayscale"): một pixel gồm nhiều số nhị phân thể hiện các
gam màu xám khác nhau, thích hợp với các văn bản gam chuyển tiếp
đen trắng, nửa tông, hỗn hợp và một số bản viết tay.
+ "màu" ("color"): một pixel gồm nhiều số nhị phân thể hiện các màu

sắc khác nhau, thích hợp với tất cả các loại văn bản trong đó màu sắc giữ
vai trò quan trọng.
Chất lượng ảnh số được quét chịu ảnh hưởng của:
+ độ phân giải và ngưỡng
+ kỹ thuật chỉnh sửa ảnh
+ quá trình nén
+ thiết bị sử dụng và hiệu suất của thiết bị đó
+ vận hành hợp lý, cẩn thận
Độ phân giải (Resolution) được xác định bằng số lượng pixel tạo ra ảnh
theo đơn vị dpi (số điểm trên 1 insơ). Số lượng pixel càng lớn thì độ phân
giải càng cao và khả năng thể hiện các chi tiết của ảnh càng cao. Tuy
nhiên, đến một mức độ nào đó, độ phân giải cao hơn cũng không cải
thiện đáng kể chất lượng ảnh mà chỉ làm tăng kích thước của tệp. Vấn
đề mấu chốt khi quét ảnh là phải xác định được độ phân giải vừa đủ để
thể hiện được tất cả những chi tiết quan trọng của nguyên bản.
Ngưỡng (threshold) là thuật ngữ được dùng trong kỹ thuật quét đen
trắng để chỉ một điểm trên thước đo mà tại đó các giá trị thể hiện màu
xám được dịch thành các pixel trắng hoặc đen. Điểm này thường nằm
trong khoảng từ 0 đến 255. Dưới đây là ví dụ về ảnh hưởng của các
ngưỡng khác nhau lên bản đánh máy được quét ở cùng một độ phân
giải.
Trong kỹ thuật quét đen trắng, độ phân giải và ngưỡng là mấu chốt của
chất lượng ảnh. Kỹ thuật này phù hợp nhất với các văn bản có độ tương
phản cao như bản văn, đồ hoạ. Những văn bản gam chuyển tiếp hoặc có
độ tương phản thấp như ảnh chụp cần đến kỹ thuật quét dải xám hoặc
nhiều màu. Trong 2 loại kỹ thuật quét này, độ phân giải và số bit là 2 yếu
tố cấu thành nên chất lượng ảnh.
Số bit (bit depth) được xác định bằng số lượng chữ số nhị phân được sử
dụng để thể hiện mỗi pixel. Số bit càng lớn thì càng nhiều sắc màu được
thể hiện. Dải biến động (dynamic range) là thuật ngữ chỉ toàn bộ mức

biến đổi các gam màu - được đo bằng mật độ kế- từ vùng sáng nhất đến
vùng tối nhất của văn bản. Các vật liệu trong suốt có dải biến động rộng
hơn, do đó thể hiện được nhiều gam màu hơn các vật liệu phản quang.
Khả năng bắt được tất cả các sắc màu của máy quét, bao gồm những chi
tiết trong vùng sáng và vùng tối, phụ thuộc vào dải biến động của máy và
số bit. Máy quét drum thường bắt màu tốt nhất và máy quét flatbed
thường bắt màu kém nhất (Xem chương 2 và chương 6). Số bit tăng lên
sẽ ảnh hưởng đến độ phân giải cần thiết, kích thước tệp và phương pháp
nén.
Chỉnh sửa ảnh (Image enhancement) là quá trình cải thiện chất lượng
ảnh. Tuy nhiên, việc chỉnh sửa rất có thể sẽ ảnh hưởng đến độ trung
thực của ảnh. Chỉnh sửa còn làm tăng chi phí quét ảnh. Các đặc điểm
chỉnh sửa điển hình có thể được thực hiện trong quá trình quét hoặc
trong phần mềm biên tập ảnh gồm lọc (filter), các đường cong tái tạo
tông màu (tonal reproduction curves) và quản lý màu (color
management). Dưới đây là ví dụ về sử dụng bộ lọc ở một bản viết tay
được quét với cùng một ngưỡng và độ phân giải, và một bức ảnh được
"hiệu chỉnh" bằng chương trình biên tập ảnh.
Nén (Compression) làm giảm kích thước tệp trong quá trình xử lý, lưu
trữ và chiếu ảnh. Chất lượng ảnh có thể bị ảnh hưởng bởi kỹ thuật nén
và mức độ nén.
Thiết bị sử dụng và hiệu suất của nó qua thời gian sẽ ảnh hưởng đến
chất lượng hình ảnh. Những công nghệ quét khác nhau có ảnh hưởng rõ
rệt đến sản phẩm và độ chính xác của kỹ thuật xác định chuẩn chất
lượng sẽ được trình bày ở phần sau. Vì vậy, những đòi hỏi của các nhà
sản xuất về các khả năng của hệ thống (độ phân giải, số bit, các kỹ thuật
chỉnh sửa, sản lượng đầu vào, tuổi thọ phần cứng, độ tin cậy) cần phải
được xem xét cẩn thận. Bạn hãy đảm bảo rằng những yêu cầu về chất
lượng ảnh đã được đáp ứng bằng cách kiểm tra các sản phẩm qua màn
hình và giấy, sử dụng kết hợp các vị trí kiểm tra kỹ thuật và các mẫu

nguyên bản.
Tính hợp lý và cẩn trọng của người điều hành cùng với các phương tiện
quét có ảnh hưởng rất lớn đến chất lượng hình ảnh thu được. Những
quyết định hợp lý của người điều hành là vô cùng quan trọng khi quét
đen trắng vì ở đó chất lượng ảnh hoàn toàn phụ thuộc vào ngưỡng và độ
phân giải. Quá trình quét xám phụ thuộc ít hơn vào những quyết định
đó. Tuy nhiên, vẫn cần phải thực hiện thường xuyên một chương trình
bảo hiểm chất lượng ảnh để kiểm tra sản phẩm của mọi kỹ thuật quét.
Đảm bảo ghi được đầy đủ thông tin
Trường Đại học Cornell đã áp dụng một nguyên tắc quét ảnh đảm bảo
chất lượng và tính thực dụng cao nhất với chi phí thấp nhất. Các yêu cầu
về lưu trữ, khai thác và tính kinh tế đòi hỏi phải có một tệp số chủ
(digital master) chứa đầy đủ mọi thông tin có trong nguyên bản. Chuyển
đổi bằng kỹ thuật số hay analog chỉ là các cách khác nhau để ghi lại nội
dung thông tin chứa trong nguyên bản dưới dạng cất giữ hay trưng bày.
Còn về mặt giá trị thực hay giá trị nhân văn thì bản copy chỉ có thể đại
diện chứ không thể thay thế được nguyên bản.
Lưu trữ
Nếu ảnh số được sử dụng với mục đích lưu trữ thì chất lượng ảnh là yếu
tố quan trọng, bởi vì nó sẽ được sử dụng để thay thế cho nguyên bản, còn
nguyên bản sẽ được cất giữ ở một nơi khác, trong môi trường phù hợp.
Số lượng ảnh phải đủ để giảm hoặc loại bỏ hoàn toàn khả năng người
đọc dùng đến nguyên bản.
Ảnh số có thể thay thế nguyên bản trong một số trường hợp nhất định, ví
dụ khi nguyên bản là sách dễ hư hỏng. Khi đó ảnh số phải mang được
đầy đủ những thông tin quan trọng của nguyên bản để có thể đáp ứng
được mọi yêu cầu về nghiên cứu, pháp luật và tài chính. Như sẽ nói ở
phần sau, các tiêu chuẩn và thông lệ đối với việc bảo quản các tư liệu vi
phim phải được đặt ra để xác định các yêu cầu về chất lượng trong số
hoá.

Khai thác
Ảnh số là công cụ để thuận tiện hoá việc khai thác, nhưng trong mọi
trường hợp, một ảnh số không thể thoả mãn được tất cả các nhu cầu của
người sử dụng. Một tệp số chủ cần được tạo ra và sử dụng để nhân bản
hàng loạt hình ảnh vì các nguyên nhân sau:
- với những khả năng khác nhau của máy tính, tất cả các nhu cầu sử
dụng có thể được đáp ứng thông qua các bản phái sinh
- các yêu cầu và khả năng về in ấn, hiển thị và xử lý ảnh vô cùng đa dạng
- khó có thể cùng một lúc đáp ứng được tất cả các nhu cầu về sự hoàn
chỉnh, chi tiết của ảnh và tốc độ xử lý
- quá trình quét càng tốt thì chất lượng bản phái sinh càng tốt
- những đòi hỏi của người sử dụng ngày càng cao, phải có đủ các tệp số
chủ để cung cấp cho những ứng dụng trong tương lai
Chi phí
Chi phí sản xuất những ảnh số có chất lượng cao sẽ ít hơn chi phí dành
cho những ảnh chất lượng thấp và không đáp ứng được những yêu cầu
lâu dài. Tạo ảnh số là một công việc tốn kém; chi phí vào nhân lực và
việc tìm kiếm, chuẩn bị, kiểm tra và ghi kỹ hiệu thông tin số cao hơn
nhiều so với chính chi phí quét ảnh. Trong những năm tới, giá quét và
lưu ảnh sẽ hạ xuống và làm giảm bớt sự chênh lệch nói trên.
Chất lượng ảnh cao không đồng nghĩa với độ phân giải và số bit cao
nhất, mà chính là sự phù hợp giữa quá trình quét ảnh với nội dung của
nguyên bản và quét ở mức độ đảm bảo bắt được đúng những thông tin
đó, không nhiều hơn cũng không ít hơn. Bằng cách đó, có thể tránh được
khả năng phải quét lại ảnh sau này; chi phí cho lưu trữ và di nhập thông
tin không phải là nhỏ nhưng ở mức độ hợp lý và có thể được bù lại bằng
giá trị lâu dài của thông tin số. Giá trị đó nên được xác định bằng nội
dung tri thức chứa trong các ảnh số chứ không bị hạn chế bởi những
phán quyết về mặt kỹ thuật tại thời điểm quét.
Độ phân giải, kích thước tệp và chất lượng ảnh

Độ phân giải thường được đo bằng số lượng điểm thể hiện ảnh trên một
insơ vuông(ký hiệu: insơ = in hoặc ").
Ví dụ: 100 điểm/ in (dpi) = 100 x 100 (1002)
hay 10 000 điểm/ in2
200 dpi = 2002 hay 40 000 điểm/ in2
Chú ý: Cấp số nhân tăng nhanh hơn cấp số cộng. Số lượng điểm được sử
dụng ở độ phân giải 200 dpi gấp 4 lần số lượng điểm được sử dụng ở độ
phân giải 100 dpi.
Quan hệ giữa độ phân giải và kích thước tệp
Tổng số điểm được sử dụng trên bề mặt ảnh được xác định bằng cách
nhân chiều cao ảnh với chiều rộng và dpi2. Trong kỹ thuật quét đen
trắng, 1 số nhị phân (bit) thể hiện 1 pixel. Khi chuyển đổi, kích thước tệp
chứa ảnh được tính bằng byte, mỗi byte được cấu thành từ 8 bit. Do đó,
để tính kích thước tệp chứa ảnh được quét bằng kỹ thuật đen trắng theo
byte, ta lấy tổng số bit (h . w . dpi2) chia cho 8.
Công thức 1: xác định kích thước tệp của ảnh đen trắng:

Ví dụ kích thước của tệp quét một trang giấy viết thư (khổ 8,5'x11') với
dộ phân giải 100 dpi là 116.875 byte
So sánh với tệp văn bản giãn dòng đơn chứa một trang giấy viết thư có
kích thước 2000 đến 3000 byte.
Do các tệp ảnh số thường có kích thước lớn, người ta thường dùng một
số đơn vị rút gọn của byte như:
1 KB = 1000 byte
1 MB = 1 000 000 byte = 1000 KB
1 GB = 1 000 000 000 byte = 1000 MB
Kích thước pixel, kích thước vật lý và dpi
Nguyên bản được xác định bằng kích thước vật lý và mức độ chi tiết của
nó, còn một ảnh số được xác định bằng kích thước pixel, "kích thước vật
lý" và dpi. Máy quét, máy in và màn hình cũng được mô tả bằng 3 thuộc

tính này. Bạn có thể hình dung chúng như những hình chữ nhật gồm các
pixel xếp theo hàng và cột, trong đó:
- kích thước pixel tính = số pixel nằm theo hàng ngang x số pixel nằm
theo cột dọc (màn hình VGA có kích thước pixel 640 x 480).
- kích thước vật lý được đo bằng không gian tính bằng insơ theo chiều
ngang và chiều thẳng đứng mà các pixel đó chiếm (phần lớn các máy
quét flatbed đều thích hợp với các văn bản có kích thước 8,5" x 14").
- dpi thể hiện số lượng pixel trên 1 insơ.
Các máy quét flatbed quét ở một độ phân giải đặt sẵn với các tư liệu có
kích thước khác nhau nhưng không vượt quá 11" x 17". ở loại thiết bị
này, mảng quét (scanning array) được đặt ở kích thước cố định đó, và tất
cả các văn bản phù hợp với máy đều được quét ở cùng một độ phân giải
(dpi) được đặt sẵn đó. Độ phân giải sẽ chỉ thay đổi khi thiết định dpi
được thay đổi, ví dụ, chuyển từ 300 dpi lên 600 dpi.
Ví dụ: Máy quét được đặt ở độ phân giải 300 dpi trên mảng quét 11" x
17". Kích thước pixel của máy được xác định bằng cách nhân tích số của
độ phân giải và kích thước pixel thứ nhất (300 x 11) với tích số của độ
phân giải và kích thước pixel thứ hai (300 x 17), ta có kết quả là là 3300 x
5100. Nếu đặt lại độ phân giải ở mức 600 dpi, kích thước pixel của máy
quét sẽ là (600 x11) x (600 x 17) = 6600 x 10200.
Các máy quét khác, trong đó có camera số, không đặt sẵn độ phân giải.
Các camera số có kích thước pixel đặt sẵn (ví dụ 2000 x 3000) nhưng
không có tấm ép (platen) cố định. Về mặt lý thuyết thì loại máy này có
thể quét được văn bản ở mọi kích cỡ. Camera số hoạt động tương tự như
máy quay vi phim. Kích thước pixel của mảng quét được điều chỉnh theo
kích thước vật lý của nguyên bản bằng cách tăng hoặc giảm khoảng cách
giữa camera và tư liệu (hoặc sử dụng một thấu kính khác). Do đó, độ
phân giải sẽ thay đổi theo các kích thước khác nhau của các tư liệu. Nếu
tư liệu có kích thước nhỏ, độ phân giải có thể ở mức cao. Khi kích thước
tư liệu tăng lên, khoảng cách giữa camera và tư liệu đó cũng phải tăng

lên, làm tăng khoảng cách giữa các pixel và vì vậy độ phân giải sẽ giảm.
Ví dụ, một tư liệu kích thước 4x5 in có độ phân giải thích hợp lớn gấp 10
lần độ phân giải thích hợp của tư liệu kích thước 40 x 50 in với cùng một
kích thước pixel.
Xác định dpi từ kích thước pixel
Để xác định dpi từ kích thước pixel, trước hết ta phải xét tỉ lệ cạnh
(aspect ratio) của cả vật liệu nguồn và mảng pixel của máy quét. Tỉ lệ
cạnh là đại lượng liên hệ giữa các số đo cạnh của một hình chữ nhật.
Trong trường hợp một văn bản, tỉ lệ cạnh là tỉ lệ giữa chiều cao và chiều
rộng. Còn đối với một camera số thì đại lượng này thể hiện quan hệ giữa
kích thước pixel theo chiều này với kích thước kia. Mối quan hệ giữa tỉ lệ
cạnh của nguyên bản và kích thước pixel của camera sẽ ảnh hưởng đến
cách tính dpi. Để đạt được dpi cao nhất khi quét toàn bộ một văn bản thì
kích thước vật lý của văn bản đó phải nằm trong giới hạn kích thước
pixel của camera (hay chính là nằm gọn trong khu vực quét).
Vì hình ảnh có thể được xoay sau khi đã xử lý nên định hướng tư liệu
(theo chiều nằm ngang hay dựng đứng) không phải là một khâu trong
quá trình quét. Tư liệu có thể được đặt ở theo một trong hai hướng trên
trong camera số. Có thể tạo được một tư liệu kích thước lớn ở các độ
phân giải cao hơn bằng cách quét từng phần văn bản đó và xếp hoặc
đính các ảnh rời rạc vào với nhau sau khi đã xử lý.
Công thức 2: Xác định các tỷ lệ cạnh khi quét:

Ví dụ 1: Xét một văn bản có kích thước 4 x 6 in được quét với mảng quét
2000 x 3000 pixel. Tỉ lệ cạnh của tư liệu sẽ = 6/ 4 = 1,5; tỉ lệ cạnh của
mảng quét = 3000/ 2000 = 1,5. Vì có cùng tỉ lệ cạnh nên văn bản sẽ trùm
khít mảng quét, và toàn bộ mảng quét được sử dụng để quét văn bản.
(Khi hai tỉ lệ cạnh như trên không trùng nhau, hai hình chữ nhật tạo
thành do văn bản và mảng quét sẽ không trùng khớp và hoặc chỉ có một
phần mảng quét được sử dụng, hoặc chỉ có một phần văn bản được quét.

Xem các ví dụ 2 và 3)
Ví dụ 2: Xét trường hợp tư liệu có tỉ lệ cạnh nhỏ hơn tỉ lệ cạnh của mảng
quét. Một văn bản có kích thước giấy viết thư sẽ có tỉ lệ cạnh là 11/ 8,5 =
1,29. Nếu được quét bằng camera số có tỉ lệ cạnh 3072/ 2048 = 1,5 thì
kích thước của văn bản sẽ nhỏ hơn mảng quét. (Hình vuông có tỉ cạnh =
1) Nếu kích thước pixel thứ nhất của camera được đặt để quét chiều
rộng của văn bản thì chiều chiều dài của văn bản sẽ ngắn hơn cạnh thứ
hai của pixel. Toàn bộ văn bản sẽ được quét nhưng chỉ có một phần
mảng quét được sử dụng.
Ví dụ 3: Xét trường hợp tư liệu có tỉ lệ cạnh lớn hơn tỉ lệ cạnh của mảng
quét (ví dụ: văn bản có kích thước 7" x 14", tức là có tỉ lệ cạnh = 2),
được quét bằng camera số với mảng quét 2048 x 3072. Nếu kích thước
thứ nhất của pixel tương ứng với chiều rộng của văn bản và kích thước
pixel thứ hai đặt tương ứng với chiều dài (ví dụ 3a) thì văn bản sẽ dài
hơn mảng quét và chỉ có một phần văn bản được quét. Nhưng nếu xoay
lại thì xét về chiều rộng, văn bản vẫn ngắn hơn mảng quét và toàn bộ
văn bản sẽ được quét (ví dụ 3b).
Khi nào văn bản và mảng quét đã phù hợp với nhau thì độ phân giải để
quét toàn bộ văn bản có thể được xác định bằng cách chia kích thước
pixel của máy quét (xem công thức số 3). Công thức tương tự có thể được
sử dụng để tính độ phân giải hữu hiệu khi quét phim của một văn bản
bằng kỹ thuật quét trượt. Lưu ý là bạn phải sử dụng kích thước thật của
nguyên bản chứ không phải kích thước của phim (Xem chương 7).
Công thức 3: xác định độ phân giải từ kích thước pixel của máy quét:

Xác định độ phân giải cần thiết để bắt được đầy đủ thông tin
Chúng ta đã biết làm thế nào để xác định độ phân giải và kích thước tệp
từ kích thước pixel, song làm thế nào để biết liệu độ phân giải đó có phù
hợp để bắt được đầy đủ thông tin trong nguyên bản hay không? Tại
Cornell, chúng tôi đã xây dựng một phương pháp đặt chuẩn để tính toán

các yêu cầu về độ phân giải khi tạo ra và hiển thị ảnh số, trong đó áp
dụng những tiêu chuẩn về chất lượng ảnh của công nghiệp vi đồ hoạ.
Xác định chuẩn số là gì?
Xác định chuẩn số là một thủ tục không thể thiếu để dự đoán về sản
phẩm.
- trước hết là xác định rõ các thuộc tính của tư liệu nguồn và các nhu cầu
sử dụng hiện thời cũng như trong tương lai.
- xác định các nhân tố trong các biến số liên quan (cả chủ quan lẫn
khách quan)
- sử dụng những công thức bắt nguồn từ vi đồ hoạ
- cần sự khẳng định
Bằng cách xác định chuẩn số, ta có thể:
- đưa ra những phán quyết đáng tin cậy
- xác định và thu hẹp phạm vi lựa chọn
- xác định những nhu cầu ở mức vĩ mô
- hiểu đúng thông tin các nhà kinh doanh đưa ra để quảng cáo
- hợp tác về mặt dịch vụ và sản phẩm
- đầu tư một cách hiệu quả
- đặt ra được những mục tiêu có tính khả thi
Áp dụng các tiêu chuẩn ảnh analog vào ảnh số
Các chỉ số cổ điển về độ phân giải và chất lượng
Công nghiệp vi đồ hoạ đã xây dựng những tiêu chuẩn để đánh giá chất
lượng hình ảnh dựa trên Chỉ số chất lượng (ANSI/AIIM MS23 - 1991).
Chỉ số chất lượng (QI- Quality Index) là đại lượng liên hệ giữa độ phân
giải của hệ thống và độ nét của văn bản. Đại lượng này liên quan đến số
đo chiều cao của những kí tự nhỏ nhất trong văn bản, gồm cả các dấu
trên và dưới, được gọi là "cao x". Trong kỹ thuật vi phim, QI được tính
bằng tích số của cao x (kí hiệu là h) với p - số cặp dòng loại nhỏ nhất trên
bảng kiểm tra kỹ thuật chuẩn được máy quay phân giải (Xem hình 1).
Chỉ số chất lượng được sử dụng để dự báo mức chất lượng của hình ảnh,

gồm các mức: thấp (3,6); trung bình (5,0) và cao (8,0).
Công thức 4: Chỉ số chất lượng cổ điển:
QI = h x p
p = QI/h
Sử dụng QI trong lĩnh vực số hoá
Trong báo cáo kỹ thuật AIIM TR26 - 1993 mang tên Resolution as it
relates to Photographic and Electronic Imaging, các tác giả đã đề xuất
rằng QI có thể được sử dụng để đặt chuẩn chất lượng cho các bản số hoá
và cho biết nhiều phân tích đã được tiến hành để tìm ra sự khác nhau
giữa các cách bắt chi tiết của máy quay vi phim và máy quét. Trường
Đại học Cornell đánh giá cao ý kiến trên và đã thực nghiệm sử dụng
phương pháp này trong vòng 5 năm để khẳng định các kết quả nghiên
cứu sau khi đã chuyển đổi hơn 1 triệu ảnh.
Để chuyển đổi giữa độ phân giải ảnh chụp và ảnh số, ta phải tiến hành
các bước sau:
- thiết lập các mức chất lượng ảnh tương ứng với nhau
- hợp lý hoá hệ thống đo ( chuyển từ U.S. sang hệ mét)
- tương ứng các điểm với các cặp đường
- điều chỉnh "sự đọc lệch"(trong kỹ thuật quét đen trắng)
1. Thiết lập các mức chất lượng ảnh tương đương
Việc đầu tiên là phải đặt ra các mức chất lượng có thể chấp nhận được
trong việc quét ảnh số dựa trên mô hình tiêu chuẩn được AIIM áp dụng
đối với vi phim. Các ảnh phóng đại ở các độ phân giải khác nhau của các
chữ được số hoá dưới đây được so sánh với các chữ được chụp bằng vi
phim với QI ở các mức thấp (3,6), trung bình (5,0) và cao (8,0). Theo
đánh giá của Cornell thì các ảnh trên có sự tương ứng về mức chất
lượng. Lưu ý rằng sự thay đổi các mức chất lượng trong kỹ thuật quét
đen trắng thể hiện ở các cấu trúc hình răng cưa - thường được gọi là
"aliasing" hay "jaggies". Còn trong kỹ thuật vi phim và quét xám, chất
lượng ảnh giảm thể hiện ở chỗ các nét chữ mờ.

2. Hợp lý hoá hệ thống đo: chuyển từ điểm/ in sang điểm/ mm
Khi đã thiết lập được những mức độ tương ứng về chất lượng ảnh số, ta
cần phải tính đến sự khác nhau giữa các cách đo độ phân giải. Độ phân
giải số được đo bằng số điểm trên 1 in, còn độ phân giải của ảnh chụp
hay còn gọi là độ phân giải cổ điển được đo bằng số cặp dòng trên 1 mm
(p). Để tính QI dựa vào độ phân giải, ta phải đổi các đơn vị từ in sang
mm và điểm sang cặp dòng. 1mm » 0,039 in, vì vậy số điểm trên 1mm
(dpm) » 0,039 x dpi. Để xác định số điểm trên số mm chiều cao của kí tự,
ta phải nhân độ phân giải với 0,039 lần chiều cao (h) của kí tự (công thức
5).
Công thức 5: Xác định số điểm trên 1 kí tự:
dpm = 0,039 dpi x h
3. Tương ứng giữa số điểm và số cặp dòng
Đường kính của một điểm = chiều ngang của một đường (xem hình 1, tr.
13). Vì vậy trong bài tập thực hành số 3, 3,9 điểm sẽ tạo ra 1mm kí tự,
xấp xỉ với 4 đường hay 2 cặp dòng/ mm và QI = 2.
Theo tiêu chuẩn đối với chỉ số chất lượng cổ điển, QI = 2 không cho chất
lượng ảnh cao. Qua đó chúng ta có thể dự đoán được rằng độ phân giải
100 dpi là không không đủ để thể hiện tốt 1mm kí tự. Điều này được
thấy trong hình bên.
 Chú ý: Nếu chỉ có độ phân giải qui định chất lượng ảnh thì QI = 8 đạt
được với ảnh được thể hiện bằng ít nhất 16 điểm trên 1mm chiều cao kí
tự.
Do đường kính của một điểm tương đương với chiều ngang của một
đường nên hai điểm mới tương đương với một cặp dòng, nghĩa là số
điểm trên 1mm phải được chia đôi thì mới tương ứng với số cặp dòng
trên 1mm.
Đến đây chúng ta đã nắm được 3 bước trong việc áp dụng QI cổ điển để
xác định QI số trong kỹ thuật quét đen trắng.
Nhớ lại rằng trong kỹ thuật vi phim, QI = p x h. Tương ứng ta có:


Từ đó ta có công thức tính độ phân giải dpi=2QI/0,0039
4. Điều chỉnh sự đọc lệch trong kỹ thuật quét đen trắng
Trong công thức trên, dpi là độ phân giải ở đầu vào của máy tính. Ví dụ,
nếu QI = 8 cần cho một tư liệu gồm những ký tự có kích thước từ 1mm
trở lên, thì độ phân giải cần thiết là (2x8)/ (0,039x1) = 410. Tuy nhiên, do
các lỗi lấy mẫu cùng với sự không ăn khớp giữa bộ phận dò (detector)
của máy quét và chi tiết ảnh, được gọi là "sự đọc lệch"
("misregistration"), độ phân giải ở đầu vào của máy quét đen trắng
thường không nhất quán với độ phân giải ở đầu ra. Trường Đại học
Cornell đã áp dụng giải pháp được AIIM TR26- 1993 đưa ra: tăng độ
phân giải đầu vào lên ít nhất 50% để bù vào "sự đọc lệch". Trong ví dụ
trên, độ phân giải 410 có thể được tăng 50%, tức là lên 615 dpi. Phần
tăng này là cần thiết dù máy quét có hay không sử dụng độ phân giải
"thực" hay "nội suy". (Xem chương 2 về máy quét.) Sự đọc lệch là một
vấn đề đặc biệt khó giải quyết khi xử lý những hoạ tiết đều đặn như các
đối tượng phân giải chuẩn (standard resolution targets) (xem hình trang
sau) hay các văn bản nửa tông và kiểu nửa tông (xem bản khắc dưới). Vì
vậy, ANSI/ AIIM MS 44-1998 đã tuyên bố rằng các mô hình kiểm tra
tiêu chuẩn độ phân giải không nên áp dụng với những máy quét có độ
phân giải từ 600 dpi trở xuống.
Mô hình kiểm tra độ phân giải

×