BÀI TÌM HIỂU VỀ CÁC CHUẨN NÉN FAX(JBIG)
I. Giới thiệu về máy Fax:
I.1 Giới thiệu chung
:
Hình 1:Máy fax
Fax là kỹ thuật điện tử gửi bản sao (copy) trực tiếp qua hệ thống dây dẫn điện. Máy gửi
có khả năng rà quét bản gốc, đổi thông tin thành tín hiệu rồi phát qua đường dây điện đến
máy nhận ở một nơi khác. Máy nhận sau đó đổi tín hiệu ngược lại và in bản sao lên giấy.
Kỹ thuật fax thay thế kỹ thuật liên lạc bằng điện tín trong thập niên 1980. Ngày nay tuy
fax dần dần bị email thay thế trong nhiều lĩnh vực truyền thông, fax vẫn còn được sử
dụng vì những lợi điểm sau:
• Nhiều loại hồ sơ quan trọng không nên dùng email để tránh bị mất hay đánh cắp
• Ở một số quốc gia chữ ký điện tử trên email không được tín nhiệm bằng chữ ký
trên giấy fax
Ngoài ra, các hãng công ty lớn dùng fax servers, máy tính phục vụ với khả năng chuyển
các loại hồ sơ thành tín hiệu fax gửi đi, nhận fax, chuyển thành email và phát vào máy
tính cá nhân của nhân viên, không cần in ra giấy.
•
I.2 Lịch sử:
I.2.1 Gửi tín hiệu theo dây dẫn
Nhá sáng tạo Alexander Bain người Scotland được xem như người đầu tiên phát minh ra
hệ thống gửi hồ sơ bằng tín hiệu điện năm 1843. Ông dùng tác động qua lại của quả lắc
đồng hồ điện để tạo các đường ngang, rà quết được các nét mực trên giấy. Đến năm 1851
Frederick Bakewell cải tiến thêm phát minh của Bain và đem triển lãm tại London.
Năm 1861 Giovanni Caselli, vật lý học người Ý, sáng chế ra máy Pantelegraph gửi được
bản sao của hồ sơ gốc giữa Lyon và Paris. Thời gian này điện thoại chưa được phổ biến.
Năm 1881, Shelford Bidwell người Anh thiết kế máy rà và vẽ hình và gửi được hình 2
chiều, không cần nơi nhận phải vẽ lại bằng tay.
Đến khoảng năm 1900 Arthur Korn sáng chế máy Bildtelegraph giúp phổ biến các thông
báo có hình những người mất tích hay đang bị truy nã tại châu Âu. Sau đó, những máy
gửi điện thư khác như máy Bélinograf (1930) của Édouard Belin và máy Hellschreiber
của Rudolf Hell (1929). Rudolf Hell là người tiên phong trong thiết kế cơ động rà quết
hình và phát tín hiệu.
I.2.2 Gửi tín hiệu không cần dây dẫn
Năm 1924 Richard H. Ranger nhân viên đài Radio Corporation of America sáng chế máy
gửi hồ sơ bằng sóng radio trong lòng biển. Đây là tiền thân của máy fax ngày nay. Ngày
29 tháng 11 1924 hình chân dung tổng thống Mỹ Calvin Coolidge gửi từ New York băng
ngang Đại Tây Dương đến London. Ngày nay fax dùng sóng radio vẫn còn được sử dụng
trong thông tin khí tượng. Cũng vào năm 1924, Herbert E. Ives dùng kỹ thuật phân tách
màu sáng chế ra máy fax đầu tiên có khả năng in màu.
Giữa thập niên 1970 máy Exxon Qwip là máy đầu tiên dùng tia sáng để rà và ghi tín hiệu
lên một trục ống quay. Tia sáng phản chiếu thay đổi cường độ sáng tối thùy theo độ đậm
nhạt trên giấy hồ sơ gốc. Cường độ tia sáng được đổi thành xung điện đưa vào bộ phận
phát âm. Tín hiệu âm thanh sau đó được truyền theo dây dẫn điện thoại đến máy nhận.
Máy nhận có bộ phận nghe, ghi nhận âm thanh và chuyển dịch thành tín hiệu. Tín hiệu
sau đó được truyền vào máy phun mục, in lên giấy bản sao nằm trên một trục ống xoay
cùng vận tốc với trục ống của máy gửi. Máy Exxon Qwip thời bấy giờ kích thước rất lớn
và rất đắt tiền. Chỉ có các hãng thiết kế lớn mới có khả năng mua.
Đến năm 1985, Hank Magnuski chế ra phần cứng để dùng kỹ thuật fax trên board chính
máy tính gọi là GammaFax.
I.3 Các loại fax
• Máy fax đơn thuần
• Máy đa năng gồm khả năng gửi và nhận fax, scan rà hình và in
• Máy fax analog
• Máy fax digital
• Máy fax trắng đen
• Máy fax màu
• Phần mềm phát tín hiệu fax thẳng từ máy tính vào dây dẫn điện thoại (như
WinFax của Windows)
I.4 Các bước thực hiện truyền thông giữa 2 máy FAX
- Máy A quay số đến máy B và chờ nhấc
máy
- Khi máy B nhấc máy: máy A truyền chuỗi xung có tần số 2,1Khz trong
khoảng
thời gian 3 giây để xác định với máy B “Đây là máy
FAX”
- Máy A trao đổi cấu hình truyền nhận với máy B: bao gồm chuẩn truyền, tốc
độ
truyền,….
- Máy B xác nhận thông
tin
- Máy A bắt đầu quá trình truyền dữ
liệu
- Máy A báo với máy B kết thúc quá trình truyền dữ
liệu
- Máy B xác nhận kết thúc dữ
liệu
- Máy A và B cùng gác
máy
II. Chuẩn nén FAX- JBIG
II. 1. Các chuẩn sử dụng cho máy FAX
Các tiêu chuẩn quốc tế hiện nay cho máy fax được gọi là “Group 3", “Group 4" và
“JBIG".
Group 3 bao gồm hai thuật toán nén thực sự khác biệt được biết đến như chế độ MH và
MR.
Các thuật toán của tiêu chuẩn Group 4 thường được gọi là MMR
Các thuật toán được giới thiệu tóm tắt như sau:
MH-Modified Huffman coding : Thuật toán quy định tại CCITT Recommendation T .
4 .Thuật toán này sử dụng độ dài mã hóa với một coder Huffman tĩnh.Nó bao gồm các từ
mã o dòng cuối của cho mục đích phát hiện các lỗi
MR- Modified READ(Relative Element Address Designate )coding: Các thuật toán quy
định tại Khuyến nghị CCITT T.4 [1], bằng cách sử dụng một tham chiếu 2D với mã hóa
theo độ dài và mã hõa huffman tĩnh. Nó cũng bao gồm các dòng cuối của từ mã và định
kỳ bao gồm MH-mã hóa đường dây để giảm thiểu ảnh hưởng của lỗi
MMR-Modified Modified READ coding: : Các thuật toán quy định tại Khuyến nghị
CCITT T.6 [2], Thuật toán này dựa trên các thuật toán MR bao gồm sửa đổi để tối đa hóa
nén bằng cách loại bỏ các cơ chế phòng chống lỗi MR.
JBIG-Joint Bilevel Image experts Group coding: Các thuật toán quy định tại Khuyến nghị
CCITT T.82 [3]. Nó được dựa trên một số học thích nghi với codel thích nghi hoàn cảnh
2D.
II.2 Chuẩn nén JBIG
II.2.1 Lịch sử
Năm 1993, Joint Bi-level Image Experts Group (JBIG) đưa ra một chuẩn nén ảnh
bi_level mới (ISO / IEC 11544) được gọi là JBIG và còn được gọi là JBIG1. Tuy nhiên,
chuẩn nén này , tuy tốt hơn các chuẩn G4, nhưng đã không được phần lớn áp dụng, vì
không có định dạng dùng chung cho phép các công việc thực tế với chuẩn này.
Ngày nay, người ta cho rằng một chương trình nén JBIG2 cải tiến sẽ được áp dụng như
một tiêu chuẩn quốc tế (ISO 2000). Đề án JBIG2 sẽ cho phép nén thông minh và thậm
chí mất dữ liệu nén ít hơn nữa của các ảnh bi-level.
II.2.2 Thuật toán
JBIG 1
JBIG1 là một chuẩn nén không mất dữ liệu.
JBIG1 phục vụ cho việc nén ảnh nhị phân, đặc biệt cho chuyển FAX, cũng có thể
sử dụng nó cho các loại ảnh khác.
JBIG1 được đưa ra bởi IBM và thường gọi là Q-coder.
JBIG1 hỗ trợ truyền thông với chi phí nhỏ.
Có quá nhiều tổ chức cùng đưa ra chuẩn JBIG cho riêng họ như : IBM ,AT&T ,
Misubishi và một vài tổ chức khác. Do vậy cản trở sự phát triển của nó .
à Cần thiết đưa ra 1 chuẩn duy nhất cho JBIG 1
Nhưng bằng sáng chế cuối cùng của JBIG 1 được biết hiện nay thì không còn hiệu lực
ngày 12/02/2011.
JBIG 2
Đầu tiên hiệp hội tiêu chuẩn quốc tế đưa ra chuẩn cho JBIG2 là :
Lossy Compression of bi-level images + Better lossless compression performance
Hiện nay thì chuẩn đang sử dụng phổ biến là lossless.
kỹ thuật kết hợp các mẫu với ký tự
Trong các ảnh văn bản, character-based pattern-matching techniques (kỹ thuật kết hợp
các mẫu với ký tự) được sử dụng.
Mã hóa bitmap của các ký tự lúc xuất hiện đầu tiên của nó và đặt nó vào một “từ
điển", thay vì mã hóa tất cả các điểm ảnh mỗi khi ký tự lại xuất hiện trên một
trang.
Các bitmap còn gọi là: ‘mark’ or ‘pixel block’.
Các phương thức sử dụng trong JBIG
Pattern Matching and Substitution (PM & S)
Soft Pattern Matching (Soft PM)
Các phương pháp mã hóa khác nhau cơ bản ở việc mã hóa các “pixel block”
Với mỗi ký tự thì ta mã hóa như sau :
Pointer: trỏ tới nơi mà các bitmap suất hiện trong từ điển
Position : chỉ ra vị trí của từ đó trên văn bản.
Nếu không suất hiện trong từ điển thì mã hóa các “pixel –block ” đó và đưa thêm chúng
vào trong từ điển.
II.2 Phương thức PM & S
Sơ đồ thuật toán:
Các bước thực hiện trong thuật toán PM&S
(i) Phân đoạn ảnh
(ii) So sánh với các mẫu trong từ điển
(iii) Mã hóa vị trí các mẫu dữ liệu trong từ điển
(iv) Mã hóa vị trí các bitmap trên ảnh
Bước 1. Phân đoạn ảnh
Một ảnh được chia nhỏ thành các ‘marks’ hay ‘pixel-blocks’
- Các thành phần pixel mầu đen được coi là đặc trưng của một ‘mark’ hay ‘pixel-
block’.
- Các đặc trưng (ví dụ: chiều cao, độ rộng, diện tích, vị trí) của mỗi pixel-block sau
đó được tách ra.
Bước 2. So sánh các mẫu trong từ điển
Tìm kiếm các pixel-block đã được mã hóa trong từ điển với khối pixel-block hiện tại thực
hiện theo các bước:
1. Lọc với các đặc trưng phù hợp cho “pixel-block”
Bỏ qua nó nếu tính năng như chiều rộng, chiều cao của nó, diện tích của
hộp biên của nó, hoặc số lượng các điểm ảnh đen không phải là phù hợp với các
pixel-block hiện hành.
2. Tính toán số điểm phù hợp
Là phù hợp nhất nếu số điểm của nó là phù hợp nhất so với bất kỳ đặc
trưng nào với khối pixel khác được thử nghiệm cho đến hiện tại.
Bước 3: Mã hóa vị trí các mẫu có trong từ điển
Nếu tìm thấy sự phù hợp giữa các pixel-block hiện tại với các pixel-block trong từ
điển thì các đặc trưng của dữ liệu (chỉ mục trong từ điển, vị trí) được mã hóa bằng
Huffman cơ bản hoặc thuật toán khác.
Bước 4: Mã hóa vị trí các bitmap trên ảnh
(a) Mã hóa của 1 “mark ” không phù hợp
Bitmap hiện tại của 1 pixel-block được mã hóa bằng MMR- hoặc JBIG1 căn bản.
(b) Mã hóa của 1 “mark” phù hợp:
Bitmap hiện tại được thay thế bằng mã đã có trong từ điển
II.2. Phương thức Soft PM
Phương thức Soft PM cũng tương tự như phương thức nén PM&Sub mất dữ liệu.
Sự khác biệt là lossy thay thế trực tiếp các ký tự xuât hiện,còn mã hóa lossless sử dụng
các ký tự xuất hiện trong bản mã.
Kết quả mã các “pixel-block” có thể trùng với các pixel gốc.
Sơ đồ:
Các bước thực hiện với Soft PM
Bước đầu giống như PM&S
Sau đó, mã hóa lossless với các bitmap của pixel-block hiện tại như sau:
(i) Đặt trung tâm của “pixel-block ” hiện tại cho phù hợp với trung tâm của “pixel-
block ” trong từ điển để so sánh.
(ii) Mã hóa tất cả các pixel cùng biên của khối hiện hành.
Cách làm tăng tỷ lệ nén bằng cách sử dụng lossy mở rộng
Lượng tử hóa
Loại bỏ các mark nhỏ
Loại bỏ nhiễu và làm mịn
Đảo bit với ‘mark’ không phù hợp