Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (403.59 KB, 5 trang )
Trích nội dung văn bản từ hình ảnh với dịch vụ
miễn phí
Đôi khi bạn nhận được một file ảnh có chứa đoạn nội dung văn bản cần sử dụng.
Cách thức thường dùng nhất đó là… gõ lại đoạn nội dung cần trích xuất. Việc này
mất khá nhiều thời gian và công sức. Trong trường hợp này, hãy thử nhờ đến
Free OCR.
Chắc hẳn không ít lần bạn tìm thấy hoặc nhận được những file ảnh chụp lại nội dung
của một trang web hoặc file ảnh scan từ một quyển sách… có chứa những nội dung
quan trọng hoặc cần thiết cần sử dụng.
Có rất nhiều phần mềm khác nhau có chức năng cho phép trích xuất nội dung văn bản
chứa trong hình ảnh. Tuy nhiên, các phần mềm có chức năng trên mà hỗ trợ tiếng Việt
không phải là nhiều, thậm chí có thể nói là rất hiếm.
Free OCR
là dịch vụ trực tuyến hoàn toàn miễn phí, cho phép nhận dạng và trích xuất đoạn văn
bản có chứa trong một hình ảnh bất kỳ, để sau đó bạn có thể dễ dàng sử dụng hoặc
chỉnh sửa nội dung của đoạn văn bản vừa trích xuất được.
Free OCR hỗ trợ các định dạng ảnh thông dụng JPG, GIF, TIFF, BMP. Mỗi file có dung
lượng tối đa 2MB, và hỗ trợ nhiều ngôn ngữ, trong đó có cả tiếng Việt.
Hạn chế duy nhất của dịch vụ này đó là bạn chỉ được phép sử dụng dịch vụ 10 lần
trong 1 tiếng.
Đặc biệt, ngoài định dạng hình ảnh, Free OCR còn hỗ trợ trích xuất nội dung từ file
PDF, điều này đồng nghĩa với với bạn có thể chuyển đổi và trích xuất nội dung từ file
PDF để sử dụng và chỉnh sửa.
Bạn truy cập vào địa chỉ để sử dụng dịch vụ này.
Sau khi truy cập vào trang web, tại mục ‘Upload image for OCR’ nhấn nút Browser, tìm
đến file ảnh (hoặc file PDF) cần trích xuất nội dung. Tại mục Language, bạn chọn ngôn
ngữ của đoạn nội dung cần trích xuất từ hình ảnh (hoặc file PDF).
Trong trường hợp đó là tiếng Việt, bạn chọn Vietnamese.