Tải bản đầy đủ (.pdf) (15 trang)

Cách thiết lập thông số cho XviD 1.1x

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (915.59 KB, 15 trang )

Cách thiết lập thông số cho XviD 1.1x






Bài viết này được thực hiện với XviD 1.1.0 beta 2 và VirtualDub 1.6.11(build
23774).Bạn có thể thay VirtualDub bằng bất cứ chương trình “convert video to mp4”
nào cho phép chọn codec (nhưng tôi khuyên bạn nên dùng VirtualDub hay
VirtualDubMod để có thể tự do chỉnh sửa).

Muốn dùng codec cho VirtualDub,trên thanh công cụ của VirtualDub chọn video.
Chọn một trong 3 mức compress:
-Fast recompress
-Normal recompress
-Full processing mode
(không chọn Direct stream copy)

Chọn Compression(Ctrl+P)
Chọn XviD mpeg4 codec





Click vào configure ở bên phải

Cửa sổ XviD Configuration hiện ra với rất nhiều tùy chọn.Có thể nói,XviD là codec
cho phép tinh chỉnh rất nhiều tới phương thức làm việc với hình ảnh.Nếu bạn mới
dùng codec này có thể sẽ thấy hơi hoang mang không bỉết nên làm như thế


nào,nhưng nếu đã sử dụng quen bạn sẽ thấy những tinh chỉnh đó thật tuyệt vời.Bây
giờ ta sẽ xem xét cụ thể

Profile @ Level
Đây là phần tùy chọn profile khác nhau dùng để compress.Mỗi profile lại có các
level khác nhau(@ có nghĩa là at),cơ bản là level cao sẽ ít bị giới hạn chức năng hơn
so với level thấp hơn nó ở cùng profile.Tuy nhiên cần lưu ý là càng nhiều tính năng
được sử dụng sẽ càng làm giảm sự tương thích của file video xuất ra với những thiết
bị hỗ trợ mp4(ví dụ như đầu đĩa DVD tích hợp giải mã mp4 XviD)

Simple @ level 0,1,2,3 là những profile bị giới hạn hầu như toàn bộ mọi tính
năng,hỗ trợ bitrate tối đa là 384kbit/s và độ phân giải tối đa chiều ngang là
352(chiều dọc sẽ tương ứng theo tỷ lệ khung hình).Như vậy,chất lượng thu được sẽ
là thấp,nhưng độ tương thích rất cao-profile này thích hợp để tạo ra những movie
dùng trên các thiết bị cầm tay hay tương tự.
ARTS @ 1,2,3,4 –ARTS là viết tắt của Advanced Real Time Streaming.So với simple
profile thì không có thêm tính năng nào (ngọai trừ tùy chọn reduced resolution).Cũng
giới hạn chiều ngang khung hình là 352 nhưng bitrate tối đa có thể đạt được lên tới 2
mbit/s.

AS @ 1,2,3,4,5 –AS là viết tắt
của Advanced Simple.Ở profile
này,XviD sẽ unlock hầu như toàn
bộ các công cụ mp4 của nó(ngọai
trừ tùy chọn reduced
resolution),và người dùng có thể
tác động sâu tới quá trình
nén.Các công cụ ở đây bao gồmb
B-frame config,Qpel,GMC và đặc
biệt cho phép lựa chọn

quantization type.AS đạt tới độ
phân giải 720x576x30(frame) ở
bitrate cao 8 mbit/s(so sánh với
bitrate tối đa cho DVD chuẩn là
9,8 mbit/s)

DXN-profile này được cho là
tương đương với các cấp độ của
DivX Certified-là profile chuẩn để
chắc chắn rằng file xuất ra sẽ
tương thích với các thiết bị phát
hình hỗ trợ giải mp4(ví dụ như
đầu DVD mpeg-4,máy chơi mp4
cầm tay,điện thoại di động hỗ trợ
mpeg-4…)

Unrestricted – đúng như tên gọi-
profile này không có bất kỳ 1 giới
hạn nào cả.Và những file được convert ở profile này không được đảm bảo là sẽ tương
thích với các thiết bị chơi mp4 chuyên dụng.

Tóm lại,khi chọn profile bạn nên nhớ rằng:mức profile càng cao,càng sử dụng được
nhiều công cụ hơn,chất lượng thu được càng tốt,độ tương thích với thiết bị chuyên
dụng càng kém.Cho nhu cầu nén phim DVD ra đĩa CD,tôi khuyên bạn nên chọn AS @
L5 cho nhu cầu nén film hàng ngày.

Profile
Chọn more… cửa sổ chi tiết về profile hiện ra.

Quantization type,chọn H.263 nếu bạn có ý định nén một bộ phim có độ dài trung

bình vào 1 CD 700 MB (có nghĩa là H.263 nếu bitrate cho file video xuất ra nhỏ hơn
1000 kbit/s),chọn MPEG nếu muốn xuất ra hai CD(đối với tôi là khoảng trên 1500
kbit/s).MPEG-Custom sẽ cho phép bạn tạo riêng ma trận quantilization cho video của
mình,hoặc bạn cũng có thể sử dụng các ma trận được soạn sẵn cho từng trường hợp-
các ma trận loại này có thể download tại các forum XviD như
,XviD forum.Một ma trận thích hợp có thể cải thiện chất
lượng file xuất ra tới hàng chục phần trăm so với ma trận mặc định.

Adaptive quantization(còn được biết đến như là lumi-masking)-bình thường,có
những phần thông tin mà mắt
người thường hay để ý hơn,đó là
do tâm lý chú ý về một số điểm
nhất định trong khung hình của
con người và những phần đó sẽ
cần phải có chất lượng đủ tốt để
đáp ứng sự chú ý đó.Ví dụ như
trong một cảnh quay có những
khu vực nhất định rất tối,thường
thì lúc đó,phần tối sẽ được mắt
người nhìn nhận là màu đen
tương đối(trong khi thực tế ở đó
vẫn đầy đủ chi tiết) và vì mắt
người quy cho phần đó là màu
đen nên thực sự không cần thiết
phải xử lý và lưu lại những chi tiết
đó mà đơn giản chỉ cần gán cho
cả khu vực đó một màu tối Î tiết
kiệm được bitrate cho phần
đó.XviD có khả năng sử dụng
những

qua
ntizer
khác nhau cho
mỗi macroblock-hay dễ hiểu hơn
là 16x16 block (tính năng mà
DivX không có).Khi gặp những
phần quá tối hoặc quá
sáng,adaptive quantization(lumi-masking) sẽ nén những phần đó với tỷ lệ nén cao
hơn các phần có màu bình thường mà mắt người dễ nhận biết hơn.Và bởi vì có những
chi tiết đã được nén mạnh nên một số lượng bitrate sẽ được tiết kiệm và dành cho
các phần hình ảnh khác,do đó chất lượng video thu được ở những phần mà người
xem hay chú ý là cao hơn.
Mặc dù vậy,đôi khi những phần mất chi tiết đó sẽ làm cho việc theo dõi hình ảnh trở
nên khó khăn(khó chịu?!) hơn và làm mất đi những chi tiết quan trọng(không phải
phần hình ảnh quá tối hay quá sáng nào cũng là “đồ bỏ”).Vì vậy tùy chọn này là
không nên đối với những video có bitrate cao(khoảng trên 1500 kbit/s).

Interlaced Encoding Nếu file video xuất ra được chọn là dạng interlace thì check vào
ô này sẽ cải thiện hiệu năng trong quá trình encode.

Quarter pixel(qpel) được biết đến là như là “quarter pixel motion estimation”-một
nâng cấp của “motion estimation”.Tính năng này giúp đánh giá chuyển động chính
xác hơn(trên ¼ pixel thay vì 1 pixel)và đặc biệt có tác dụng với hình ảnh ở độ phân
giải thấp.Chỉ một số thiết bị chơi mp4 có hỗ trợ qpel.

Global Motion Compensation(GMC)-giúp cho hình ảnh thể hiện tốt hơn khi tạm
dừng và quan sát gần cũng như có khả năng cải thiện chất lượng hình ảnh nếu tỷ lệ
khung hình được định dạng kích cỡ quá chênh lệch so với tỉ lệ khung hình gốc.Có vẻ
như tính năng này rất ít khi được sử dụng(ngay cả tôi cũng vậy).Hiện tại tôi chưa
biết loại thiết bị nào có thể chơi được mp4 sử dụng GMC,một khi bạn đã check vào

nó,hãy tin tôi đi,hầu như chắc chắn bạn sẽ encode ra một file mp4 không thể chạy
được ở bất kỳ thiết bị nào ngoài chính chiếc PC của mình.

Reduced resolution-giảm độ phân giải của hình ảnh thu được so với độ phân giải
gốc,chỉ hoạt động khi cần capture thời gian thực những chương trình truyền hình trực
tuyến.Loại nguồn này được gọi là streaming,những treaming nổi tiếng và phổ biến
nhất có thể kể ra là WMA của M$,realvideo của RealNetworks,Quicktime của Apple.
(tính năng này chỉ xuất hiện ở XviD 1.0.3,khi tôi dùng bản 1.1 beta 2 thì không có)

Trước khi tiếp tục phần tiếp theo,hãy để tôi giải thích một chút với các bạn về khái
niệm các loại frame.
Một chuỗi các hình ảnh tạo thành một đoạn film hoàn chỉnh mà bạn nhìn thấy,mỗi
hình ảnh đó gọi là một khung hình(frame).Trong điện ảnh,người ta thường coi 24
khung hình/giây(frame/sec) là đủ để mắt người có thể cảm nhận chuyển động giống
như nó xảy ra liên tục.
Đối với video kỹ thuật số,đặc biệt là mpeg-4,các frame không phải là bình đẳng như
nhau,chúng được xử lý với những cách thức khác nhau và được phân làm 3 loại:

- I frame-ỉntra frame-hay ỉntra picture:là những frame hoàn chỉnh theo đúng
nghĩa(có nghĩa là nếu tách riêng I frame ra ta sẽ được một bức ảnh hoàn chỉnh).Nó
còn được gọi là Key Frame.

- P-frame-predictively coded frame-là những frame chỉ lưu những thông tin khác
nhau từ những frame trước.Mỗi P-frame sẽ tham khảo dữ liệu hình ảnh từ frame
trước nó và chỉ định cho B-frame và P-frame sau nó trong một nhóm frame(GOP-
Group of pictures).Mỗi macroblock(16x16 block)của P-frame có thể được encode độc
lập hay được bổ xung từ frame đến trước nó.

- B-frame- Bi-Directionally Predictively Coded Frame-cũng như P-frame,không phải là
một frame hoàn chỉnh,nó chỉ mang thông tin khác biệt giữa nó và 2 frame đứng cạnh

nó(trước và sau).B-frame cũng được dự đoán(predict) bới 2 frame này.Bởi vì có sự
liên kết,tham khảo với cả 2 frame trước và sau nên tên của loại frame này là
"Bidirectional-frame" hay frame 2 chiều.

Cách hoạt động
:đầu tiên ta có một nhóm picture(GOP-Group of pictures),ở đầu mỗi
nhóm này là một I-frame lưu đầy đủ giữ liệu của một hình ảnh.Các P-frame và B-
frame đứng sau I-frame này và lưu các giữ liệu thể hiện sự khác nhau giữa các frame
đứng trước hay sau chúng,mặt khác chúng cũng liên kết với I-frame trong nhóm để
tìm thông tin cần thiết.

Ví dụ:ta có 1 GOP như sau:
IBBPBBBPBBBPBBP,trong GOP này,I sẽ là frame đứng đầu
nhóm và P sẽ là frame kết thúc nhóm,sau P chắc chắn sẽ là một I-frame để bắt đầu
GOP tiếp theo.Cụ thể hơn,nếu ta có một đoạn film quay cảnh một chiếc xe hơi đang
di chuyển từ phải qua trái,đầu tiên,I-frame sẽ lưu lại đầy đủ hình ảnh của chiếc xe
khi nó ở bên phải,sau đó,các B hay P frame thay vì tiếp tục lưu những hình ảnh hoàn
chỉnh của chiếc xe sẽ chỉ nhận ra những điểm khác ở thời điểm xảy ra frame đó với
I-frame đầu nhóm,rốt cuộc hình ảnh chiếc xe khi nó ở bên trái màn hình thực chất ra
không phải là một hình ảnh theo đúng nghĩa,frame ở vị trí đó sẽ chỉ làm nhiệm vụ là
di chuyển chiếc xe từ phía bên phải qua bằng cách chỉ ra tọa độ để đặt chiếc xe vào
đó(trên thực tế mọi việc diễn ra phúc tạp hơn)

Với cách phân chia như vậy,I-frame là frame có dung lượng lớn nhất(thường là gấp
hơn 5 lần so với B-frame với các setting và matrix tôi hay sử dụng),P-frame có dung
lượng lớn hơn B-frame nhưng đa số vẫn nhỏ hơn so với I-frame.Trong một file
mpeg,số lượng I-frame là ít nhất,chúng đóng vai trò là hình ảnh đầu tiên mỗi khi
chuyển cảnh,nhiều hơn là P-frame và nhiều nhất là b-frame.Khi kéo thanh trượt trên
chương trình playback mpeg,những hình ảnh mà chúng ta có thể truy cập tới chính là
những I-frame,đó cũng là một lý do loại frame này được gọi là key frame.


B-VOPs-là tùy chọn dành cho những người đã đọc qua phần trên

Max consecutive BVOPs:số B-frame giới hạn được phép đứng liền nhau.Như tôi đã
trình bày ở trên,càng nhiều B-frame có nghĩa là video càng thể hiện đại khái(bởi nó
không lưu những hình ảnh hoàn chỉnh và cũng không đóng vai trò liên kết,tiên đoán
như P-frame).Nhưng điểm mạnh của B-frame là kích thước rất nhỏ,do đó dung lượng
file nén sẽ nhỏ và thời gian sẽ không lâu như khi dùng nhiều I-frame hơn.Để tham
khảo thêm,bạn nên biết DivX codec chỉ đặt hệ số này là 1.Và bạn không nên đặt quá
3 nếu không muốn thu được 1 kết quả tồi.Cá nhân tôi thường đặt 3 khi encode VCD
và đặt 2 với DVD.

Quantizer ratio chỉ định độ nén của B-frame là hơn bao nhiêu so với P-frame(đơn vị
tính theo quantizer),bình thường hệ số này là 1,5.
Quantizer offset là một hệ sô được bù thêm vào mỗi quantizer.
Lấy một ví dụ để bạn hiểu rõ hơn về hai hệ số này:có hai B-frame,một p-frame đứng
giữa hai b-frame này.P-frame có quantizer là 2,vậy khi ta set ratio và offset là 1,các
B-frame kể trên sẽ mang quantizer là 3.
Packet bitstream sẽ nhóm các B và P-frame cạnh nhau vào một bitstream.Ví
dụ:[I][PB][B][trống][PB][B][trống][P].Dạng đóng gói như thế này sẽ cho phép
encoding không bị trì hoãn.
Closed GOV (trong hình mà tôi dùng để
minh họa không có tùy chọn này,nếu
phiên bản của bạn dùng có closed GOV,nó
sẽ hiện cùng dòng với packet
bitstream.Closed GOV sẽ tạo ra những
closed GOP-là GOV có frame cuối cùng là
P-frame.Điều này đồng nghĩa với việc
trước mỗi I-frame sẽ là một P-frame.Tác
dụng của closed GOP là sẽ tạo ra những

file mpeg có thể chỉnh sửa được(trái
ngược với một fiel mpeg dùng open GOP
sẽ không thể chỉnh sửa được).

Level

Ta chuyển qua Tab level,ở đây không có
gì để bạn chỉnh sửa ngoài việc chọn
level(công việc mà chúng ta đã làm ngay
từ đầu).Đây có thể coi là phần tham khảo
thêm để bạn thực sự hiểu rõ mỗi profile @
level sẽ tương ứng với những “cấu hình”
nào cho file tạo thành.





Aspect Ratio(AR)

Pixel AR :
XviD theo mặc định sẽ giữ tỉ lệ pixel là 1:1(ngang x dọc) để đảm bảo tương
thích.Điều đó có nghĩa là pixel mặc định của XviD sẽ là hình vuông.Ta cũng có thể
chỉnh pixel AR tương ứng với tỷ lệ của
file gốc.

Display AR :có thể hiểu đây là tỷ lệ
khung hình,hay tỉ lệ giữa chiều dài và
chiều rộng.
Ở một số codec,chiều dài phải chia hết

cho một số nhất định nào đó,chiều rộng
cũng vậy,ví dụ như trong DivX6,chiều
dài phải chia hết cho 4-chiều rộng phải
chia hết cho 2,ở 3ivx chiều dài và chiều
rộng phải chia hết cho 2.Chiều dài x
chiều rộng của XviD encode không bị
giới hạn bởi bất kỳ điều kiện nào
cả.Nhưng một lời khuyên chung cho
mp4 là bạn nên để chiều dài và chiều
rộng chia hết cho 16 để chắc chắn quá
trình giải mã không gặp vấn đề rắc
rối(có thể dẫn tới không thể giải mã nổi
file).Nếu không hài lòng với việc chọn
Pixel AR,bạn có thể sử dụng tùy chọn
này.Nhưng hãy nhớ chỉ chọn tỉ lệ khi
bạn hiểu rõ khung hình mình thu được
trông sẽ ra sao.Trong quá trình encode
mp4 của mình,tôi thường đặt phần AR này ở cấu hình mặc định và kết quả thu được
là rất tốt mà không cần bận tâm gì cả.
Nhấn OK để quay trở ra màn hình chính,bây giờ là lúc xem xét hình thức encode.


Encoding Type

Bạn cần quyết định mình sẽ chọn loại mã
hóa nào.Sau đây là các trường hợp thường
thấy:

-Bạn có ít thời gian chạy máy tính,máy tính
của bạn không có tốc độ tốt lắm cho việc encode video,bạn chỉ cần những file mp4

có chất lượng tạm chấp nhận được…vậy thì bạn rất thích hợp để chọn Single
pass.Đặc điểm của single pass là bạn chỉ encode một lần,sau đó thu được kết quả
ngay,và chất lượng thu được thì không thể coi là tốt đặc biệt là ở bitrate thấp.

-Bạn có một chiếc máy tính với khả năng xử lý không tồi,bạn đặc biệt yêu thích video
chất lượng cao và sẵn sàng dành nhiều thời gian cho sở thích này,chắc chắn bạn phải
encode Twopass rồi.So với single pass thì loại encode này sẽ lấy đi của bạn khoảng
thời gian gần gấp đôi cho cùng một file encode,chất lượng thu được thì rất tốt vì
ngoài một bước dựng hình(pass 2) ta đã có thêm một bước phân tích(pass 1)

×