Tải bản đầy đủ (.pdf) (6 trang)

Tutorials Vbook v0.1-Thủ Thuật UDS part 2 pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (168.83 KB, 6 trang )

AS @ 1,2,3,4,5 –AS là viết tắt của Advanced Simple.Ở profile này,XviD sẽ unlock
hầu như toàn bộ các công cụ mp4 của nó(ngọai trừ tùy chọn reduced resolution),và
người dùng có thể tác động sâu tới quá trình nén.Các công cụ ở đây bao gồmb B-
frame config,Qpel,GMC và đặc biệt cho phép lựa chọn quantization type.AS đạt
tới độ phân giải 720x576x30(frame) ở bitrate cao 8 mbit/s(so sánh với bitrate tối đa
cho DVD chuẩn là 9,8 mbit/s)

DXN-profile này được cho là tương đương với các cấp độ của DivX Certified-là
profile chuẩn để chắc chắn rằng file xuất ra sẽ tương thích với các thiết bị phát
hình hỗ trợ giải mp4(ví dụ như đầu DVD mpeg-4,máy chơi mp4 cầm tay,điện thoại
di động hỗ trợ mpeg-4…)

Unrestricted – đúng như tên gọi-profile này không có bất kỳ 1 giới hạn nào cả.Và
những file được convert ở profile này không được đảm bảo là sẽ tương thích với
các thiết bị chơi mp4 chuyên dụng.

Tóm lại,khi chọn profile bạn nên nhớ rằng:mức profile càng cao,càng sử dụng
được nhiều công cụ hơn,chất lượng thu được càng tốt,độ tương thích với thiết bị
chuyên dụng càng kém.Cho nhu cầu nén phim DVD ra đĩa CD,tôi khuyên bạn nên
chọn AS @ L5 cho nhu cầu nén film hàng ngày.

Profile
Chọn more… cửa sổ chi tiết về profile hiện ra.



Quantization type,chọn H.263 nếu bạn có ý định nén một bộ phim có độ dài trung
bình vào 1 CD 700 MB (có nghĩa là H.263 nếu bitrate cho file video xuất ra nhỏ
hơn 1000 kbit/s),chọn MPEG nếu muốn xuất ra hai CD(đối với tôi là khoảng trên
1500 kbit/s).MPEG-Custom sẽ cho phép bạn tạo riêng ma trận quantilization cho
video của mình,hoặc bạn cũng có thể sử dụng các ma trận được soạn sẵn cho từng


trường hợp-các ma trận loại này có thể download tại các forum XviD như
- XviD forum.Một ma trận thích hợp có
thể cải thiện chất lượng file xuất ra tới hàng chục phần trăm so với ma trận mặc
định.

Adaptive quantization(còn được biết đến như là lumi-masking)-bình thường,có
những phần thông tin mà mắt người thường hay để ý hơn,đó là do tâm lý chú ý về
một số điểm nhất định trong khung hình của con người và những phần đó sẽ cần
phải có chất lượng đủ tốt để đáp ứng sự chú ý đó.Ví dụ như trong một cảnh quay
có những khu vực nhất định rất tối,thường thì lúc đó,phần tối sẽ được mắt người
nhìn nhận là màu đen tương đối(trong khi thực tế ở đó vẫn đầy đủ chi tiết) và vì
mắt người quy cho phần đó là màu đen nên thực sự không cần thiết phải xử lý và
lưu lại những chi tiết đó mà đơn giản chỉ cần tiết kiệm được bitrate cho phần
đó.XviD cógán cho cả khu vực đó một màu tối khả năng sử dụng những
quantizer khác nhau cho mỗi macroblock-hay dễ hiểu hơn là 16x16 block (tính
năng mà DivX không có).Khi gặp những phần quá tối hoặc quá sáng,adaptive
quantization(lumi-masking) sẽ nén những phần đó với tỷ lệ nén cao hơn các phần
có màu bình thường mà mắt người dễ nhận biết hơn.Và bởi vì có những chi tiết đã
được nén mạnh nên một số lượng bitrate sẽ được tiết kiệm và dành cho các phần
hình ảnh khác,do đó chất lượng video thu được ở những phần mà người xem hay
chú ý là cao hơn.
Mặc dù vậy,đôi khi những phần mất chi tiết đó sẽ làm cho việc theo dõi hình ảnh
trở nên khó khăn(khó chịu?!) hơn và làm mất đi những chi tiết quan trọng(không
phải phần hình ảnh quá tối hay quá sáng nào cũng là “đồ bỏ”).Vì vậy tùy chọn này
là không nên đối với những video có bitrate cao(khoảng trên 1500 kbit/s).

Interlaced Encoding Nếu file video xuất ra được chọn là dạng interlace thì check
vào ô này sẽ cải thiện hiệu năng trong quá trình encode.

Quarter pixel(qpel) được biết đến là như là “quarter pixel motion estimation”-một

nâng cấp của “motion estimation”.Tính năng này giúp đánh giá chuyển động chính
xác hơn(trên ¼ pixel thay vì 1 pixel)và đặc biệt có tác dụng với hình ảnh ở độ phân
giải thấp.Chỉ một số thiết bị chơi mp4 có hỗ trợ qpel.

Global Motion Compensation(GMC)-giúp cho hình ảnh thể hiện tốt hơn khi tạm
dừng và quan sát gần cũng như có khả năng cải thiện chất lượng hình ảnh nếu tỷ lệ
khung hình được định dạng kích cỡ quá chênh lệch so với tỉ lệ khung hình gốc.Có
vẻ như tính năng này rất ít khi được sử dụng(ngay cả tôi cũng vậy).Hiện tại tôi
chưa biết loại thiết bị nào có thể chơi được mp4 sử dụng GMC,một khi bạn đã
check vào nó,hãy tin tôi đi,hầu như chắc chắn bạn sẽ encode ra một file mp4 không
thể chạy được ở bất kỳ thiết bị nào ngoài chính chiếc PC của mình.

Reduced resolution-giảm độ phân giải của hình ảnh thu được so với độ phân giải
gốc,chỉ hoạt động khi cần capture thời gian thực những chương trình truyền hình
trực tuyến.Loại nguồn này được gọi là streaming,những treaming nổi tiếng và phổ
biến nhất có thể kể ra là WMA của M$,realvideo của RealNetworks,Quicktime của
Apple.
(tính năng này chỉ xuất hiện ở XviD 1.0.3,khi tôi dùng bản 1.1 beta 2 thì không có)


Trước khi tiếp tục phần tiếp theo,hãy để tôi giải thích một chút với các bạn về khái
niệm các loại frame.
Một chuỗi các hình ảnh tạo thành một đoạn film hoàn chỉnh mà bạn nhìn thấy,mỗi
hình ảnh đó gọi là một khung hình(frame).Trong điện ảnh,người ta thường coi 24
khung hình/giây(frame/sec) là đủ để mắt người có thể cảm nhận chuyển động
giống như nó xảy ra liên tục.
Đối với video kỹ thuật số,đặc biệt là mpeg-4,các frame không phải là bình đẳng
như nhau,chúng được xử lý với những cách thức khác nhau và được phân làm 3
loại:


- I frame-ỉntra frame-hay ỉntra picture:là những frame hoàn chỉnh theo đúng
nghĩa(có nghĩa là nếu tách riêng I frame ra ta sẽ được một bức ảnh hoàn
chỉnh).Nó còn được gọi là Key Frame.

- P-frame-predictively coded frame-là những frame chỉ lưu những thông tin khác
nhau từ những frame trước.Mỗi P-frame sẽ tham khảo dữ liệu hình ảnh từ feame
trước nó và chỉ định cho B-frame và P-frame sau nó trong một nhóm frame(GOP-
Group of pictures).Mỗi macroblock(16x16 block)của P-frame có thể được encode
độc lập hay được bổ xung từ frame đến trước nó.

- B-frame- Bi-Directionally Predictively Coded Frame-cũng như P-frame,không
phải là một frame hoàn chỉnh,nó chỉ mang thông tin khác biệt giữa nó và 2 frame
đứng cạnh nó(trước và sau).B-frame cũng được dự đoán(predict) bới 2 frame
này.Bởi vì có sự liên kết,tham khảo với cả 2 frame trước và sau nên tên của loại
frame này là "Bidirectional-frame" hay frame 2 chiều.

Cách hoạt động:đầu tiên ta có một nhóm picture(GOP-Group of pictures),ở đầu
mỗi nhóm này là một I-frame lưu đầy đủ giữ liệu của một hình ảnh.Các P-frame và
B-frame đứng sau I-frame này và lưu các giữ liệu thể hiện sự khác nhau giữa các
frame đứng trước hay sau chúng,mặt khác chúng cũng liên kết với I-frame trong
nhóm để tìm thông tin cần thiết.

Ví dụ:ta có 1 GOP như sau:IBBPBBBPBBBPBBP,trong GOP này,I sẽ là frame
đứng đầu nhóm và P sẽ là frame kết thúc nhóm,sau P chắc chắn sẽ là một I-frame
để bắt đầu GOP tiếp theo.Cụ thể hơn,nếu ta có một đoạn film quay cảnh một chiếc
xe hơi đang di chuyển từ phải qua trái,đầu tiên,I-frame sẽ lưu lại đầy đủ hình ảnh
của chiếc xe khi nó ở bên phải,sau đó,các B hay P frame thay vì tiếp tục lưu những
hình ảnh hoàn chỉnh của chiếc xe sẽ chỉ nhận ra những điểm khác ở thời điểm xảy
ra frame đó với I-frame đầu nhóm,rốt cuộc hình ảnh chiếc xe khi nó ở bên trái màn
hình thực chất ra không phải là một hình ảnh theo đúng nghĩa,frame ở vị trí đó sẽ

chỉ làm nhiệm vụ là di chuyển chiếc xe từ phía bên phải qua bằng cách chỉ ra tọa
độ để đặt chiếc xe vào đó(trên thực tế mọi việc diễn ra phúc tạp hơn)

Với cách phân chia như vậy,I-frame là frame có dung lượng lớn nhất(thường là
gấp hơn 5 lần so với B-frame với các setting và matrix tôi hay sử dụng),P-frame có
dung lượng lớn hơn B-frame nhưng đa số vẫn nhỏ hơn so với I-frame.Trong một
file mpeg,số lượng I-frame là ít nhất,chúng đóng vai trò là hình ảnh đầu tiên mỗi
khi chuyển cảnh,nhiều hơn là P-frame và nhiều nhất là b-frame.Khi kéo thanh
trượt trên chương trình playback mpeg,những hình ảnh mà chúng ta có thể truy
cập tới chính là những I-frame,đó cũng là một lý do loại frame này được gọi là key
frame.
B-VOPs-là tùy chọn dành cho những người đã đọc qua phần trên

Max consecutive BVOPs:số B-frame giới hạn được phép đứng liền nhau.Như tôi đã
trình bày ở trên,càng nhiều B-frame có nghĩa là video càng thể hiện đại khái(bởi nó
không lưu những hình ảnh hoàn chỉnh và cũng không đóng vai trò liên kết,tiên
đoán như P-frame).Nhưng điểm mạnh của B-frame là kích thước rất nhỏ,do đó
dung lượng file nén sẽ nhỏ và thời gian sẽ không lâu như khi dùng nhiều I-frame
hơn.Để tham khảo thêm,bạn nên biết DivX codec chỉ đặt hệ số này là 1.Và bạn
không nên đặt quá 3 nếu không muốn thu được 1 kết quả tồi.Cá nhân tôi thường
đặt 3 khi encode VCD và đặt 2 với DVD.

Quantizer ratio chỉ định độ nén của B-frame là hơn bao nhiêu so với P-frame(đơn
vị tính theo quantizer),bình thường hệ số này là 1,5.
Quantizer offset là một hệ sô được bù thêm vào mỗi quantizer.
Lấy một ví dụ để bạn hiểu rõ hơn về hai hệ số này:có hai B-frame,một p-frame
đứng giữa hai b-frame này.P-frame có quantizer là 2,vậy khi ta set ratio và offset là
1,các B-frame kể trên sẽ mang quantizer là 3.
Packet bitstream sẽ nhóm các B và P-frame cạnh nhau vào một bitstream.Ví
dụ:[i][PB][b][trống][PB][b][trống][P].Dạng đóng gói như thế này sẽ cho phép

encoding không bị trì hoãn.
Closed GOV (trong hình mà tôi dùng để minh họa không có tùy chọn này,nếu
phiên bản của bạn dùng có closed GOV,nó sẽ hiện cùng dòng với packet
bitstream.Closed GOV sẽ tạo ra những closed GOP-là GOV có frame cuối cùng là
P-frame.Điều này đồng nghĩa với việc trước mỗi I-frame sẽ là một P-frame.Tác
dụng của closed GOP là sẽ tạo ra những file mpeg có thể chỉnh sửa được(trái
ngược với một fiel mpeg dùng open GOP sẽ không thể chỉnh sửa được).

Level

Ta chuyển qua Tab level,ở đây không có gì để bạn chỉnh sửa ngoài việc chọn
level(công việc mà chúng ta đã làm ngay từ đầu).Đây có thể coi là phần tham khảo
thêm để bạn thực sự hiểu rõ mỗi profile @ level sẽ tương ứng với những “cấu
hình” nào cho file tạo thành.


×