Tải bản đầy đủ (.docx) (6 trang)

ĐIỆN tử VIỄN THÔNG phao multimedia khotailieu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (226.07 KB, 6 trang )

Đề số 1 (Lần 2)
Câu 1: (1 điểm) Định nghĩa khái niệm Formant trong xử lý tiếng nói? Nêu 2 ứng dụng thực tế
của xử lý tiếng nói.

Với phổ của tín hiệu tiếng nói, mỗi đỉnh có biên độ lớn nhất xét trong một khoảng nào đó
(cực đại cục bộ) tương ứng với một formant. Ngoài tần số, các formant còn được xác định
bởi biên độ và dải thông của chúng. Về mặt vật lý các formant tương ứng với các tần số cộng
hưởng của tuyến âm
Tần số formant biến đổi trong một khoảng rộng phụ thuộc vào giới tính của người nói và phụ
thuộc vào các dạng âm vị tương ứng với formant đó
Bảo mật: nhận dạng giọng nói, đặt mã bảo vệ bằng giọng nói.
Truyền thông: đơn giản như nghiên cứu việc số hoá tín hiệu tiếng nói theo một phương thức
nào đó, nhằm mang lại hiệu quả quả cao nhất trong việc truyền dẫn và lưu trữ tín hiệu,
hay phức tạp hơn là ra lệnh bằng giọng nói cho các thiết bị di động để có thể gửi tin nhắn,
thực hiệc cuộc gọi tương tác thời gian thực với người sử dụng (VD: Siri trên iOS,Cortana
trên Window Phone .)
Câu 2: (1 điểm) Vì đâu chúng ta lại sử dụng Signal to Quantization noise Ratio?
Signal to Quantization noise Ratio SQNR- tỉ số tín hiệu trên nhiễu lượng tử đạc trưng cho
chất lượng của quá trình lượng tử hóa hay chất lượng tín hiệu đầu ra của bộ chuyển đổi
AD được biểu diễn bằng SQNR
SQNR được sử dụng rộng rãi kiểm tra chất lượng trong các giải thuật phân tích tín hiệu số
vd PCM (điều chế mã xung) nó thể hiên mối liên hệ giữa cường độ tín hiệu tối đa và nhiễu
lượng tử hay quantization error-lỗi lượng tử- Nó được tính bằng độ sai lệch của tín hiệu
thực so với mức tín hiệu lượng tử hoá.
Câu 3: (1 điểm) Quantization là một kỹ thuật lossless hay lossy? Tại sao?

Quá trình lượng tử hóa (quantization) tín hiệu, về cơ bản là một quá trình xấp xỉ
Hóa . Tín hiệu tương tự(Analog )sau khi được lấy mẫu sẽ được chuyển về một số mức nhất định
Nó có thể được thực hiện dễ dàng bằng cách làm tròn hay cắt gọt. Ví dụ tín hiệu có giá
trị là 8.62 có thể được xấp xỉ hóa thành 8 (nếu lượng tử hóa bằng cách cắt gọt) hay là 9 (nếu
lượng tử hóa bằng cách làm tròn) nên đây là một kĩ thuật lossy


Câu 4: (1 điểm) Dải tần số của tín hiệu mà chúng ta có thể có được khi tần số l ấy
mẫu tín hiệu là 16KHz sẽ là :
A: 8KHz 16KHz
B: 0 32KHz
C: 0 8KHz
D: 16KHz 32KHz

Vì theo Định lý lấy mẫu Nyquist–Shannon : tần số lấy mẫu phải thoả mãn điều kiện fs ≥ 2fm
Trong đó fm là tần số lớn nhất của tín hiệu
Câu 5: (1 điểm) Cho một chuỗi Text như sau:
S=”WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWW
WWWWWWWWWWWB”. Độ dài 53
Tính Compression ratio sau khi sử dụng kỹ thuật Run-Lengh Coding?
Run-Lengh Coding là một kĩ thuật nén dữ liệu đơn giản12W1B12W3B24W1B đ ộ dài 15
Compression ratio=Bo/B1= 53/15 =3.533333
Câu 6: (1 điểm) Cho một chuỗi ký tự như sau:
S=”BBBCAAEEEEDDDDCCCAAAACCBBBBBBBBEEABBBBD”.


Mô tả giải thuật Huffman để nén chuỗi ký tự trên và cho biết mã đầu ra tương ứng cho mỗi ký
tự?
Bảng tần xuất xuất hiện
Kí hiệu
A
B
C
D
E
Số lần xuất hiện


7

15

6

5

6

Huffman

shanon

Câu 7: (1 điểm) Cho hàm f(i)=100 (i=0,..,7). Tính giá trị hàm F(u)? (u=0,...,7) của phép
biến đổi Cosin rời rạc? Vẽ biểu đồ tương ứng cho f(i) và F(u)?

Câu 8: (1 điểm) Việc nén tín hiệu video số nhằm mục đích gì?
A: Giảm dung lượng cho quá trình lưu trữ.
B: Giảm dung lượng cho quá trình truyền dẫn.
C: Cả A) và B).

Câu 9: (0.5 điểm) Trong kỹ thuật Watermarking, kỹ thuật Blind và Non-Blind là gì?
Trong một vài ứng dụng như bảo vệ bản quyền và kiểm tra dữ liệu các giải thuật watermark có
thể dung ảnh gốc để xác định watermark gọi là watermark non- blind -tường minh, (non –
oblivious).Ngược lại các giải thuật trích watermark không thể truy cập vào ảnh gốc được gọi là
watermark không tường minh blind oblivious.
Phân loại các loại Watermarking:
1. Theo khà năng cảm nhận :
Sẽ có các loại : Hữu hình và Vô hình.

-Watermarking Hữu hình (Visible/ Perceptible Watermarking)
Người sử dụng có the nhận thấy sự hiện diện của thông tin mật . Thường dùng nhúng Logo, tên tác giả, địa chỉ
website...
-Watermaking Vô hình (invisible)


Loai này thì thông tin mật được xem như vô hình đối với các cảm quan thị giác, thính giác. Loại này thường
dùng để truyền những thông điệp mật trên các kênh đại chúng. Vidu: Binladen khi cho phát các video của mình
bề ngoài chỉ là những lời phát ngôn khiêu khích, nhưng nhữ người thân cận của ông ta trên khắp thế giới down
video đó từ Youtube về giải mã sẽ ra những mệnh lệnh mật chẳng hạn.
2. Theo khả năng bền vững :
Có 3 loại : Robust Watermaking; Fragile Watermaking; Semi-Fragile Watermarking.
-Robust Watermaking : Watermarking nhúng theo phương pháp này rất khó phá hủy. Việc tấn công các
Watermark trong trường hợp này sẽ làm suy giảm nghiêm trọng chất lượng thông tin. Nói một cách dễ hiểu,
tháo Watermark đồng nghĩa với việc tiêu luôn thông điệp mang. VD: Trong một cái clip có nhúng Robust
Watermarking làm hiện lên thông tin về website gốc hay nhà cung cấp suốt chiều dài clip làm bạn khó chịu,
nhưng khi bạn gỡ các Robust Watermark đó ra thì cái clip của bạn cũng tiêu luôn!
-Fragile Watermaking: Loại này nhằm bảo đảm tính toàn vẹn cho nội dung thông tin. Bất kì sự thay đổi nào dù
nhỏ cũng làm hư Watermark. cái này dùng để kiểm tra chất lượng kênh truyền thông tin, coi có bị ai can thiệp,
hiệu chỉnh thông tin hay ko.
-Semi-Fragile Watermarking:Loại này nói một cách bình dân dễ hiểu nhất là tự phá hủy trong trường hợp bị kẻ
thù tấn công . Vd : Kẻ thù phát hiện điệp viên nước X dấu thông điệp mật trong File ảnh hay Video clip, nhưng
khi tiến hành tấn công để giải mã ko hợp lý thì Watermark chứa bên trong sẽ bị xóa vĩnh viễn và ko thể phục
hồi.
3. Phân loại theo đặc tính rút trích :
Có : Nonblind Watermarking, Semiblind Watermarking, Blind Watermarking. Cái này hơi sâu một tí, có thời
gian mình sẽ nói thêm.
4. Phân loại theo khóa:
Khóa ở đây kiểu hơi giống như Liense code . Có 2 loại Watermarking theo kiểu phân loại này:
-Ko xài khóa : cái này bảo mật bằng một loạt các quy trình mã hóa phức tạp. Nếu biết được trình tự công việc

và làm ngược lại thì có thể giải mã được Watermark.
-Sử dụng khóa: Bạn nào học về kỹ thuật CDMA rồi thì nói ra là hiểu ngay. Bên phát dùng một chuỗi giả ngẫu
nhiên dài ơi là dài để 'xào nấu'. Nó đòi hỏi bên thu phải được cho cái code đó để giải mã. Như vậy trình tự giải
mã có thể giông nhau tuy nhiên mỗi lần giải mã cần phải được bên phát cấp cho code.

Câu 12: (0.5 điểm) Trong lĩnh vực data mining, kỹ thuật Clustering để làm gì?.
Clustering là một kỹ thuật được sử dụng trong datamining- khai thác dữ liệu để đặt các yếu tố
dữ liệu thành các nhóm có liên quan mà không biết trước các thuộc tính nhóm(cụm) , nhóm là
một tập hợp các đối tượng dữ liệu thuộc tính tương tự như nhau và do đó có thể để là một
nhóm. Kỹ thuật phân nhóm phổ biến bao gồm k-means và tối đa hóa kỳ vọng (EM).
Đề số 2 (Lần 2)

Câu 1: (1 điểm) Phương pháp tổng hợp tiếng nói bằng LP là gì?
Tín hiệu tiếng nói là 1 tín hiệu biến đổi theo thới gian,nhưng xét trong một khoảng thời gian
ngắn khoang 20ms thì tín hiệu tiếng nói gần như không thay đổi mô hình tổng hợp lpc được xây
dựng trên điều này.Nó xuất phát từ sự dự đoán tuyến tính,tức là mẫu tín hiệu tiếng nói tại thời
điểm n kí hiệu S(n) sẽ được coi là tổ hợp tuyến tính của p mẫu tín hiệu trong quá khứ. Từ tín
hiệu tiếng nói ban đầu qua khối phân tích để tìm ra các tham số theo mô hình lpc khối tổng
hợp sẽ nhận các tham số này và tổng hợp lại tiếng nói ban đầu
Trong mô hình tổng hợp tiếng nói nguyên lý cơ bản của phương pháp LPC chỉ ra rằng tín hiệu
tiếng nói có thể coi như là kết quả đầu ra của hệ tuyến tính biến đổi theo thời gian được kích
thích bởi các xung tuần hoàn hoặc nhiễu ngẫu nhiên.
Câu 2: (1 điểm) Tại nơi nhận tín hiệu Audio, tại sao thông thường chúng ta phải dùng
lowpass filter?


Trước khi lấy mẫu và chuyển đổi AD, các tín hiệu âm thanh cũng thường được lọc để loại bỏ
tần số không mong muốn. Các tần số giữ phụ thuộc vào ứng dụng:
Cho thoại , điển hình là tần sô từ 50Hz đến 10kHz được giữ lại, và các tần số khác bị chặn
bằng cách sử dụng một bộ lọc thông dải qua đó sàng lọc ra tần số thấp hơn và cao hơn.

Một tín hiệu âm nhạc âm thanh thông thường sẽ có từ khoảng 20Hz đến 20kHz.
Tại bộ chuyển đổi DA, các tần số cao có thể xuất hiện trở lại ở đầu ra - vì lấy mẫu và sau đó
lượng tử hóa, tín hiệu đầu tương tự được thay thế bởi một loạt các mức năng lương có chứa tất
cả các tần số có thể và bản thân trong quá trình truyền dẫn có thể xuất hiện các nhiễu thương là
nhiễu cao tần .
Vì vậy, ở phía bộ giải mã, một bộ lọc thông thấp được sử dụng sau các mạch DA.
Câu 3: (1 điểm) Trong mô hình mã hóa và giải mã tín hiệu thoại, giải thuật and A law được dùng
trong phần mã hóa để làm gì?
giải thuật and A law là một thuật toán nén-giãn tín hiệu tiêu chuẩn được sử dụng trong các hệ

thống viễn thông số của Châu Âu nhằm nhằm tối ưu hóa hệ thống, ví dụ như giảm dải động của
một tín hiệu tương tự để lượng tử hóa và mã hóa nhị phân tín hiệu đó rồi truyền đi.
Các thuật toán nén-giản tín hiệu làm giảm phạm vi dải động của một tín hiệu âm thanh. Trong
các hệ thống tương tự, điều này có thể làm tăng tỷ lệ tín hiệu - nhiễu (SNR) đạt được trong quá
trình truyền, và trong lĩnh vực kỹ thuật số, nó có thể làm giảm lỗi lượng tử hóa
Câu 8: (1 điểm) Việc nén tín hiệu video số là quá trình trong đó lượng thông tin của một ảnh
hoặc nhiều ảnh được giảm bớt bằng cách:
A: Loại bỏ những thông tin dư thừa trong tín hiệu video.
B: Cắt nhỏ hình ảnh.
C: Loại bỏ một số khung hình.
Thực chất của kỹthuật “nén video số” là loại bỏ đi các thông
tin dưthừa. Các thông tin dưthừa trong nén video sốthường là:
+ Độdưthừa không gian giữa các pixel;
+ Độdưthừa thời gian do các ảnh liên tiếp nhau;
+ Độdưthừa do các thành phần màu biểu diễn từng pixel có độtương quan
cao;
+ Độdưthừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xu ất
hiện không đều nhau;
+ Độ d ưthừa tâm lý thịgiác (các thông tin nằmngoài khảnăng cảm nhận của
mắt 24 frame/s ).vv…


Câu 9: (0.5 điểm) Tính ‘bền vững’ trong kỹ thuật Watermarking được hiểu như thế nào?
Câu 10: (0.5 điểm) Trong lĩnh vực computer vision, để một robot dò tìm ra được biển số
của một xe ô tô thì phải qua những bước xử lý nào?
Câu 11: (0.5 điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi, một chiếc SMART tivi có
chương trình được điều khiển bằng cách nhận biết bàn tay người thì phải có những công
nghệ gì?
(Gợi ý nêu cả phần cứng lẫn phần mềm).


Câu 12: (0.5 điểm) Liệt kê 3 ứng dụng của Non-distructive testing.
Để phát hiện các khuyết tật xuất hiện trong các sản phẩm và bán sản phẩm trước khi đầu tư thời
gian và tiền bạc vào các công đoạn sau.
Để cải thiện các quy trình sản xuất, bằng cách kiểm tra các sản phẩm trước và sau mỗi lần cải
tiến.
Để giảm thiểu các chi phí, tăng cường sự an toàn cho công nhân, dân chúng, môi trường bằng
cách kiểm tra định kì các thiết bị máy móc, tìm ra các khuyết tật, thay thế trước khi chúng gây
nên sự cố nghiêm trọng.
Để có được các thông tin về chất lượng, tình trạng của sản phẩm mà không làm tổn hại đến khả
năng sử dụng của chúng.
Để khẳng định sự toàn vẹn của các đối tượng kiểm tra trong quá trình đại tu nhằm đảm bảo sự
hoạt động an toàn của máy móc, thiết bị.

Đề số 1 (Lần 2)

Câu 1: (1 Điểm) Phân tích tiếng nói là gì? Nêu 2 ứng dụng thực tế của xử lý tiếng nói.

Câu 2: (1 Điểm) Tại sao cần phải lượng tử hóa? Bước lượng tử là gì?
Câu 3: (1 Điểm) Để thu được tín hiệu có giải tần số là 0-20Khz thì tần số lấy mẫu phải là:
A: 40 Khz

B: 20 Khz
C: 10 Khz
D: 30
Câu 4: (2 Điểm) Cho một chuỗi các kí tự như sau:
S = “CABBBAEEEEDDDDCCCAAAACCBBBBBBBBEEABBBBD”
Mô tả giải thuật Huffman để nén chuỗi kí tự trên và cho biết mã đầu ra tương ứng cho
mỗi kí tự?
Câu 5: (1 điểm) Theo mã RLC, End Of Block (EOB) để đánh dấu vị trí bắt đầu:
A: Chuỗi số 0 liên tiếp
B: Chuỗi số 1 liên tiếp
C: Dãy số 101010
D: Kết thúc bảng mã
Câu 6: (2 Điểm) Cho hàm f(i) = 10 (i=0,2,3..,7). Tính giá trị hàm F(u)? (u=0,1,…,7) của
phép biến đổi Cosine rời rạc. Vẽ biểu đồ tương ứng cho f(i) và F(u)?
Câu 7: (1 Điểm) Trong kỹ thuật Watermarking, người ta dùng khóa (key) để làm gì? Liệt
kê 3 ứng dụng của watermarking?
Câu 8: (1 Điểm) Trong lĩnh vực dò tìm và chuẩn đoán lỗi cho thiết bị máy, mô tả ngắn gọn
kĩ thuật dò tìm lỗi cho vòng bi và hộp số sử dụng tín hiệu rung và tín hiệu âm thanh.




×