Đọc truyện audiovideo

audiovideo

Trước Sau

Màu nền

Font chữ

Font size

Chiều cao dòng

Câu 1: Trình bày mục đích, pp các kỹ thuật nén tín hiệu Audio?

A, Mục đích :

Để có âm thanh trung thực và chất lượng dịch vụ thỏa mãn yêu cầu thì tốc độ

dữ liệu phải lớn. Do vậy, khó khăn cho việc lưu trữ, truyền dẫn và giá thành thiết bị ->

fải thực hiện nén.

B, pp nén:

1- Nén ko tổn hao :

- Loại bỏ dư thừa thống kê,các thông tin xuất hiện trong sig mà có thể dự báo trước.

- Tỉ số nén thấp (khoảng 2÷1) phụ thuộc vào độ phức tạp của sig nguồn.

- Thường sd Kt mã hóa dự đoán trong miền .

- Thuật toán vi sai :

+, sig âm thanh có đặc tính lặp đi lặp lại -> x.hiện sự dư thừa số liệu, t.tin lặp lại đc

loại bỏ trong q.trình mã hóa và đc đưa vào lại trong q.trình giải mã sd Kt DPCM.

+, Các Kt audio đầu tiên đc phân .tích thành tập hợp các dải băng con bao gồm 1 số

lượng âm thanh rời rạc, sau đó DPCM đc sd để dự báo các sig lặp lại theo chu kỳ. Sd

ADPCM đc kq tốt hơn.

- Mã hóa Entropy :

+, Tận dụng độ dư thừa trong cách miêu tả các hs băng con dẫ LTH nhằm cải thiện

tính hiệu quả của q.trình mã hóa. Các LTH đc gửi đi theo sự tăng dần của tần số.

+, K.q nhận đc là bảng mã tối ưu thống kê các g.trị miền t.số thấp và cao sd mã hóa

Huffman, lemper-zip để nén.

2- Nén tổn hao :

- Hệ thống thính giác con ng ko thể fân biệt các thành phần phổ có biên độ nhỏ giữa các

thành phần phổ có biên độ lớn.

-Hệ số nén lớn (2÷1) phụ thuộc vào q.trình nén và giải nén chất lượng audio yêu cầu.

- Kt che: đối với các sig trong miền và tần số.

- Che mức tạp âm lượng tử cho từng âm độ của sig âm thanh = cách chỉ định số bit vừa

đủ để chắc chắn rằng mức nhiễu lượng tử luôn nằm dưới mức g.trị cần che.

- Mã hóa ghép : Khai thác độ dư thừa trong hệ thống audio đa kênh với các TP số liệu

trong các kênh giống nhau. Mã hóa 1 fần s.liệu chung trên 1 kênh và chỉ định cho bộ

giải mã lặp lại sig đó trên các kênh còn lại.

Câu 2: Trình bày mục đích, pp các kỹ thuật nén tín hiệu Video?

A, Mục đích :

Các hệ thống nén số liệu là sự phối hợp của rất nhiều các kỹ thuật xử lý

nhằm giảm tốc độ bit của tín hiệu số mà vẫn đảm bảo chất lượng ảnh phù hợp với một

ứng dụng nhất định.

B, pp nén :

1- Nén không mất thông tin:

Cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén. Đây là một quá

trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vào chi tiết ảnh được nén và

nhỏ hơn 2:1.

a) Mã hoá với độ dài (của từ mã) thay đổi (VLC)

Phương pháp này là mã hoá Huffman và mã hoá entropy, dựa trên khả năng

xuất hiện của các giá trị biên độ trùng hợp trong một bức ảnh và thiết lập một từ mã

ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại.

Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ được sử dụng để tạo lại giá trị tín

hiệu ban đầu.

b) Mã hoá với độ dài (của từ mã) động (RLC)

Dựa trên sự lặp lại của cùng giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự

bắt đầu và kết thúc của giá trị được lắp lại. Chỉ các mẫu có giá trị khác không mới được

mã hoá. Số mẫu có giá trị bằng không sẽ được truyền di dọc theo cùng dòng quét. Cuối

cùng, các chuỗi 0 được tạo ra bằng quá trình giải tương quan như phương pháp DCT

hay DPCM.

c) Sử dụng khoảng xoá dòng và mành

Vùng thông tin xoá được loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin

tích cực của ảnh -> thông tin xoá dòng và xoá mành sẽ không được ghi giữ và truyền đi.

Chúng được thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo các ứng dụng.

d) Biến đổi cosin rời rạc (DCT)

Quá trình DCT thuận và nghịch được coi là không mất thông tin nếu độ dài từ

mã hệ số là 13 hoặc 14 băng tần đối với dòng video số sử dụng 8 bit biểu diễn mẫu.

Nếu độ dài từ mã hệ số của phép biến đổi DCT nhỏ hơn, quá trình này trở nên có mất

thông tin.

2- Nén có mất thông tin

Sử dụng hai hoặc nhiều hơn các kỹ thuật xử lý nhằm đạt được một sự biểu

diễn mã hoá thuận lợi tín hiệu hình ảnh. Nén có mất thông tin đạt được hệ số nén cao

hơn so với phương pháp nén không mất thông tin, vào cỡ 2:1 đến 100: 1. Sau khi nén,

một số thông tin sẽ bị mất và chất lượng ảnh bị suy hao do quá trình làm tròn và loại

bỏ giá trị trong phạm vi khung hình hay giữa các khung hình. Hệ số nén có thể thay đổi

theo chi tiết ảnh và cho phép tạo ra dòng bit có tốc độ không đổi, phục vụ cho các ứng

dụng lưu trữ và truyền dẫn. Tốc độ dòng số liệu đạt được trong hệ thống nén có mất

thông tin phụ thuộc vào yêu cầu chất lượng ảnh cần có.

a) Lấy mẫu con (Subsampling)

Phương pháp nén rất có hiệu quả, song độ phân giải của ảnh sau khi giải nén giảm

so với ảnh ban đầu. Vì vậy, kỹ thuật lấy mẫu con không áp dụng cho tín hiệu chói.

b) Điều xung mã vi sai (DPCM)

Là phương pháp mã hoá dự đoán, thay vì truyền đi toàn bộ các mẫu, kỹ thuật

này chỉ mã hoá và truyền đi sự khác nhau giữa các giá trị mẫu. Giá trị sai lệch được

cộng vào giá trị mẫu đã được giải mã trong quá trình giải nén để tạo lại giá trị mẫu cần

Quá trình DPCM làm giảm lượng entropy của tín hiệu ban đầu. Tất cả các

giá trị sai lệch giữa các mẫu tập trung quanh giá trị 0 vì trong các ảnh sự xuất hiện các

vùng đều có khả năng cao. Nhằm tránh các lỗi các thể xuất hiện trong khi truyền. Mã

hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng tử hoá thích nghi để hoàn

thiện thêm kỹ thuật nén này.

c) Lượng tử hoá và mã hoá VLC các hệ số DCT: Phối hợp ba kỹ thuật này cho

phép biểu diễn một khối các điểm ảnh bằng một số ít các bit, do đó tạo được một hiệu

quả nén rất cao.

Câu3: Mã hóa FANO-shannon:

Theo lý thuyết thông tin của Shannon thì tỉ lệ nén tốt nhất mà chúng ta có thể

đạt được chính là entropy nguồn. Shannon và Fano đã tìm ra một phương pháp nén mới

mà dựa trên xác suất xuất hiện của những symbol nguồn bên trong một lượng thông

tin. Cơ bản phương pháp này sử dụng những từ mã có độ dài thay đổi để mã hoá các

symbol nguồn thông qua xác suất của chúng. Với những symbol có xác suất xuất hiện

càng lớn thì từ mã dùng để mã hoá chúng càng ngắn.

Các bước mã Shannon - Fano:

a) Bước 1: Sắp xếp các symbol nguồn với xác suất xuất hiện của chúng theo

thứ tự giảm dần.

b) Bước 2: Chia tập đã sắp xếp đó thành hai phần sao cho tổng xác suất xuất

hiện của các symbol ở mỗi phần xấp xỉ nhau.

c) Bước 3: Mã sử dụng bit 0 để mã hoá cho các symbol trong phần 1 và bit 1

mã hoá cho các symbol trong phần 2.

d) Bước 4: Quay trở lại bước 2 và tiếp tục làm cho tới khi mỗi phần chia chỉ

còn lại 1 symbol.

Câu 4: Mã hóa huffman:

Mã Huffman thuộc loại mã entropy hoặc mã thống kê. Tư tưởng chính là dùng VLC

(Variable Length Coding), sử dụng ít bit để mã các giá trị hay xảy ra (xác suất xuất hiện

cao) và nhiều bit để mã các giá trị ít xảy ra (xác suất xuất hiện thấp). Từ đó tốc độ bit

sẽ giảm một cách đáng kể.

Độ dài trung bình của từ mã Huffman giới hạn trên bởi

log2

H+P+



log e 



e 





H là lượng entropy nguồn, P là xác suất của tất cả các symbol

Các bước mã hoá Huffman:

a) Bước 1: Liệt kê các xác suất của các symbol nguồn, và tạo ra các tập mút

bằng cách cho những xác suất này thành các nhánh của cây nhị phân.

b) Bước 2: Lấy 2 nút với xác suất nhỏ nhất từ tập nút và trạo ra 1 xác suất mới

bằng tổng xác suất của xác suất đó.

c) Bước 3: Tạo ra mọt nút mẹ với các xác suất mới, và đánh dấu 1 cho nút con

ở trên và 0 cho nút con ở dưới.

d) Bước 4: Tạo tiếp tập nút bằng cách thay thế 2 nút với xác suất nhỏ nhất cho

nút mới. Nếu tập nút chỉ chứa 1 nút thì kết thúc, ngược lại thì ta quay lại bước 2.

Bộ mã sẽ được thiết lập bằng cách dùng một tập hợp data và đánh giá xác suất

của mỗi sự kiện. Sự tối ưu có thể đạt được bằng cách thiết kế một bảng mã riêng biệt

cho mỗi phần tử được mã hoá. Nhưng điều này sẽ làm tăng số bảng mã.

Muốn lập được bảng mã cần tính xác suất xuất hiện mỗi phần tử ảnh trong

tập mã. Dựa vào đó xây dựng một cây không cân bằng (tức gồm một số nhánh không

dài bằng nhau). Mức độ không cân bằng của cây phụ thuộc vào xác suất xuất hiện của

các phần tử. Một cây được xây dựng như vậy gọi là cây mã Huffman.

Nút gốc (8)

Nút nhánh (4)

Nút nhánh (2)

Nút lá

d (1)

Hình 6.11 Cây mã Huffman

Nút lá

c (1)

Cây mã Huffman là một cây nhị phân có các nhánh được gán cho giá trị 0 hoặc

1. Gốc của cây được gọi là nút mốc, còn các điểm rẽ nhánh được gọi là các nút nhánh.

Điểm kết thúc của một nhánh được gọi là nút lá. Mỗi nút lá được gán tương ứng với

một phần tử cần mã hoá. .Từ một nút nhánh, khi rẽ thành hai nhánh mới thì nhánh bên

trái được gán cho giá trị 0 và nhánh bên phải được gán cho giá trị 1 (việc gán này có thể

làm ngược lại). Từ mã của một symbol được xác định bằng cách đi từ gốc đến nút lá

tương ứng với symbol đó. Các bit của các từ mã được tập hợp từ các giá trị tương ứng

của nhánh phai đi qua.

Câu 5: Phân tích sơ đồ mã hoá/giải mã theo chuẩn nén Video H.261?

Sơ đồ mã hóa trong khung

“Control” điều khiển tốc độ bit và bộ đệm, nếu bộ đệm đầy thì giảm tốc độ bit.

“Memory” dùng để lưu hình ảnh được khôi phục lại

với mục đích tìm véc tơ chuyển động cho Frame P tiếp

theo

Phần dưới này tớ thêm vào không biết dúng k, tùy mọi người học nha

Trong bộ mã hóa H261, có 3 thành phần chính là prediction, block tranformation,

quantization & entropy coding

Prediction:

H261 định nghĩa hai loại mã khác nhau:

INTRA coding: mỗi block 8*8 pixel được mã hóa một cách độc lập và được gửi đi

trực tiếp tới tiến trình chuyển đổi block (block transformation process)

ENTER coding: mỗi frame được mã hóa có sự liên quan đến frame khác. Độ sai

lệch được tính toán giữa một vùng 16*16 pixel với một macroblock của frame

trước.

Block transformation:

H261 hỗ trợ việc bù đắp những mất mát của quá trình chuyển động trong bộ mã

hóa như một tùy chọn. Trong việc bồi thường chuyển động, một vùng tìm kiếm được

xây dựng dựa trên frame trước để xác định macroblock tham chiếu tốt nhất. Cả độ sai

lệch ước tính cũng như vector chuyển động, xác định giá trị và hướng di chuyển giữa

macroblock được mã hóa và vùng tham chiếu đã chọn đều được gửi đi. Cùng tìm kiếm

cũng như làm thến nào để tính toán vector chuyển động không tùy thuộc vào sự chuẩn

hóa. Thành phần nằm ngang và thẳng đứng của vector phải có giá trị nguyên nằm trong

khoảng-15 đến 15.

Trong sự biến đổi khối, những frame mã hóa theo kiểu INTRA cũng như những

sai số dự đoán đều được đưa vào trong khối 8*8. Mỗi khổi sẽ được xử lý bởi 1 hàm

FDTC hai chiều.

Quantization & Entropy coding:

Mục đích của bước này là đạt được sự nén tốt hơn bằng các hệ số DTC để đạt

được chất lượng đòi hỏi. Số lượng tử hóa là 1 đối với các hệ số INTRA và là 31 cho tất

cả các hệ số khác

Mã hóa Entropy kéo theo sự nén tốt hơn được thực hiện bằng cách gán những

từ mã ngắn hơn cho sự kiện phổ biến và sử dụng những sự kiện ít phổ biến hơn. Mã

hóa huffman thường được sử dụng trong trường hợp này.

Nói cách khác, chúng ta có thể mất một vài hệ số trong việc chuyển đổi bằng

cách sử dụng ít bit hơn so với số bit cần thiết cho tất cả các giá trị. Chúng ta sẽ dùng

những từ mã ngắn hơn đối với giá trị thông thường.

Câu 6: Phân tích sơ đồ mã hoá/giải mã theo chuẩn nén Video H.263?

Khái niệm

• Tiêu chuẩn cải tiến H.261 cho video tốc độ thấp, có thể truyền trên mạng điện thoại

công cộng PSTN ,được công nhận vào năm 1996

• Giông như H.261, mã hoá DCT cho các MB trong I Frame và DCT sai biệt dự đoán

trong P Frame.

• tốc độ tối thiểu

• Ưu ñiem:

• Chính xác sai biệt dự đoán tới ½ pixel.

• Không hạn chế vec tơ chuyển động

• Mã hóa số học theo cú pháp.

• Dự đoán thuận lợi với các khung P.

• Ngoài CIF, QCIF, H.263 còn hỗ trợ SQCIF, 4 CIF và 16CIF với độ phân giải tín hiệu

Chói tuần tự là là 128x96, 704x576, 1408x1152. Độ phân giải tín hiueej sắc bằng ¼

tín hiệu chói.

Về bản chất, H.263 kết hợp các tính năng của H.261 cùng với MPEG, và được tối

ưu hóa cho tốc độ bit rất thấp. Về tỷ số tín hiệu nhiễu (SNR), H.263 có thể cung cấp

3-4 được dB trên H.261 với tốc độ bit dưới 64 kbits / s. Trong thực tế, H.263 cung cấp

mã hóa cao cấp hiệu quả như của H.261 ở tất cả các tỷ lệ bit. Khi so sánh với MPEG-1,

H.263 có thể cho tiết kiệm 30% tỷ lệ bit.

H.263 được xây dựng trên đầu trang của H.261, các cấu trúc chính của hai tiêu

chuẩn cơ bản là giống nhau. Vì vậy, chúng tôi sẽ chỉ tập trung vào sự khác biệt giữa hai

tiêu chuẩn. Sự khác biệt chính là:

1. H.236 hỗ trợ các định dạng hình ảnh nhiều hơn, và sử dụng một cấu trúc gob

khác nhau.

2. H.263 sử dụng bồi thường chuyển động nửa PEL, nhưng lưu ý lọc vòng lặp sử

dụng như trong H.261.

3. H.263 sử dụng 3D VLC để mã hóa các hệ số DCT.

4. Ngoài các thuật toán mã hóa cơ bản, bốn tùy chọn có thể thương lượng giữa

các bộ mã hóa và giải mã các cung cấp cải thiện hiệu suất.

5. H.263 cho phép kích thước bước lượng tử hóa để thay đổi ở mỗi MB với chi

phí ít hơn.

Câu 7. Sơ đồ mã hóa, giải mã tín hiệu video theo chuẩn nén MPEG1.

Sơ đồ mã hóa

Sơ đồ giải mã:

Câu 8. Nêu kiến trúc và thuật toán nén tín hiệu adio theo chuẩn MPEG-1.

Thuật toán:

Câu 9. Sơ đồ mã hóa nén tín hiệu audio AC-3.

• Sơ đồ:

Bộ mã hóa sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong

miền tần số. Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm nhiều phần số mũ và phần

định trị. Các tập số mũ được mã hóa thông qua phổ tín hiệu và xem như là đường bao

phổ. Sử dụng phân phối bit xác định số bit cần mã hóa mỗi định trị dựa vào đường bao

phổ. Đường bao phổ và các định trị được lượng tử cho 6 khối âm thanh ( 1536 mẫu âm

thanh ) được định dạng khung rồi chuyển đi.

Câu 21: Entropy là gì? Tính Entropy cho hai Block ảnh sau...

+ Entropy là gì? Entropy của hình ảnh là một giỏ trị cú ý nghĩa quan trọng, bởi

nó xác định số lượng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử

ảnh. Trong công nghệ nén không tổn hao, entropy là giới hạn dưới của tỉ số bit/

pixel. Nếu tín hiệu video được nén với tỉ số bit/phần tử nhỏ hơn entropy, hình

ảnh sẽ bị mất thông tin và quá trình nén sẽ có tổn hao.

Entropy đo giá trị thông tin trung bình chứa đựng trong một bức ảnh và

theo đó, entropy cũng xác định lượng thông tin trung bình nhỏ nhất biểu diễn bởi

mỗi giá trị nhị phân qua quá trình mã hóa, để bảo toàn được khả năng khôi phục

ảnh tốt. Theo lý thuyết, độ dài trung bình của một từ mã (cũng tương đương với

tốc độ bit thu được) qua một phương pháp nén không thể nào nhỏ hơn entropy

của bức ảnh, một số thông tin của bức ảnh sẽ bị mất.

Theo quan điểm của lý thuyết thông tin, lượng thông tin của từng phần tử

ảnh được định nghĩa là logarit cơ số hai của nghịch đảo xác suất xuất hiện của

phần tử ảnh đó:

l ( xi ) = log

=− log 2 P xi 

 

 

2 P x 

 





Trong đó: l(xi) - lượng thông tin của phần tử ảnh xi (được tính bằng bit).

P(xi ) - xỏc suất xuất hiện của phần tử ảnh xi.

Nếu một hình ảnh được biểu thị bằng các phần tử x1, x2, x3.... Xác suất xuất

hiện của từng phần tử tương ứng sẽ là P(x1), P(x2), P(x3)....

Biết được lượng tin tức của từng phần tử ảnh chưa đủ, cũn cần phải biết được

lượng tin tức bình quân của cả tập hợp các phần tử ảnh của hình ảnh. Lượng tin

tức bình quân ấy người ta gọi là entropy, được biểu diễn bằng biểu thức bình

quân thống kê sau: Gọi lượng thông tin trung bình của hình ảnh H(x) (entropy

của hình ảnh), ta có.

H (x) =

i=l

   

∑ P x  l  x 

 i  i

=−

i=l

 

∑ P x 

 i

 

log2 P xi 

 

Bạn đang đọc truyện trên: Truyen2U.Pro

Trước Sau