« Home « Kết quả tìm kiếm

Thuật toán nén dữ liệu tiếng nói trực tuyến


Tóm tắt Xem thử

- Thuật toán nén dữ liệu tiếng nói trực tuyến.
- Bài báo ñề xuất thuật toán nén dữ liệu tiếng nói trực tuyến.
- Nội dung của thuật toán là xấp xỉ tuyến tính dữ liệu tiếng nói.
- Trong bài báo này cũng ñề xuất thuật toán giải nén với ñộ phức tạp tuyến tính.
- Kết quả thử nghiệm cho thấy thuật toán có thể áp dụng trong các ứng dụng nén và giải nén tiếng nói trực tuyến..
- Từ khóa: Nén dữ liệu, tiếng nói, dữ liệu tiếng nói, trực tuyến, dữ liệu tiếng nói trực tuyến..
- Nén dữ liệu âm thanh nói chung và dữ liệu tiếng nói nói riêng ñã và ñang ñược các nhà khoa học, công nghệ trên thế giới quan tâm nghiên cứu, các kết quả ñạt ñược ñã ñược ứng dụng nhiều trong lĩnh vực truyền thông và giải trí.
- Trong lĩnh vực nén âm thanh, người ta ñã từng biết ñến các chuẩn nén khá nổi tiếng như dòng họ nén MPEG, MP3, JPEG...[1] ðặc ñiểm chung của các thuật toán nén trên là: hiệu suất nén cao, chất lượng âm thanh sau khi giải nén tốt.
- Tuy nhiên do tính phức tạp của các thuật toán ñó nên quá trình nén và giải nén luôn phải tách thành hai quá trình riêng biệt.
- ðặc ñiểm này làm cho các thuật toán trên không thể sử dụng trong các trường hợp cần nén và giải nén trực tuyến [2].
- Vì vậy, việc tìm kiếm và thiết lập các thuật toán nén và giải nén có thể thực hiện trực tuyến ñã và ñang là vấn ñề thời sự..
- Dưới ñây trình bày thuật toán cho phép nén và giải nén trực tuyến trên dữ liệu tiếng nói..
- Thuật toán.
- Chúng ta dùng các ñoạn thẳng thay cho các khúc cong ñơn ñiệu là ý tưởng cơ bản của thuật toán này (hình 1)..
- ðể tiện cho việc diễn ñạt, ta ký hiệu thuật toán nén mô tả dưới ñây là thuật toán TT1..
- Mô tả thuật toán TT1.
- Giả sử dữ liệu của tiếng nói là dãy S={s 1 , s 2.
- Sơ ñồ khối hình 3 mô tả thuật toán TT1 làm việc theo chế ñộ trực tuyến..
- Các biến sử dụng trong thuật toán TT1 mô tả trong hình 3:.
- 1) Thuật toán trên có thể làm việc trực tuyến vì quá trình nén chỉ thực hiện hai thao tác chủ y ếu là so sánh hai tín hiệu liên tiếp và ñếm..
- 2) Thuật toán mô tả bởi sơ ñồ khối hình 3 có thể cải tiến ñể nâng cao tỷ lệ nén.
- Chúng ta hãy xét hai lần truyền dữ liệu nén liên tiếp trong.
- thuật toán trên là Output (A,B,n) và Output (B,C,n1), với A, B là phần tử ñầu, cuối của dãy con thứ nhất và B, C là phần tử ñầu, cuối của dãy con thứ hai.
- 3) Thuật toán mô tả trên còn có thể cải tiến ñể nâng cao tỷ lệ nén bằng cách thay các khúc ñường cong AB (bao gồm cả các khúc cong không giảm, không tăng) bằng ñoạn thẳng AB nếu mọi ñiểm trên khúc ñường cong AB thỏa mãn ñiều kiện |s 1 -s 2 |<h (h>0), ở ñây s 1 , s 2 nằm trên khúc cong AB, minh họa ở hình 4..
- Sơ ñồ khối thuật toán TT1..
- Minh họa ý tưởng cải tiến thuật toán TT1..
- Thuật toán giải nén ứng với thuật toán TT1 Dữ liệu nén dạng (A, B, n) do thuật toán TT1 thực hiện ñược giải nén bằng cách nội suy tuyến tính n ñiểm cách ñều với giá trị ñầu, cuối tương ứng là A, B.
- y n ) là n giá trị ñược giải nén.
- Ký hiệu thuật toán giải nén ứng với thuật toán TT1 là thuật toán TT2.
- Thuật toán TT2 ñược mô tả trong sơ ñồ khối hình 5..
- ðầu vào: Các véc tơ chứa dữ liệu nén dạng (A, B, n), tương ứng là phần tử ñầu, cuối và số phần tử của dãy con ñơn ñiệu..
- ðầu ra: n giá trị ñã ñược giải nén chứa trong mảng y..
- Sơ ñồ khối thuật toán TT2..
- ðộ phức tạp tính toán của thuật toán Thao tác chủ yếu trong thuật toán TT1 là so sánh hai phần tử liên tiếp.
- Do vậy, ñộ phức tạp của thuật toán TT1 là O(n)..
- Tương tự như vậy, thuật toán TT2 cũng có ñộ phức tạp tính toán tuyến tính, O(n)..
- Chúng ta xét một dãy dữ liệu trên một ñoạn ñơn ñiệu: (s 1 , s 2.
- Giả sử dữ liệu sau khi giải nén bởi thuật toán TT2 tương ứng với dãy trên là (y 1 , y 2.
- giữa dữ liệu gốc (s 1 , s 2.
- s n ) và dữ liệu giải nén (y 1 , y 2.
- Giả sử thuật toán TT1 ñã nén ñược K ñoạn dữ liệu ñơn ñiệu, tỷ lệ sai lệch giữa dữ liệu gốc và dữ liệu giải nén trên từng ñoạn tương ứng là.
- σ σ σ , khi ñó, tỷ lệ sai lệch trung bình giữa dữ liệu gốc và dữ liệu giải nén của thuật toán TT1 ñược tính bằng công thức sau:.
- Chất lượng của thuật toán TT1 có thể ñánh giá qua σ TB .
- Nếu σ TB càng thấp thì chất lượng sau khi giải nén càng cao và ngược lại..
- Thử nghiệm thuật toán TT1 và TT2 6 lần trên 6 tệp dữ liệu tiếng nói dạng file wave.
- Kết quả thử nghiệm thuật toán TT1 và TT2..
- Kết quả trong bảng 1 cho thấy tỷ lệ nén trung bình mà thuật toán TT1 ñạt ñược xấp xỉ 35%, ñiều ñó có nghĩa là thuật toán nén ñược.
- Tỷ lệ sai lệch trung bình giữa dữ liệu gốc và dữ liệu giải nén ≈6%..
- Hiệu suất nén của thuật toán TT1 không thực sự cao như một số thuật toán nén thông dụng trên thị trường, nhưng với ưu ñiểm ñơn giản trong cài ñặt và có ñộ phức tạp tuyến tính nên phù hợp với các bài toán xử lý trực tuyến..
- Mặt khác, có thể thấy dữ liệu nén của một ñoạn dữ liệu tiếng nói cũng có thể coi như một ñặc trưng mô tả ñoạn dữ liệu ñó