« Home « Kết quả tìm kiếm

Mã hóa băng con ứng dụng trong xử lý tiếng Việt


Tóm tắt Xem thử

- BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Lê Thị Huyền TrangMÃ HÓA BĂNG CON ỨNG DỤNG TRONG XỬ LÝ TIẾNG VIỆTLUẬN VĂN THẠC SĨ KỸ THUẬT Chuyên ngành: Kỹ thuật viễn thôngHà Nội - 2016 BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Lê Thị Huyền TrangMÃ HÓA BĂNG CON ỨNG DỤNG TRONG XỬ LÝ TIẾNG VIỆTLUẬN VĂN THẠC SĨ KỸ THUẬTChuyên ngành: Kỹ thuật viễn thôngNGƯỜI HƯỚNG DẪN KHOA HỌC:PGS.TS.
- eHệ số nội suy của bộ lọc nội suyHệ số phân chia của bộ lọc phân chiaBậc của bộ lọcHệ số phân chia của băng con thứ iTần số (đơn vị Hz)Tần số góc chuẩn hóa (đơn vị rad)Tốc độ bit trong SBCLỗi khôi phục trong mã hóa băng con9.
- SBCMotion Picture Experts Group/audioPulse Code ModulationQuadrature Mirror FilterSubBand CodingNhóm chuyên gia hình ảnh chuyển động/âm thanhĐiều xung mãBộ lọc gương cầu phươngMã hóa băng con ivDANH MỤC CÁC BẢNGTrangBảng 3.1: Bảng giá trị etrong SBC(88444) và SBC(8842), bTB=8bit/mẫu với tiếng nói Tiếng Việt72DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊChương 1:TrangHình 1.1: Bộ phân chiaHình 1.2: Bộ phân chia trong miền ZHình 1.3: Mạch lọc phân chiaHình 1.4: Bộ nội suyHình 1.5: Biểu diễn phép nội suy trong miền ZHình 1.6: Bộ lọc nội suyHình 1.7: Bộ biến đổi nhịp lấy mẫuHình 1.8: Bộ biến đổi nhịp lấy mẫu hệ số M/LHình 1.9: Bộ lọc với hệ số lấy mẫu hữu tỷHình 1.10: Sơ đồ bộ lọc biến đổi nhịp lấy mẫuHình 1.11: Bank lọc số phân tíchHình 1.12: Bank lọc số tổng hợpHình 1.13: Bank lọc số nhiều nhịp hai kênh QMFHình 1.14: Đáp ứng biên độHình 1.15: Sơ đồ tổng quát của bank lọc số M kênhHình 1.16: Cấu trúc dạng cây đơn phân giải của bank lọc phân tíchHình 1.17: Cấu trúc dạng cây phân giải đều của bank lọc tổng hợpHình 1.18: Cấu trúc tương đương dạng cây phân giải đềuHình 1.19: Cấu trúc dạng cây đa phân giải của bank lọc phân tíchHình 1.20: Cấu trúc dạng cây đa phân giải của bank lọc tổng hợpHình 1.21: Cấu trúc tương đương dạng cây đa phân giải vChương 2:Hình 2.1: Mô phỏng quá trình truyền tiếng nói trong không khíHình 2.2: Tín hiệu và phổ của tín hiệuHình 2.3: Bộ máy phát âm của con ngườiHình 2.4: Mô tả dây thanh âmHình 2.5: Mô hình hệ xử lý biến đổi tín hiệu vào x(n) thành tín hiệu ra y(n)Hình 2.6: Mô hình tạo tiếng nói (Fant – 1960)Hình 2.7: Mô hình tạo tiếng nóiHình 2.8: Biểu diễn tín hiệu tiếng nóiHình 2.9: Chất lượng tiếng nói so với tốc độ bit của các bộ mã hoáHình 2.10: Mô hình tạo tiếng nói được sử dụng bởi mã hóa nguồnHình 2.11: Kiến trúc của mã hóa AbS.
- (a) Mã hóa.
- (b) Giải mã Chương 3:Hình 3.1: Sơ đồ mã hóa băng con tổng quát M kênhHình 3.2: Một đoạn file ghi âm tiếng dân tộc Tày (nam)Hình 3.3: Một đoạn file ghi âm tiếng dân tộc Tày (nữ1)Hình 3.4: Một đoạn file ghi âm tiếng dân tộc Tày (nữ2)Hình 3.5: Biểu diễn formant f0, f1Hình 3.6: Các băng con tương ứng với tổ hợp phân chia [88444]Hình 3.7: Sơ đồ mã hóa băng con 5 kênhHình 3.8: Phổ tần của tín hiệu vào x(n)Hình 3.9: Phổ tần của 5 tín hiệu băng con tại đầu ra các bộ lọcHình 3.10: Phổ tần của năm tín hiệu băng con tại đầu ra các bộ phân chiaHình 3.11: Phổ tần của năm tín hiệu băng con tại đầu ra các bộ nội suyHình 3.12: Đáp ứng tần số của dàn lọc QMFHình 3.13: So sánh phổ của tín hiệu đầu vào và tín hiệu đã khôi phụcHình 3.14: So sánh tín hiệu đầu vào và tín hiệu ra sau mã hóa băng conHình 3.15: Phổ của các băng con trong miền tần số viMỤC LỤCTrangLời cam đoanDanh mục các ký hiệu, các chữ viết tắtiiiDanh mục các bảngivDanh mục các hình vẽ, đồ thịivMỞ ĐẦU1Chương 1: Lý thuyết mã hóa băng con31.1.
- Các hệ thống lọc số nhiều nhịp1.1.1.
- Bộ lọc phân chia1.1.2.
- Bộ lọc nội suy1.1.3.
- Bộ lọc biến đổi nhịp lấy mẫu với hệ số hữu tỉ1.2.
- Bank lọc số QMF1.2.1.
- Bank lọc số phân tích1.2.2.
- Bank lọc số tổng hợp1.2.3.
- Bank lọc hai kênh QMF1.3.
- Mã hóa băng con của tín hiệu tiếng nói1.3.1.
- Cấu trúc dạng cây phân giải đều1.3.2.
- Cấu trúc dạng cây đa phân giải1.4.
- Tiếng nói và đặc điểm của tiếng nói2.1.1.
- Tần số vượt qua điểm không2.1.2.6.
- Tần số cơ bản2.1.2.8.
- Một số kiến thức chung về xử lý tín hiệu rời rạc2.2.1.
- Mô hình hệ xử lý tín hiệu rời rạc2.2.2.
- Phép biến đổi Z2.3.
- Mô hình tạo tiếng nói2.4.
- Biểu diễn số tiếng nói2.4.1.
- Xác định tần số lấy mẫu tín hiệu tiếng nói2.4.2.
- Nén tín hiệu tiếng nói2.5.
- Mã hóa tiếng nói2.5.1.
- Kết luận chương Chương 3: Ứng dụng mã hóa băng con trong xử lý tiếng Việt553.1.
- Mã hóa băng con trong xử lý tiếng Việt5556 viii3.2.1.
- Nguyên lý của mã hóa băng con3.2.2.
- Điều kiện để tăng hệ số nén tín hiệu tiếng Việt trong SBC3.2.3.
- Lựa chọn tần số lấy mẫu3.2.4.
- Ứng dụng mã hóa băng con [88444] trong xử lý tiếng Việt3.3.1.
- Bank lọc SBC .
- Ứng dụng bank lọc [88444]3.4.
- Kết luận chương KẾT LUẬN74TÀI LIỆU THAM KHẢO76 1MỞ ĐẦUTrong lịch sử phát triển, một trong những tiến bộ quan trọng nhất trong mã hóa âm thanh là việc phát minh ra bộ mã hóa băng con (SubBand Coding – SBC).
- Ứng dụng đầu tiên của mã hóa băng con trong xử lý âm thanh số theo tiêu chuẩn MPEG/audio.
- Chuẩn này được ra đời vào năm 1990 bởi ISO/IEC, được ứng dụng rộng rãi trong phát thanh số vô tuyến.
- Các hệ thống phát thanh số hiện nay trên thế giới đều dùng kỹ thuật mã hóa băng con để nén tín hiệu âm thanh, với tỷ lệ nén rất cao.
- Mã hóa băng con là một trong những thuật toán mã hóa nén dữ liệu có tổn hao, đã được ứng dụng trong mã hóa âm thanh.
- Bên cạnh đó, việc phân tích phổ của tín hiệu âm thanh, tiếng nói cho thấy rằng năng lượng phổ tín hiệu thường phân bố không đồng đều trên toàn bộ dải tần số.
- Năng lượng của phổ tiếng nói chủ yếu tập trung ở tần số thấp, còn ở miền tần số cao năng lượng của phổ âm thanh rất nhỏ.
- Hiện nay lĩnh vực xử lý tiếng nói đặc biệt là tiếng Việt, trong đó có tiếng Việt chính thống và tiếng các dân tộc đang được rất nhiều các nhà khoa học quan tâm, nhà nước ta đã chi rất nhiều tiền cho các đề tài nghiên cứu tiếng Việt.
- Vì vậy, việc nghiên cứu SBC trong xử lý tiếng Việt để nén dữ liệu có ý nghĩa rất quan trọng trong việc định hướng cho phát thanh số ở Việt Nam.
- Do đó, tôi đã chọn đề tài “Mã hóa băng con ứng dụng trong xử lý tiếng Việt”, nhằm góp phần hoàn thiện kiến thức và có thông tin đầy đủ hơn về kỹ thuật mã hóa băng con trong nén tín hiệu tiếng nói.Đề tài được trình bày thành 3 chương:Chương 1: Lý thuyết mã hóa băng conChương này trình bày các vấn đề cơ bản về kỹ thuật lọc số nhiều nhịp gồm có phép phân chia và phép nội suy, bộ lọc biến đổi nhịp lấy mẫu gồm có bộ lọc phân chia và bộ lọc nội suy từ đó ứng dụng để tạo ra các bank lọc số.
- Đồng thời nghiên cứu về bank lọc số QMF 2 kênh ứng dụng trong xử lý tiếng nói với cấu trúc dạng cây đơn phân giải và đa phân giải.
- 2Chương 2: Kiến thức cơ bản về tiếng nóiChương này trình bày một số đặc điểm cơ bản của tiếng nói gồm có đặc tính vật lý, đặc tính âm học của âm thanh.
- Đưa ra một số kiến thức chung về xử lý tín hiệu rời rạc, mô hình tạo tiếng nói, cách biểu diễn số tiếng nói cũng như các dạng mã hóa tiếng nói khác nhau.Chương 3: Ứng dụng mã hóa băng con trong xử lý tiếng ViệtChương này trọng tâm đi sâu vào việc phân tích đặc trưng của tiếng nói nói chung và tiếng Việt nói riêng, cụ thể là tiếng dân tộc Tày-Nùng từ đó đưa ra phương án thiết kế bank lọc số SBC có hệ số phân chia [88444] phù hợp.
- So sánh kết quả của bank lọc này với các bank lọc đang ứng dụng trong phát thanh số hiện nay.
- 3CHƯƠNG 1 LÝ THUYẾT MÃ HÓA BĂNG CONMã hoá băng con là quá trình phân chia tín hiệu thành nhiều dải tần sốthông qua các bộ lọc thông thấp, thông dải và thông cao.
- Các dải tần này gọi là các băng con.
- Sau đó, các băng con này sẽ được lượng tử và mã hoá độc lập nhau, tuỳthuộc vào tính chất thống kê và mật độ năng lượng của từng dải mà số bit mã hoá khác nhau.1.1.
- CÁC HỆ THỐNG LỌC SỐ NHIỀU NHỊP Kỹ thuật lọc số nhiều nhịp ngày càng được ứng dụng nhiều trong lĩnh vực xửlý số tín hiệu, như là nó có thể dùng để tăng tốc độ tính toán trong các bộ lọc sốbằng cách giảm số phép nhân thực hiện được trong một giây.Trong quá trình xử lý tín hiệu thì bề rộng của dải tần số có thể thay đổi, như là các phép lọc có thể triệt tiêu các thành phần tần số không mong muốn, khi đó bềrộng dải tần của tín hiệu xử lý sẽ giảm đi, vậy chúng ta có thể giảm tần số lấy mẫu cho phù hợp với bề rộng phổ của tín hiệu do đó chúng ta đã giảm được số phép tính trong bộ lọc số.Do tính chất ưu việt của bộ lọc số nhiều nhịp này mà nó đã được nghiên cứu và ứng dụng nhiều trong kỹ thuật viễn thông, đặc biệt là trong xử lý tín hiệu số: Xửlý tiếng nói, xử lý hình ảnh, các hệ thống antenna, kỹ thuật audio số.
- Đặt biệt hơn là ứng dụng chính của nó là mã hóa băng con (subband coding) trong xử lý tiếng nói, ta sẽ nghiên cứu ở phần sau.Hệ thống xử lý số nhiều nhịp là hệ thống xử lý số tín hiệu mà tần số (hoặc nhịp) lấy mẫu được thay đổi trong quá trình xử lý.1.1.1.
- Bộ lọc phân chiaHệ thống mà giảm tần số lấy mẫu từ SFtới MFFSS/'(M>1, nguyên dương) là bộ phân chia.
- 4Hình 1.1: Bộ phân chiaTần số lấy mẫu của tín hiệu rời rạc x(n) sau khi qua bộ phân chia sẽ giảm đi M lần, tức là: MMFFFMFFSSSSSSSSWPPWPW Khi đó chu kỳ lấy mẫu SSFT1tăng lên M lần và ''1SSFTdo đó SSSMTFMT'(1.2)Tần số lấy mẫu giảm đi M lần sau khi tín hiệu đi qua bộ phân chia theo hệ số M, nên tín hiệu ra yMØ(n) chỉ lấy giá trị của các tín hiệu vào x(n) ở các mẫu n.M (n, M nguyên dương).Vậy chiều dài của tín hiệu bị co lại M lần.
- ]MnyLnxLMØ)()(Phép phân chia trong miền Z có thể biểu diễn như trong hình 1.1.Hình 1.2: Bộ phân chia trong miền ZSFMØX(z) YMØ(z)M: hệ số phân chiaMØx(n)SFSWTSyMØ(n.
- ) Â•-•--P•-•-ØmMolMmlmMjmMmMzmxeMzmPmxzY12).(.1..Â-P-ؘ˜¯ˆÁÁËÊ1021.1)(MllMjMMezXMzY(1.5)Việc biểu diễn phép phân chia trong miền tần số chính là việc tìm mối quan hệ giữa.
- ]nxFTeXjwNếu đánh giá )(zYMØvà ( )zXtrên vòng tròn đơn vị của mặt phẳng z thì ta sẽ được mối quan hệ giữa )(wjMeYØvà ()wjeXtức là:jωez(z)MYjωeMYØؘ¯ˆÁËÊ( )wwjezzXjeX˜¯ˆÁËÊVậy ta có mối quan hệ sau:( )ÂÂ-P--P-ؘ˜¯ˆÁÁËʘ˜¯ˆÁÁËÊ1021021..1MlMljMllMjMjjMeXMeeXMeYwww(1.6)Chúng ta thấy rằng, qua phép phân chia kết quả cho thấy tín hiệu x(n) khi đi qua mạch phân chia hệ số M, trong miền tần số sẽ tạo ra M-1 thành phần hư danh, các thành phần hư danh này sẽ gây ra hiện tượng chồng phổ

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt