« Home « Kết quả tìm kiếm

Thiết kế và thực hiện chương trình đọc file âm thanh định dạng MP3


Tóm tắt Xem thử

- Trần Thị Bích Hằng TRẦN THỊ BÍCH HẰNG THIẾT KẾ VÀ THỰC HIỆN CHƯƠNG TRÌNH ĐỌC FILE ÂM THANH ĐỊNH DẠNG MP3 ĐIỆN TỬ VIỄN THÔNG LUẬN VĂN THẠC SĨ KHOA HỌC ĐIỆN TỬ VIỄN THÔNG KHOÁ Hà Nội – Năm 2011 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI.
- Họ và tên tác giả luận văn Trần Thị Bích Hằng TÊN ĐỀ TÀI LUẬN VĂN THIẾT KẾ VÀ THỰC HIỆN CHƯƠNG TRÌNH ĐỌC FILE ÂM THANH ĐỊNH DẠNG MP3 Chuyên ngành: Điện tử viễn thông LUẬN VĂN THẠC SĨ KHOA HỌC ĐIỆN TỬ VIỄN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC TS.
- Nguyễn Vũ Thắng Hà Nội – Năm 2011 Luận văn thạc sỉ Trần Thị Bích Hằng 1MỤC LỤC MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ MỞ ĐẦU CHƯƠNG I: ĐỊNH DẠNG NÉN ÂM THANH SỐ MP I.
- Chuẩn nén âm thanh số lớp II.2.
- Mã hóa âm thanh dựa trên mô hình cảm nhận âm học của con người11 II.4.
- Tốc độ bit và tần số lấy mẫu III.
- CẤU TRÚC TẬP TIN MP III.1.
- Cấu trúc tập tin III.2.
- Thẻ dữ liệu ID CHƯƠNG II: MÃ HÓA VÀ GIẢI MÃ MP I.
- MÃ HÓA MP3 ( MP3 ENCODING I.1.
- Quá trình mã hóa MP II.
- GIẢI MÃ MP3 (MP3 DECODING II.1.
- Quá trình giải mã MP Luận văn thạc sỉ Trần Thị Bích Hằng 2CHƯƠNG III: TRIỂN KHAI THIẾT KẾ PHẦN MỀM GIẢI MÃ MP3....56 I.
- TRÌNH TỰ GIẢI MÃ MP II.
- SƠ ĐỒ KHỐI BỘ GIẢI MÃ MP III.
- Quá trình giải mã huffman III.2.
- Cấu trúc dữ liệu III.3.
- Dự kiến đầu vào và đầu ra của quá trình giải mã Huffman IV.2.
- Kết quả và đánh giá TÀI LIỆU THAM KHẢO KẾT LUẬN VÀ KIẾN NGHỊ Luận văn thạc sỉ Trần Thị Bích Hằng 3DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT AC 3 – Advanced Codec 3 CCITT – Consulative Committee for International Telephone and Telegraph CD – Compact Disc CRC – Cylic Redundancy Code DVD – Digital Versatile Disc FFT – Fast Fourier Transform GSM – Global System for Mobile communications IEC – International Electrotechnical Commission IMDCT – Inverse Modified Discrete Cosine Transform ISO – International Organization for Standardization ITU – International Telecommunications Union KHz – KiloHertz kbps – Kilo Bits Per Second MDCT – Modified Discrete Cosine Transform MPEG – Motion Picture Experts Group MP3 – MPEG 1 Layer III MS – Mid Side stereo PCM – Pulse Code Modulation SMR – Signal to Masking Ratio WMA – Windows Media Audio Luận văn thạc sỉ Trần Thị Bích Hằng 4DANH MỤC CÁC BẢNG Bảng 1: Độ phức tạp của bộ mã hóa và giải mã đối với các lớp của âm thanh MPEG.
- Bảng 2: Bảng các băng tới hạn Bảng 3: Các trường trong phần tiêu đề Bảng 4: Bảng cấu trúc các bit trong phần thông tin Bảng 5: 21 dải hệ số tỷ lệ chia thành 4 nhóm Bảng 6: Phân vùng của phổ tần số Bảng 7: Phân bố bit thông tin hệ số tỷ lệ Bảng 8: Phân chia giữa các tần số thấp và cao Bảng 9: Loại cửa sổ Bảng 10: Bảng Preemphasis Bảng 11: Kích thước hệ số tỷ lệ scalefactor của bước lượng tử Bảng 12: Bảng mã Hufman cho vùng Count Bảng 13: Cấu trúc dữ liệu thẻ ID Bảng 14: Giá trị bit của thẻ dữ liệu ID Bảng 15: Dự kiến đầu ra của khối đồng bộ Bảng 16: Giá trị các trường thông tin trong phần tiêu đề Bảng 17: Giá trị các trường trong phần thông tin Luận văn thạc sỉ Trần Thị Bích Hằng 5DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1: Đường cong che (mặt nạ) âm thanh Hình 2: Mô hình ngưỡng nghe của tai người Hình 3: Tín hiệu âm thanh được mã hóa ở tốc độ bitrate khác nhau Hình 4: Các thành phần cơ bản tập tin MP Hình 5: Sơ đồ tổng quan cấu trúc các phần trong tập tin MP Hình 6: Cấu trúc khung theo các line tần số ở chế độ hai kênh Hình 7: Cấu trúc khung Hình 8: Cấu trúc phần thông tin Hình 9: Kỹ thuật dự trữ bit được sử dụng trong việc lưu trữ dữ liệu chính........34 Hình 10: Ngưỡng che âm thanh Hình 11: Sơ đồ khối quá trình mã hóa MP Hình 12: Sơ đồ khối quá trình giải mã MP Hình 13: Từ mã đồng bộ của tập tin MP Hình 14: Phân vùng dữ liệu cho mỗi kênh của MP Hình 15: Cửa sổ ngắn và cửa sổ dài Hình 16: Quá trình sắp xếp lại Hình 17: Cấu trúc hình bướm giảm hiệu ứng Alias Hình 18: Lược đồ thiết kế IMDCT Hình 19: Khối lọc đa pha tổng hợp Hình 20: Sơ đồ khối trình tự giải mã Hình 21: Lược đồ trình tự giải mã MP Hình 22: Ngõ ra của bộ giải mã Huffman Hình 23: Phân vùng dữ liệu tập tin MP3 cho một kênh Hình 24: Lược đồ giải mã Huffman Hình 25: Lưu đồ thuật toán khối đồng bộ Hình 26: Lưu đồ thuật toán của khối giải mã huffman Luận văn thạc sỉ Trần Thị Bích Hằng 6 MỞ ĐẦU Tập tin MP3 có dung lượng nhỏ, chất lượng tốt, được sử dụng rất rộng rãi trên nhiều lĩnh vực, đặc biệt trên lĩnh vực nghe nhạc.
- Đề tài đi sâu nghiên cứu tìm hiểu chuẩn nén âm thanh số MP3, các tham số kỹ thuật, các thuật toán giải mã MP3, các vấn đề cốt lõi, để nắm bắt và làm chủ định dạng MP3.
- Đề tài triển khai xây dựng một đoạn chương trình giải mã định dạng MP3.
- Chương trình giải mã MP3 này không thể như các chương trình phần mềm chuyên nghiệp, nhưng ta làm chủ được phần code, đó là tiền đề để xây dựng và phát triển lên mức cao hơn.
- Luận văn thạc sỉ Trần Thị Bích Hằng 7CHƯƠNG I: ĐỊNH DẠNG NÉN ÂM THANH SỐ MP3 Chương này đề tài đi vào nghiên cứu chuẩn nén âm thanh số MP3, lịch sử hình thành và phát triển MP3, những đặc tính cơ bản và cấu trúc tập tin MP3.
- Khái niệm về MP3 Định nghĩa MP3 là một chuẩn nén âm thanh số.
- Âm thanh số ở định dạng MP3, là âm thanh nén, có dung lượng tập tin nhỏ hơn nhiều lần so với âm thanh không nén nhưng chất lượng âm thanh rất ít hoặc không suy giảm.
- MPEG-1 định nghĩa một tiêu chuẩn cho việc lưu trữ và phục hồi các âm thanh và hình ảnh động trên các thiết bị lưu trữ.
- Lớp 3, với sự phức tạp cao nhất, được thiết kế để cung cấp chất lượng âm thanh cao ở tốc bit thấp.
- Luận văn thạc sỉ Trần Thị Bích Hằng 8I.2.
- Năm 1992 – Thuật toán mã hóa âm thanh của tổ chức Fraunhofer và Dieter được tích hợp vào MPEG-1.
- Năm 1995, MPEG1 lớp-3 đã được chọn như một định dạng âm thanh cho hệ thống phát sóng kỹ thuật số vệ tinh được phát triển bởi thế giới-không gian (World-Space).
- Tất cả các nhà phát triển của bộ mã hóa MP3 và người giải mã / người dùng bây giờ phải trả một lệ phí bản quyền cho Fraunhofer.
- Luận văn thạc sỉ Trần Thị Bích Hằng 9- Cho đến nay: các định dạng tập tin âm thanh MP3 đã trở lên rất phổ biến.
- Bắt đầu nghiên cứu nâng cao, mã hóa âm thanh tốc độ bit thấp, dự án mang tên EUREKA mã số EU147, phát âm thanh số (Digital Audio Broadcasting-DAB), tiền thân của công nghệ MP3.
- Công ty này đã được trao giấy phép quyền sáng chế trong lĩnh vực công nghệ nén âm thanh - United States Patent 5.579.430 về mã hóa âm thanh kỹ thuật số “digital encoding process.
- Karlheinz Brandenburg là một chuyên gia trong lĩnh vực toán học và điện tử, đã nghiên cứu các phương pháp nén âm thanh từ năm 1977.
- Trong suốt qua trình từ năm 1977 đến 1997, ông đã có nhiều nghiên cứu và kết quả cống hiến cho lĩnh vực nén âm thanh theo chuẩn MP3: kỹ thuật mã hóa cảm nhận ASPEC, mã hóa cảm nhận âm thanh và cảm nhận âm học, định nghĩa hệ thống ISO/IEC MPEG lớp-3.
- Karlheinz Brandenburg đã nhận được nhiều bằng sáng chế trong lĩnh vực nén âm thanh số MP3.
- ĐẶC ĐIỂM MP3 MP3 là chuẩn nén âm thanh số.
- Nó được tối ưu hóa về cấu trúc tập tin, các dữ liệu dư thừa bị loại bỏ mà không làm mất thông tin.
- Kích thước tập tin nhỏ gọn, chất lượng âm thanh đáp ứng các nhu cầu sử dụng khác nhau.
- Sau đây là các đặc điểm cơ bản làm nên sự hữu dụng và tính phổ biến của tập tin MP3.
- Chuẩn nén âm thanh số lớp 3 MP3 là chuẩn âm thanh nén lớp 3 của MPEG1.
- Nó mang các đặc điểm cơ bản của âm thanh nén MPEG1 nhưng nó mang đặc trưng riêng của âm thanh nén thuộc Luận văn thạc sỉ Trần Thị Bích Hằng 10lớp 3.
- Đó là mức độ nén và độ phức tạp cao hơn so với các chuẩn nén âm thanh thuộc lớp 1 và 2.
- Tín hiệu âm thanh nén ở lớp 3 sử dụng bộ mã hóa Huffman.
- Dưới đây là bảng so sánh độ phức tạp của các bộ giải mã và mã hóa khác nhau đối với các lớp mã hóa âm thanh khác nhau.
- Lớp Độ phức tạp Bộ mã hóa Bộ giải mã I 1.5 – 3 1 II III > 7.5 2.5 Bảng 1: Độ phức tạp của bộ mã hóa và giải mã đối với các lớp của âm thanh MPEG Những ưu điểm của tín hiệu âm thanh nén thuộc lớp 3 so với lớp 1 và lớp 2.
- Lớp 3 sử dụng mã Huffman để mã hóa các mẫu lượng tử hóa cho việc nén dữ liệu tốt hơn.
- Sử dụng một bộ dữ trữ bit (bit reservoir): Dòng bit lớp 3 phù hợp hơn với độ dài thay đổi của dữ liệu được nén.
- Cũng giống như lớp 2, khung dữ liệu lớp 3 có 1152 mẫu.
- Lớp 3 không giống lớp 2 ở chỗ dữ liệu mã hóa không nhất thiết phải vừa vặn trong một khung cố định.
- Bộ mã hóa có thể lấy hoặc mượn các bit từ bộ dự trữ bit nếu cần thiết.
- Kỹ thuật mã hóa âm thanh stereo, được sử dụng để nâng cao chất lượng của một tín hiệu âm thanh lập thể nhờ sự kết hợp mã hóa của kênh trái và phải.
- MP3 cho phép mã hóa kết hợp giữa cường độ tín hiệu và âm thanh stereo.
- Điều này đặc biệt hữu ích đối với tín hiệu Luận văn thạc sỉ Trần Thị Bích Hằng 11âm thanh ở tốc độ bit thấp, nhưng ngược lại phải chịu nguy cơ thay đổi hình ảnh âm thanh.
- Stereo - Joint Stereo (Stereo) Mono là chế độ dùng cho âm thanh 1 kênh.
- Tín hiệu âm thanh được lưu trữ trên một kênh, người nghe chỉ cảm nhận được độ rõ nét và thông tin về âm thanh mà không thể cảm nhận được quang cảnh của âm thanh.
- Âm thanh stereo, khắc phục được các nhược điểm của âm thanh mono, giúp người nghe cảm nhận được quang cảnh không gian của âm thanh, nâng cao chất lượng âm thanh một cách rõ rệt.
- Chế độ Dual channel, tập tin âm thanh bao gồm hai kênh mono độc lập.
- Đầu ra các bộ giải mã tập tin âm thanh ở chế độ Dual channel có hai kênh nhưng hoàn toàn độc lập không thể thấy quang cảnh âm thanh như tập tin âm thanh stereo.
- Joint Stereo là chế độ mở rộng của stereo, số bít được mã hóa cho mỗi khung được quyết định một cách linh hoạt, để giảm đi những dữ liệu không cần thiết của tập tin.
- Joint stereo chia sẻ các bit kênh trái và kênh phải ở tần số cao.
- Điều này làm cải thiện đáng kể việc nén âm thanh stereo suy giảm ít.
- Các tần số thấp được xử lý như âm thanh stereo thông thường.
- Mã hóa âm thanh dựa trên mô hình cảm nhận âm học của con người Các thuật toán mã hoá âm thanh MP3 dựa trên mô hình mã hóa cảm nhận âm học của con người, dựa trên mô hình tiếp nhận âm thanh để tối ưu hiệu qủa quá trình mã hoá.
- Mô hình tiếp nhận âm thanh dựa trên các cảm nhận chính là tai người, sự cảm nhận âm thanh bị ảnh hưởng bởi tính chất che.
- Tâm lý của con người trong cảm nhận Luận văn thạc sỉ Trần Thị Bích Hằng 12âm học hay còn gọi là tâm lý âm học là lĩnh vực khoa học nghiên cứu và giải thích sự cảm nhận âm thanh của tai người đối với sự kích thích của nguồn âm.
- Các phương pháp mã hoá dựa trên cảm nhận âm học đều dựa vào các nguyên lý cơ bản của tâm lý âm học như: ngưỡng nghe, các băng tới hạn, hiện tượng che.
- Các phương pháp này loại bỏ các thành phần dư thừa không nghe được của tín hiệu âm thanh để giảm kích thước file dữ liệu trong quá trình nén.
- Các băng tới hạn Các nghiên cứu thực tế cho thấy tai người có thể cảm nhận được các nguồn âm có tần số từ 20 Hz đến 20KHz.
- Tai người được coi là 1 băng lọc (filter bank) gồm nhiều mạch lọc thông dải với các băng thông có độ rộng khác nhau, nó đặc trưng cho khả năng phân giải âm thanh của tai người.
- Các băng này được gọi là băng tới hạn, chúng có độ rộng thay đổi theo tần số từ thấp đến cao.
- Trên thực tế có 25 băng tới hạn được qui ước theo bảng các băng tới hạn dưới đây, mỗi băng có một tần số trung tâm f.
- Hàm sau đây cho phép chuyển từ dải tần số sang dải bark: z(f.
- 3.5arctan[(f/75000)2] (bark) băng tới hạn tần số trung tâm độ rộng (Hz) tần số dưới (Hz) tần số trên (Hz Luận văn thạc sỉ Trần Thị Bích Hằng Bảng 2: Bảng các băng tới hạn 3.
- Hiện tượng che Tai người có khả năng phân tích tần số theo thời gian, khả năng này tạo ra hiện tượng che đồng thời và hiện tượng che không đồng thời.
- Các hiện tượng này được ứng dụng trong các bộ mã hóa để xác định các thành phần dư thừa cần loại bỏ, không mã hóa chúng.
- Tín hiệu che các tín hiệu khác được gọi là các thành phần che (masker), các tín hiệu bị che thì gọi là các thành phần bị che (maskee).
- Thông số này rất quan trọng trong phương pháp mã hóa dựa trên mô hình cảm nhận âm học.
- Luận văn thạc sỉ Trần Thị Bích Hằng 14 Hình 1: Đường cong che (mặt nạ) âm thanh Hiện tượng che đồng thời xảy ra khi nhiều nguồn âm tác động vào tai người.
- Mặc dù phổ tần số âm thanh có thể chứa nhiều hiện tượng che đồng thời phức tạp, nhưng vì mục tiêu xác định các dạng mã hóa, ta chỉ cần quan tâm đến 3 loại che đồng thời : tạp âm che tín hiệu âm thanh, tín hiệu âm thanh che tạp âm, tạp âm che tạp âm.
- Một đặc điểm nữa của hệ thống thính giác của con người đó là thời gian cảm nhận âm thanh.
- Tai của con người phải mất một thời gian ngắn để cảm nhận, nên nó trở nên ít nhạy cảm với tần số thấp, thoáng qua.
- Các nghiên cứu trên (về tâm lý âm học) như: ngưỡng nghe, các băng tới hạn, hiện tượng che đã dẫn đến những hiểu biết quan trọng về cách thức hoạt động của hệ thống thính giác của con người.
- Điều này đã giúp chúng ta nhận ra rằng trong dữ liệu âm thanh có trong thực tế, rất nhiều dữ liệu mà con người không thể nghe thấy có thể bỏ đi mà không nhận thấy một sự khác biệt.
- Nếu tần số nằm ngoài phạm vi 20Hz đến 20KHz - Nếu có một tiếng động lớn và tiếng động nhỏ cùng lúc.
- Nếu có 2 âm thanh tương tự nhau.
- Biên độ Tần số Tín hiệu âm thanh lớn Khu vực tín hiệu âm thanh yếu hơn bị che phủ

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt