« Home « Kết quả tìm kiếm

Nhận dạng tiếng nói tiếng việt sử dụng mô hình chuỗi Markov ẩn và mạng nơ-ron


Tóm tắt Xem thử

- LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH: ĐO LƯỜNG VÀ CÁC HỆ THỐNG ĐIỀU KHIỂN NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT SỬ DỤNG MÔ HÌNH CHUỖI MARKOV VÀ MẠNG NƠ-RON NGUYỄN TUẤN HẢI Người hướng dẫn Luận văn: NGUYỄN QUỐC CƯỜNG Hà Nội, 2010 Lời cảm ơn Sau một thời gian nỗ lực nghiên cứu và thực hiện đề tài, với những vấn đề mới, tôi đã gặp rất nhiều khó khăn, nhưng với sự giúp đỡ rất nhiệt tình của các thầy cô giáo tôi đã hoàn thành được đề tài “Nhận dạng tiếng nói tiếng Việt sử dụng mô hình chuỗi Markov ẩn và mạng nơ-ron”.
- Nguyễn Quốc Cường lòng biết ơn sâu sắc, người đã trực tiếp hướng dẫn và giúp đỡ tôi tìm hiểu, tiếp cận với lĩnh vực nhận dạng tiếng nói.
- TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI I.1.
- NHẬN DẠNG TIẾNG NÓI I.2.
- CÁC PHƯƠNG PHÁP TIẾP CẬN TRONG NHẬN DẠNG TIẾNG NÓI I.2.1.
- Phương pháp nhận dạng mẫu.
- PHÂN TÍCH THAM SỐ TIẾNG NÓI II.1.
- PHÁT HIỆN ĐIỂM ĐẦU CUỐI CỦA TIẾNG NÓI II.1.1.
- Phát hiện điểm đầu cuối của tiếng nói.
- Bộ xử lý LPC áp dụng vào nhận dạng tiếng nói II.3.
- MẠNG NƠ-RON NHÂN TẠO III.1.
- MẠNG NƠ-RON NHÂN TẠO III.2.
- QUÁ TRÌNH HỌC CỦA MẠNG NƠ-RON CHƯƠNG IV.
- MÔ HÌNH CHUỖI MARKOV ẨN VÀ VẤN ĐỀ NHẬN DẠNG TIẾNG NÓI IV.1.
- MÔ HÌNH MARKOV ẨN.
- BA BÀI TOÁN CƠ BẢN ĐỐI VỚI MÔ HÌNH MARKOV ẨN IV.2.1.
- Bài toán 3: Ước lượng tham số mô hình IV.3.
- NHẬN DẠNG TIẾNG NÓI SỬ DỤNG MÔ HÌNH MARKOV CHƯƠNG V.
- MÔ HÌNH HYBRID KẾT HỢP MẠNG NƠ-RON VÀ MÔ HÌNH CHUỖI MARKOV ẨN V.1.
- DÙNG MẠNG NƠ-RON ƯỚC LƯỢNG XÁC SUẤT HẬU NGHIỆM V.2.
- CÁC MẠNG NƠ-RON NHƯ LÀ CÁC BỘ LƯỢNG TỬ HÓA VECTOR.
- Mạng nơ-ron cho việc lượng tử hóa véc tơ (VQ) dựa trên tiêu chuẩn tối đa hóa thông tin tương hỗ (MMI V.2.2.
- Các bộ gán nhãn nơ-ron (neural labelers V.3.
- SO SÁNH HAI MÔ HÌNH HYBRID CHƯƠNG VI.
- XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT VI.1.
- LỰA CHỌN MÔ HÌNH CHO BÀI TOÁN NHẬN DẠNG TIẾNG VIỆT VI.1.1.
- Hệ thống nhận dạng lời nói đề xuất VI.1.2.
- XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG VIỆT VI.2.
- Các kết quả nhận dạng với cơ sở DARPA RM độc lập người nói.50 Bảng 5.3.
- Kết quả nhận dạng với mô hinh HMM Bảng 5.6.
- Bảng 6.1.Kết quả kiểm tra trên 50 mẫu kiểm tra cho mỗi từ Lời nói đầu Trong những năm gần đây, việc áp dụng kỹ thuật xử lý tiếng nói, tổng hợp tiếng nói, nhận dạng tiếng nói trong mạng điện thoại ngày càng gia tăng nhanh chóng.
- Một trong các bài toán quan trọng có nhiều ứng dụng đó là nhận dạng mười chữ số phát âm liên tục thu âm trong mạng điện thoại.
- Đây là bài toán nhận dạng thuộc phạm vi nhận dạng các từ liên tục với số lượng từ vựng nhỏ.
- Có nhiều ứng dụng gắn với bài toán này như: nhận dạng số thẻ tín dụng bằng giọng nói, nhận dạng số tài khoản, nhận dạng mã số cá nhân, quay số bằng giọng nói,...Hiện trên thế giới đã có một số hệ thống nhận dạng tiếng nói cỡ lớn, có độ chính xác tương đối cao.
- Các hệ thống này chủ yếu phát triển trên nền công nghệ hiện đại với các máy tính lớn, các vi mạch xử lý tiếng nói chuyên dụng và sử dụng các cơ sở dữ liệu tiếng nói khá hoàn chỉnh.
- Đối với tiếng Việt, hiện tại việc nghiên cứu về nhận dạng tiếng nói nói chung cũng như nhận dạng tiếng nói thu âm qua điện thoại nói riêng còn vẫn đang ở bước đầu và chưa có nhiều kết quả được công bố.
- Từ thực tiễn trên, cuốn đồ án này được thực hiện nhằm đưa ra một số vấn đề cơ bản nhất khi chúng ta xây dựng một hệ nhận dạng tiếng nói và giới thiệu hướng tiếp cận mới trong nhận dạng tiếng Việt .
- Đó là sử dụng mạng nơ-ron nhân tạo cùng với các thuật toán học và khả năng phân loại mẫu rất mạnh có thể được kết hợp cùng với các phương pháp mô hình Markov ẩn (HMM).
- Cụ thể là sử dụng mạng nơ-ron như một bộ lượng tử hóa vector dữ liệu tiếng nói đưa vào mô hình HMM từ đó đưa ra kết quả nhận dạng.
- Nội dung đồ án được trình bầy như sau: Chương I, ở chương này giới thiệu về các khái niệm cơ bản trọng nhận dạng tiếng nói và các phương pháp tiếp cận trong nhận dạng tiếng nói.
- Chương II trình bày một số kỹ thuật phân tích đặc trưng tiếng nói.
- Các công cụ này đều rất quan trọng và được sử dụng trong kỹ thuật nhận dạng tiếng nói.
- Chương III đưa ra lý thuyết tổng quan về mạng nơ-ron.
- Nguyễn Tuấn Hải – Lớp cao học đo lường và các hệ thống điều khiển 2007-2009 Chương IV đề cập tới những khái niệm cơ bản của mô hình Markov ẩn và ứng dụng trọng nhận dạng tiếng nói.
- Chương V giới thiệu về các mô hình hybrid kết hợp giữa mạng nơ-ron và mô hình Markov ẩn trong nhận dạng tiếng nói.
- Chương VI trình bày về các bước xây dưng một chương trình nhận dạng tiếng nói dựa trên mô hình Hybrid, trong đó sử dụng mạng nơ-ron như một bộ lượng tử hóa vector cho mô hình markov ẩn.
- Tổng quan về nhận dạng tiếng nói Nguyễn Tuấn Hải – Lớp cao học đo lường và các hệ thống điều khiển CHƯƠNG I.
- NHẬN DẠNG TIẾNG NÓI.
- Nhận dạng tiếng nói là làm cho máy hiểu, nhận biết được ngữ nghĩa của lời nói.
- Các hệ thống nhận dạng tiếng nói có thể được phân thành các loại như sau.
- Nhận dạng các từ phát âm rời rạc/ liên tục.
- Nhận dạng tiếng nói phụ thuộc người nói/ không phụ thuộc người nói.
- Hệ thống nhận dạng có từ điển cỡ nhỏ

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt