« Home « Kết quả tìm kiếm

Nhận dạng người nói


Tóm tắt Xem thử

- Trang 1/2 TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Nhận dạng người nói Tác giả luận văn: Cung Văn Minh Khóa: 2009 Người hướng dẫn: PGS.TS.
- Đặng Văn Chuyết Nội dung tóm tắt: a) Lý do chọn đề tài Tiếng nói là phương tiện trao đổi thông tin phổ biến nhất của con người.
- Nhận dạng người từ giọng nói hay nhận dạng người nói (speaker recognition) cùng với nhận dạng tiếng nói (speech recognition) là những lĩnh vực nhận dạng liên quan đến xử lý tiếng nói đang được quan tâm nghiên cứu hiện nay.
- Trước tình hình đó, luận văn đã chọn vấn đề nhận dạng người nói tiếng Việt để có thể ứng dụng vào thực tế hiện nay.
- Mục đích nghiên cứu của luận văn là nghiên cứu các kỹ thuật nhận dạng người nói có thể góp phần vào giải quyết các vấn đề liên quan tới nhận dạng người nói tiếng Việt ứng dụng trong thực tế hiện nay.
- c) Tóm tắt cô đọng các nội dung chính và đóng góp mới của tác giả Nội dung chính của luận văn bao gồm 4 chương: Chương 1: Giới thiệu lý thuyết âm thanh và tiếng nói.
- Trong chương này chúng ta đã tìm hiểu một cách chung nhất về tiếng nói.
- Chương 2: Lý thuyết về nhận dạng tiếng nói.
- Chương hai đưa ra cái nhìn tổng quan về lý thuyết nhận dạng tiếng nói: các tham số, phân tích các đặc trưng của tiếng nói.
- Đồng thời chương 2 còn đưa ra các mô hình nhận dạng tiếng nói: mô hình Markov, mô hình nơron nhân tạo với những ưu, nhược điểm của từng loại.
- Chương 3: Nhận dạng người nói bằng mạng nơ ron nhân tạo.
- chương này đã chỉ ra được quá trình nhận tiếng nói với các từ có trong từ điển: “không”, “một”, “hai”, “ba.
- Từ đó dựa vào các thông tin cơ bản của âm thanh người nói là Pitch và Formant để nhận dạng người nói dựa vào hệ thống từ điển các từ đã nhận dạng được.
- Luận văn sử dụng phương pháp phân tích phổ tần số âm thanh pitch, phổ tần số formant từ đó rút ra các trích chọn đặc trưng âm thanh của người nói rồi đưa vào hệ thống nhận dạng.
- Luận văn còn sử dụng mã dự báo tuyến tính LPC kết hợp hàm hiệu biên độ trung bình AMDF để huấn luyện mạng.
- e) Kết luận Với mục tiêu nghiên cứu và xây dựng hệ thống nhận dạng người nói.
- Luận văn đã đạt được một số kết quả chính sau: 1.
- Luận văn chỉ ra cho người đọc hiểu một cách chung nhất về tiếng nói.
- Luận văn chỉ ra cái nhìn tổng quan về lý thuyết nhận dạng tiếng nói: các tham số, phân tích các đặc trưng của tiếng nói.
- Và đưa ra các mô hình nhận dạng tiếng nói: mô hình Fujisaki, mô hình Markov, mô hình nơron nhân tạo với những ưu, nhược điểm của từng loại.
- Từ lý thuyết đã nêu ở trên và chương trình nhận dạng được xây dựng, chúng ta cũng có thể đưa ra một số kết luận như sau: Một là, luận văn chỉ ra được có thể dùng cả hai đặc trưng Pitch và Formant thì chương trình nhận dạng người nói mới đưa ra được kết quả tốt nhất.
- Hai là, luận văn chỉ ra được quá trình nhận tiếng nói với các từ có trong từ điển sẵn có.
- Chương trình nhận dạng sẽ có kết quả cao.
- Ba là, luận văn cũng chỉ ra để chương trình nhận dạng người nói có khả năng nhận dạng người nói tốt thì cần phải có các đặc điểm mong muốn sau đây: i.
- Khi chúng ta nói chuyện thì tiếng nói không được kiểm soát bởi người nói.
- Người nói khi nhận dạng không bị ảnh hưởng bởi vấn đề sức khỏe, tâm lý so với khi huấn luyện trước đó.
- Người nói tốt hơn hết là nên độc lập với môi trường nói.
- Phân biệt được tiếng nói với tiếng ồn gây ra bởi quá trình ghi âm.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt