« Home « Kết quả tìm kiếm

Nhận dạng người nói


Tóm tắt Xem thử

- 25 CHƯƠNG 2 - LÝ THUYẾT NHẬN DẠNG TIẾNG NÓI.
- Tổng quan lý thuyết nhận dạng lời nói.
- Nhận dạng (Pattern Recognition.
- Nhận dạng tiếng nói.
- Các nguyên tắc cơ bản trong nhận dạng tiếng nói.
- Quá trình nhận dạng tiếng nói.
- Các cách tiếp cận lý thuyết nhận dạng tiếng nói.
- Tiếp cận nhận dạng mẫu.
- Các phương pháp nhận dạng tiếng nói.
- Các khó khăn trong quá trình nhận dạng.
- Ngữ âm tiếng việt trong nhận dạng lời nói.
- Đặc trưng âm tiết tiếng việt trong nhận dạng tiếng nói.
- 52 CHƯƠNG 3 - NHẬN DẠNG NGƯỜI NÓI BẰNG MẠNG NƠ RON NHÂN TẠO.
- Lý thuyết nhận dạng và mạng nơ ron.
- Hướng tiếp cận của luận văn khi nhận dạng người nói bằng mạng nơ ron.
- Các bước tiến hành nhận dạng người nói.
- Nhận dạng người nói dùng mạng nơ-ron nhân tạo cùng phương pháp trích chọn đặc trưng dùng mã dự báo tuyến tính kết hợp AMDF để huấn luyện.
- Kết quả nhận dạng người nói.
- 67 CHƯƠNG 4 - XÂY DỰNG MÔ HÌNH NHẬN DẠNG NGƯỜI NÓI BẰNG MẠNG NƠ RON NHÂN TẠO.
- Giới thiệu Hàm và Toolbox trong Matlab cần để xây dựng Hệ thống Nhận dạng Người nói bằng mạng Neruon.
- Chương trình Nhận dạng.
- Kết quả nhận dạng.
- 23 Hình 2.1: Sơ đồ tổng quan của hệ thống nhận dạng.
- 27 Hình 2.2: Các phần tử cơ bản của hệ thống nhận dạng tiếng nói.
- 29 Hình 2.4: Các quá trình nhận dạng tiếng nói.
- 31 Hình 2.6: Sơ đồ khối nhận dạng tiếng nói theo âm học-ngữ âm.
- 34 Hình 2.7: Sơ đồ khối hệ nhận dạng tiếng nói theo cách tiếp cận trí tuệ nhân tạo.
- 66 Hình 4.1: Sơ đồ khối hệ thống nhận dạng người nói với từ điển cho sẵn bằng mạng nơron MLP trên môi trường Matlab.
- 82 Hình 4.6: Chương trình nhận dạng từ file.
- 82 Hình 4.7: Chương trình nhận dạng trực tiếp từ micro.
- Ma trận nhầm lẫn thu được khi nhận dạng với 2 người nam giới.
- Ma trận nhầm lẫn thu được khi nhận dạng với 3 người.
- Ma trận nhầm lẫn thu được khi nhận dạng với 4 người.
- Trong khi nhận dạng tiếng nói dựa trên thông tin ngữ nghĩa thì nhận dạng người nói lại dựa vào các thông tin riêng của giọng nói.
- Nhận dạng người nói cũng đã được nghiên cứu thử nghiệm trên các ngôn ngữ đơn âm tiết như tiếng Trung, tiếng Thái [13].
- Chương trình nhận dạng sẽ có kết quả cao.
- Nguyên âm Các nguyên âm có tầm rất quan trọng trong nhận dạng tiếng nói.
- Đây là tiêu chí quan trọng nhất để nhận dạng người nói.
- Từ những đặc trưng này sẽ tạo cơ sở để nhận dạng người nói.
- Trang 26/92 CHƯƠNG 2 - LÝ THUYẾT NHẬN DẠNG TIẾNG NÓI 2.1.
- Tổng quan lý thuyết nhận dạng lời nói 2.1.1.
- Hình vẽ 1 cho ta sơ đồ của hệ thống nhận dạng.
- Hình 2.1: Sơ đồ tổng quan của hệ thống nhận dạng 2.1.2.
- Nhận dạng tiếng nói Nhận dạng tiếng nói là một hệ thống tạo khả năng để máy nhận biết ngữ nghĩa của lời nói.
- Hình 2.2: Các phần tử cơ bản của hệ thống nhận dạng tiếng nói Các hệ thống nhận dạng tiếng nói có thể được phân loại như sau.
- Nhận dạng từ phát âm rời rạc/liên tục.
- Trang 28/92 • Nhận dạng tiếng nói phụ thuộc người nói/không phụ thuộc người nói.
- Nhận dạng tiếng nói trong môi trường có nhiễu thấp/cao.
- Nhận dạng người nói.
- Trong hệ nhận dạng tiếng nói với cách phát âm rời rạc có khoảng lặng giữa các từ trong câu.
- Trong hệ nhận dạng tiếng nói liên tục không đòi hỏi điều này.
- Tùy thuộc vào quy mô và phương pháp nhận dạng, ta có các mô hình nhận dạng tiếng nói khác nhau.
- Hình trên là mô hình tổng quát của một hệ nhận dạng tiếng nói điển hình.
- Giọng nói mỗi người có các đặc trưng khác nhau do đó các nghiên cứu về nhận dạng tiếng nói dựa trên 3 nguyên tắc cơ bản.
- Nhận dạng tiếng nói là một quá trình nhận thức.
- Sự cải tiến của các phương pháp này sẽ dẫn tới nâng cao năng lực nhận dạng của các hệ thống nhận dạng tiếng nói.
- Hai phương pháp trích chọn đặc trưng tiếng nói đang được sử dụng rộng rãi trong các hệ thống nhận dạng hiện nay: MFCC ( melscale frequency cepstral coefficients) và PLP ( Perceptual Linear Prediction).
- Đối với hệ thống nhận dạng tiếng nói lớn, phương pháp này gặp khó khăn trong tổng quát hóa sự đa dạng của tín hiệu tiếng nói.
- Mô hình Markvo ẩn được nghiên cứu rộng rãi gần đây như là một công cụ mạnh được áp dụng thành công trong nhận dạng tiếng nói.
- Đa số các hệ thống nhận dạng tiếng nói đều dùng mô hình Markov ẩn.
- Mạng neuron truyền thẳng đa lớp perceptron thường được sử dụng trong nhận dạng tiếng nói.
- Trong các hệ thống nhận dạng với kích thước lớn hiện nay.
- Các cách tiếp cận lý thuyết nhận dạng tiếng nói Trang 34/92 Có 3 cách tiếp cận tiếng nói.
- Tiếp cận âm thanh-ngữ âm - Tiếp cận nhận dạng mẫu - Tiếp cận trí tuệ nhân tạo 2.4.1.
- Bước 2 : nhận dạng tiếng nói.
- Cố gắng xác định một từ hợp lệ (hay chuỗi từ hợp lệ) từ một chuỗi các nhãn ngữ âm thu được tử bước 1 dựa trên cơ sở các ràng buộc (về từ vững và cú pháp) của tác vụ cần nhận dạng tiếng nói.
- Đặc điểm của phương pháp nhận dạng tiếng nói theo hướng tiếp cận Âm học-Ngữ âm học.
- Trích chọn đặc trưng: Tín hiệu tiếng nói được phân tích thành chuỗi các số đo để xác định mẫu nhận dạng.
- Nhận dạng: Các mẫu tiếng nói được đưa tới khối phân loại mẫu.
- Điều này làm đơn giản hóa hệ thống so với phương pháp nhận dạng ngữ âm.
- Có nhiều cách khác nhau để tổng hợp các nguồn kiến thức vào bộ nhận dạng tiếng nói.
- Các phương pháp nhận dạng tiếng nói 2.5.1.
- Các khó khăn trong quá trình nhận dạng 2.6.1.
- Chúng tôi thực hiện tách âm tiết theo hướng vừa nhận dạng vừa tách.
- Đây là nguyên nhân đầu tiên gây lỗi khi tiến hành nhận dạng người nói.
- Điều nay thường chỉ xảy ra trong giám định pháp lý nhận dạng người nói.
- Ngữ âm tiếng việt trong nhận dạng lời nói 2.7.1.
- Vấn đề là vận dụng các đặc trưng ngữ âm tiếng Việt trên cho giám định nhận dạng người nói bằng phương pháp nghe - phân tích phổ âm thanh như thế nào.
- Để giải quyết vấn đề này, cần xem xét các tham số tiếng nói nào được sử dụng trong nhận dạng người nói.
- Trang 53/92 CHƯƠNG 3 - NHẬN DẠNG NGƯỜI NÓI BẰNG MẠNG NƠ RON NHÂN TẠO 3.1.
- Trong khuôn khổ bài báo này tác giả mong muốn được thảo luận về 1 phương pháp nhận dạng tiếng nói sử dụng mạng nơ ron với.
- Lý thuyết nhận dạng và mạng nơ ron 3.3.2.
- Hướng tiếp cận của luận văn khi nhận dạng người nói bằng mạng nơ ron 3.4.1.
- Nhìn chung, kết quả nhận dạng người nói (speaker recognition) có thể được chia thành nhận dạng người nói (speaker identification) (Ai đang nói.
- Ngoài ra, nhận dạng người nói có thể nhận dạng trong môi trường độc lập ngữ cảnh (người nói luôn luôn nói trong một môi trường khép kín rồi được sử dụng cho đào tạo, huấn luyện).
- Hoặc nhận dạng người nói trong môi trường phụ thuộc ngữ cảnh (người nói từ bên ngoài môi trường sau đó đưa vào đào tạo, huấn luyện).
- Nhìn chung, formants là tốt nhất cho nhận dạng người nói cá nhân và nhận dạng tiếng nói.
- Đối với nhận dạng phụ thuộc văn bản (từ điển) cho sẵn.
- Sau đó đưa vào mạng nơ-ron nhận dạng tiếng nói để nhận dạng.
- Đối với nhận dạng không phụ thuộc văn bản (từ điển) cho sẵn.
- Nhận dạng người nói dùng mạng nơ-ron nhân tạo cùng phương pháp trích chọn đặc trưng dùng mã dự báo tuyến tính kết hợp AMDF để huấn luyện 3.4.1.
- Hiện nay mạng MLP được sử dụng rộng rãi trong các hệ thống nhận dạng tiếng nói.
- Ưu điểm của mạng neuron trong nhận dạng người nói.
- Kết quả nhận dạng người nói Đưa ra kết quả sau khi nhận dạng với xác suất xảy ra.
- Trang 68/92 CHƯƠNG 4 - XÂY DỰNG MÔ HÌNH NHẬN DẠNG NGƯỜI NÓI BẰNG MẠNG NƠ RON NHÂN TẠO 4.1.
- Quá trình thực hiện chương trình Nhận dạng tiếng nói là một lĩnh vực tuy không mới nhưng vô cùng phức tạp.
- Các bước chính Hệ thống nhận dạng mười chữ số tiếng Việt được xây dựng với các đặc trưng như sau.
- Phương pháp: nhận dạng từ đơn (isolate word recognition).
- Output: chữ số được nhận dạng trong file đầu vào.
- Sơ đồ khối hệ thống nhận dạng tiếng nói các chữ số tiếng Việt bằng mạng nơron MLP trên môi trường Matlab được mô tả trong hình 6.1

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt