« Home « Kết quả tìm kiếm

Ứng dụng lý thuyết phi tuyến trong xử lý và nhận dạng tiếng Việt


Tóm tắt Xem thử

- 1 TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Ứng dụng lý thuyết phi tuyến trong xử lý và nhận dạng tiếng Việt.
- Tác giả luận văn: Phạm Hữu Biên Khóa: 2012B Người hướng dẫn: PGS.TS.
- Nguyễn Tiến Dũng Nội dung tóm tắt: a) Lý do chọn đề tài Từ những năm 50 của thế kỷ 20 ý tưởng về xây dựng các hệ thống nhận dạng tiếng nói đã được quan tâm nghiên cứu và đến ngày nay thì đã có một số kết quả nhất định.
- Các hệ thống đã có khả năng nhận dạng tương đối chính xác với dữ liệu vào là tiếng nói được phát âm rõ ràng.
- Tuy nhiên, đó là những kết quả đạt được với các ngôn ngữ không phải là tiếng Việt.
- Mặt khác, các hệ thống đó là tập hợp các kỹ thuật khác nhau và các phương pháp khác nhau, bao gồm cả lĩnh vực ngôn ngữ tự nhiên.Vì vậy việc tìm hiểu về các kỹ thuật phân tích tìm đặc trưng trong tiếng nói nhằm giúp nhận dạng cho tiếng Việt thực sự là cần thiết.
- Gần đây có một công cụ phân tích, xử lý tín hiệu phát triển mạnh và được áp dụng thành công cho nhận dạng tiếng nói tại Nhật, Anh,…đó là kỹ thuật xử lý tín hiệu phi tuyến.
- Với mong muốn tạo ra những bước phát triển trong lĩnh vực nhận dạng tiếng nói tiếng Việt và có thể dùng các kỹ thuật mới nhất để tìm ra các đặc trưng mới nâng cao kết quả nhận dạng cho hệ thống nhận dạng tiếng Việt Luận văn này đã được triển khai nhằm thực hiện mục đích trên.
- b) Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu.
- Mục đích nghiên cứu của luận văn là ứng dụng các kết quả trong lý thuyết về phi tuyến tính để tìm ra các đặc trưng phục vụ cho việc xử lý và nhận dạng các từ được phát ra từ con người trong tiếng Việt.
- Đối tượng nghiên cứu của đề tài là nhận dạng tiếng nói tiếng Việt.
- Phạm vi nghiên cứu của đề tài là các phương pháp nhận dạng tiếng nói, rút trích đặc trưng tiếng nói, mô hình Markov ẩn, tiếp đến là xây dựng mô hình Markov ẩn nhằm kiểm tra và đánh giá hiệu suất nhận dạng.
- Cơ sở và dữ liệu nhận dạng chỉ dừng lại ở tập dữ liệu gồm 10 chữ số tiếng Việt thu được từ 20 người.
- Bố cục của luận văn được chia làm 4 chương và tổ chức như sau: 2 Chương 1: Nghiên cứu tổng quan.
- Chương này giới thiệu tổng quan về tình hình nghiên cứu nhận dạng tiếng nói ở trong nước và các nước trên thế giới, lịch sử phát triển của nghiên cứu nhận dạng tiếng nói, giới thiệu một số kết quả nhận dạng tiếng nói sử dụng lý thuyết phi tuyến và giới hạn phạm vi nghiên cứu của luận văn.
- Chương 2: Cơ sở xử lý tiếng nói và các mô hình nhận dạng tiếng nói.
- Chương này giới thiệu mô hình tuyến tính sử dụng cho phân tích và tìm đặc trưng của các từ tiếng Việt cần nhận dạng, giới thiệu mô hình thống kê nhận dạng mẫu, xây dựng mô hình nhận dạng từ tiếng Việt sử dụng mô hình Markov ẩn.
- Chương 3: Phương thức xử lý tín hiệu phi tuyến tính và các phương pháp tìm vectơ đặc trưng trong không gian phi tuyến tính.
- Chương này giới thiệu các kết quả lý thuyết phi tuyến tính của Takens, trình bày phương pháp tách các đặc trưng trong không gian phi tuyến tính, xây dựng mô hình Markov ẩn cho nhận dạng từ tiếng Việt với các đặc trưng phi tuyến, trình bày phương pháp kết hợp đặc trưng được tách từ không gian phi tuyến và đặc trưng được tách từ phương thức xử lý tuyến tính thông thường.
- Xây dựng mô hình Markov ẩn cho các vectơ đặc trưng chung tìm được.
- Chương 4: Cài đặt chương trình nhận dạng tiếng nói và đánh giá kết quả.
- Chương này trình bày các kết quả nhận dạng tiếng nói với các đặc trưng tìm được trong không gian phi tuyến và các đặc trưng tìm được trong không gian phi tuyến kết hợp với đặc trưng MFCC, đồng thời đánh giá kết quả nhận dạng tiếng nói đã đạt được.
- Phần cuối của luận văn là kết luận và hướng phát triển của đề tài trình bày về các vấn đề luận văn đã làm được và các vấn đề cần phát triển sau luận văn.
- d) Phương pháp nghiên cứu.
- e) Kết luận Sau khi thực hiện nghiên cứu và xây dựng hệ thống nhận dạng tiếng Việt.
- Luận văn góp phần cung cấp một số đặc trưng mới cho hệ thống nhận dạng tiếng Việt và cung cấp cơ sở lý thuyết phi tuyến cho các hệ thống nhận dạng tiếng Việt về sau.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt