« Home « Kết quả tìm kiếm

Tích hợp đặc điểm của tiếng Việt vào hệ thống nhận dạng tiếng nói.


Tóm tắt Xem thử

- 1 TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Tích hợp đặc điểm của tiếng Việt vào hệ thống nhận dạng tiếng nói Tác giả luận văn: Đỗ Quốc Bình Khóa: 2012B Người hướng dẫn: TS.
- Nguyễn Hồng Quang a) Lý do chọn đề tài Trong khoa học máy tính nhận dạng tiếng nói là một quá trình chuyển những lời nói thành văn bản nó còn được biết đến một số các tên gọi “Tự động nhận tiếng dọng nói” hay “Máy tính nhận dạng tiếng nói” hay “Tiếng nói thành văn bản”.
- Nhận dạng tiếng nói có thể được ứng ụng ở nhiều lĩnh vực quan trong trong cuộc sống như y tế, quân sự và ứng dụng nhiều trong cuộc sống hàng ngày.
- Nhận dạng dọng nói đang được nhiều công ty lớn trên thế giới triển khai và áp dụng trong các sản phẩm thông minh phục vụ con người có thể kể đến Apple, Google.
- Ở Việt Nam ứng dụng nhận dạng dọng nói Việt còn hạn chế.
- Nguyễn Hồng Quang), mục đích là tạo ra CSDL văn bản từ đa âm tiết cho tiếng Việt.
- Sau đó sử dụng CMU SLM toolkit để tạo ra mô hình ngôn ngữ đa âm tiết  Tiến hành thực nghiệm huấn luyện và nhận dạng trên bộ cơ sở dữ liệu tiếng Việt nói đã xây dựng ở trên để đánh giá hiệu quả của các phương pháp đề xuất 2 c) Tóm tắt cô đọng các nội dung chính và đóng góp mới của tác giả Tiếng Việt là ngôn ngữ có thanh điệu ví dụ như có các dấu: huyền, hỏi, ngã,nặng, sắc đây là đặc điểm khác của tiếng Việt với các thứ tiếng thông dụng như Anh và Pháp.
- Ngoài ra tiếng Việt còn có những từ đa âm tiết có nghĩa là có những từ thường đi cùng cặp với nhau mới tạo thành ý nghĩa của từ ví du như các từ: “học sinh”, “sinh học.
- Đây là những đặc điểm rất riêng của tiếng Việt, vì vậy để tăng khả năng nhận dạng chính xác của tiếng Việt nói, đề tài đã thử nghiệm một số phương pháp tích hợp các đặc điểm của tiếng Việt nói vào hệ thống nhận dạng.
- Để tài ngoài việc thực hiện thu âm và đánh giá dữ liệu đa thu âm, đề tài còn thực hiện đánh giá tỷ lệ nhận dạng những dữ liệu trên đài tiếng nói Việt Nam(VOV) Ngoài ra đề tài còn thực hiện một số điều chỉnh một số tham số của hệ thống nhận dạng làm tăng tỷ lệ nhận dạng đúng của hệ thống một cách đáng kể.
- Phương pháp nghiên cứu thực tiễn.
- e) Kết luận Sau khi tiến hành các thực nghiêm có kết quả nhận dạng như sau.
- Tỷ lệ nhận dạng tốt nhất ban đầu với tỷ lệ lỗi WER= 25.5  Tỷ lệ nhận dạng tốt nhất cho việc áp dụng đơn âm có thanh điệu WER =25.5  Tỷ lệ nhận dạng tốt nhất cho việc áp dụng đa âm tiết không thanh điệu WER = 19.2  Tỷ lệ nhận dạng tốt nhất cho việc áp dụng đa âm tiết có thanh điệu WER= 19 Như vậy việc áp dụng kết hợp cả đa âm tiết và thanh điệu cho kết quả tốt nhất.
- Khả năng nhận dạng của hệ thống tăng lên 25.49%.
- Với thời gian nghiên cứu chưa được nhiều ngoài ra nhận dạng tiếng nói đòi hỏi phải thu thập rất nhiều dữ liệu để việc đánh giá cho chính xác đề tài cũng đã bước đầu có 3 một số thành công nhất định.
- Để tài hy vọng sẽ đóng góp một phần nhỏ trong việc nghiên cứu nhận dạng tiếng Việt nói và đưa nhận dạng tiếng Việt nói vào cuộc sống

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt