« Home « Kết quả tìm kiếm

Truy vấn thông tin trong tiếng nói tiếng Việt


Tóm tắt Xem thử

- Tuy nhiên cho đến thời điểm hiện tại ở nước ta, hệ thống truy vấn thông tin tiếng nói tiếng Việt vẫn còn đang ở giai đoạn nghiên cứu và chưa có hệ thống nào thực sự được xây dựng.
- Nghiên cứu lý thuyết, xây dựng thuật toán, và/để triển khai xây dựng phần mềm “truy vấn thông tin tiếng nói tiếng Việt”.
- Giới thiệu chung về lý thuyết nhận dạng, với trọng tâm mô hình Markov ẩn ứng dụng trong nhận dạng tiếng nói, và công cụ HTK toolkit hỗ trợ xây dựng hệ nhận dạng tiếng nói liên tục từ vựng lớn.
- Chương 2 Giới thiệu về kiến trúc chung của một hệ truy vấn thông tin tiếng nói và các yêu cầu khi xây dựng hệ thống này.
- 1 Chương 3 Trình bày chi tiết và cụ thể về xây dựng hệ truy vấn thông tin tiếng nói tiếng việt liên tục từ vựng lớn.
- Bao gồm việc xây dựng kho dữ liệu, tập các truy vấn phục vụ cho bài toán, việc xây dựng module nhận dạng tiếng nói và các thuật toán xử lý lưới lập chỉ mục thuận và ngược, thuật toán tìm kiếm trên kho chỉ mục.
- d) Phương pháp nghiên cứu - Nghiên cứu lý thuyết truy vấn thông tin tiếng nói, tìm hiểu và ứng dụng HTK toolkit vào xây dựng bộ nhận dạng - Tiến hành ghi âm để xây dựng kho dữ liệu tiếng nói dùng làm dữ liệu đầu vào cho hệ STD và hệ nhận dạng.
- Về sản phẩm của luận văn tốt nghiệp là chương trình truy vấn thông tin tiếng nói tiếng việt (được đặt tên là viSTD).
- TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI.
- Tín hiệu tiếng nói.
- Cơ chế tạo tiếng nói.
- Biểu diễn tín hiệu tiếng nói.
- Hệ thống nhận dạng tiếng nói sử dụng phương pháp nhận thống kê.
- Nhận dạng tiếng nói sử dụng mô hình markov ẩn.
- 19 1.5.1.Phân tích tham số tiếng nói.
- Quá trình nhận dạng tiếng nói liên tục theo mô hình Markov ẩn.
- Ứng dụng mô hình markov ẩn trong nhận dạng tiếng nói.
- Bộ nhận dạng.
- TỔNG QUAN VỀ HỆ THỐNG TRUY VẤN THÔNG TIN TIẾNG NÓI.
- Giới thiệu truy vấn tiếng nói.
- Mục đích của truy vấn tiếng nói.
- Kiến trúc chung của một hệ truy vấn tiếng nói.
- Kiến trúc một số hệ thống truy vấn tiếng nói trên thế giới.
- Hệ thống truy vấn thông tin tiếng nói IBM 2006.
- XÂY DỰNG HỆ THỐNG TRUY VẤN TIẾNG NÓI TIẾNG VIỆT 44 3.1.
- Sơ đồ tổng quan hệ thống truy vấn thông tin tiếng nói Tiếng Việt.
- Bộ trích chọn tham số tiếng nói.
- Xây dựng kho dữ liệu tiếng nói tiếng Việt phục vụ luận văn.
- Cơ sở dữ liệu tiếng nói.
- 67 4DANH MỤC CÁC TỪ VIẾT TẮT  STD- Speech Terms Detection: Truy vấn tiếng nói.
- ASR- Automatic Speech Recognision: hệ thống nhận dạng tiếng nói.
- 16 Hình 4: Biểu diễn tiếng nói trong miền thời gian.
- 17 Hình 7: Sơ đồ hệ thống nhận dạng tiếng nói theo phương pháp nhận dạng thống kê.
- 19 Hình 10: Trích chọn tham số tiếng nói.
- 31 Hình 23: Trích chọn thông tin tiếng nói sử dụng HCopy [10.
- 33 Hình 28: Xử lý nhận dạng tín hiệu tiếng nói đầu vào chưa biết [10.
- 33 6Hình 29: Kiến trúc chung của hệ truy vấn tiếng nói.
- 42 Hình 34: Kiến trúc hệ truy vấn tiếng nói tiếng Việt của luận văn.
- Ngày nay, tìm kiếm thông tin trên tiếng nói (Voice Based search) ngày càng nhận được sự quan tâm nhiều hơn.
- Điều này làm cho việc tiếp cận tự động hóa đánh chỉ mục và tìm kiếm tập các tài liệu tiếng nói trở nên rất khó khăn.
- Việc phiên dịch không chính xác các tài liệu tiếng nói dẫn tới lỗi trong việc tìm kiếm các tài liệu tiếng nói.
- Tuy nhiên, việc tìm kiếm thông tin tiếng nói lại trở nên hết sức khó khăn trên nguồn dữ liệu tiếng nói khổng lồ đó.
- cùng nhau đưa ra các giải pháp công nghệ và đánh giá kết quả, nhằm nâng cao chất lượng của hệ thống truy vấn tiếng nói (STD).
- Cho đến thời điểm hiện tại ở nước ta, hệ thống truy vấn thông tin tiếng nói tiếng Việt vẫn còn đang ở giai đoạn nghiên cứu và chưa có hệ thống nào thực sự được xây dựng.
- Nhu cầu tìm kiếm các thông tin trong dữ liệu tiếng nói đặc biệt là với tiếng nói tiếng Việt cũng ngày một ra tăng.
- Các file lưới sinh ra bởi module nhận dạng tiếng Việt sử dụng công cụ HTK Tóm tắt một số luận điểm cơ bản và đóng góp mới của tác giả Hệ thống truy vấn thông tin tiếng nói về mặt cơ bản gồm hai thành phần chính, đó là thành phần làm nhiệm vụ chỉ mục hóa dữ liệu và thành phần tìm kiếm.
- Về thành phần chỉ mục hóa dữ liệu, để thực hiện được nhiệm vụ này cần xây dụng hai module: module nhận dạng tiếng nói và module chỉ mục.
- Module nhận dạng tiếng nói được xây dựng sử dung công cụ HTK và được cấu hình để cho ra kết quả n giả thuyết nhận dạng tốt nhất (n-best.
- Về đóng góp mới của tác giả - Xây dựng tập mô hình âm học hỗ trợ nhận dạng các giọng tiếng nói miền Trung phát âm chuẩn.
- Nghiên cứu lý thuyết truy vấn thông tin tiếng nói, tìm hiểu các hệ thống truy vấn thông tin tiếng nói (Spoken Term Detection) trên thế giới đang được áp dụng.
- Tìm hiểu bộ công cụ hỗ trợ xây dựng hệ thống nhận dạng tiếng nói HTK, sử dụng HTK để phục vụ cho việc giải quyết bài toán truy vấn tiếng nói.
- Tiến hành ghi âm để xây dựng kho dữ liệu tiếng nói dùng làm dữ liệu đầu vào cho hệ STD và xây dựng hệ nhận dạng.
- Xây dựng phương án thực hiện cho hệ thống STD cho tiếng nói Tiếng Việt.
- TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI 1.1.
- Hiện nay, nhận dạng tiếng nói đã được ứng dụng khá phổ biến và tỏ ra hiệu quả.
- Những nghiên cứu về hệ thống nhận dạng tiếng nói tự động bằng máy đầu tiên được thực hiện vào những năm 50 của thế kỷ XX.
- Đến những năm 1970, nhận dạng tiếng nói đã đạt được những bước tiến đáng kể.
- 15Tại Việt Nam, trong những năm gần đây cũng đã có những đề tài xây dựng hệ thống nhận dạng tiếng nói liên tục dựa trên mô hình markov ẩn và đã thu được những kết quả khả quan.
- Các cách tiếp cận nhận dạng tiếng nói bằng thống kê bao gồm: sử dụng mô hình markov ẩn, mạng nơ-ron nhân tạo, sử dụng cơ sở tri thức, v.v..
- Tín hiệu tiếng nói Trước hết, để xây dựng thành công một hệ thống nhận dạng tiếng nói, ta cần tìm hiểu về tín hiệu tiếng nói, cơ chế phát âm và cảm nhận tiếng nói của con người.
- 16Một vấn đề của nhận dạng tiếng nói là “giả lập” quá trình của người nghe xử lý tiếng nói của người nói.
- Cơ chế tạo tiếng nói Tiếng nói được hình thành nhờ bộ máy phát âm của con người.
- Biễu diễn trong không gian 3 chiều Spectrogram (hình 6) Hình 4: Biểu diễn tiếng nói trong miền thời gian.
- ở pha nhận dạng, với file tiếng nói đầu vào rồi phân tích thám số đưa đến bộ nhận dạng, căc cứ trên mô hình thống kê, hệ thống sẽ cho kết quả tiếng nói nhận dạng được.
- Nhận dạng tiếng nói sử dụng mô hình markov ẩn Đây là một phương pháp cụ thể trong nhận dạng thống kê.
- Kết Phân tích tham số Tìm kiếm Nhận dạng Tín hiệu tiếng nói x(n) Chuỗi quan sát Chuỗi từ thích hợp nhất O1, O2.
- Hình 10: Trích chọn tham số tiếng nói.
- Tín hiệu tiếng nói đầu vào được phân chia thành các khung nhỏ.
- Phân tích tham số Nhận dạng Tín hiệu tiếng nói Chuỗi quan sát Chuỗi từ thích hợp nhất O1, O2.
- Huấn luyện mô hình âm học Mô hình âm học là một mô hình thống kê của âm thanh, nó được sử dụng để mô hình hóa một đơn vị tiếng nói.
- Ở các hệ thống nhận dạng tiếng nói thông dụng, mô hình âm học thường được sử dụng là mô hình HMM (Hidden Markov Model).
- Cơ sở dữ liệu tiếng nói gồm có các file âm thanh và các file văn bản có nội dung của file tương ứng.
- Dựa trên file văn bản và đặc trưng tiếng nói của file tương ứng, cùng với từ điển phát âm, bộ huấn luyện cho ra mô hình âm học của các phiên âm 221.5.4.
- Ứng dụng mô hình markov ẩn trong nhận dạng tiếng nói Mô hình Markov ẩn được dùng để mô hình hóa tín hiệu tiếng nói, và được áp dụng vào nhận dạng tiếng nói.
- Mô hình hóa đơn vị tiếng nói Mô hình mức từ (word): Mỗi từ tương ứng với một mô hình HMM, số lượng tham số của các mô hình khá lớn.
- Dữ liệu tiếng nói trực tiếp được hỗ trợ bời Haudio.
- Một khi tất cả các đoạn tiếng nói đã được xử lý.
- Hình 23 mô tả các tham số đầu và đầu ra của HCopy Hình 21: Trích chọn thông tin tiếng nói sử dụng HCopy [10].
- [10] Thử nghiệm hệ thống nhận dạng: Đầu vào là tín hiệu tiếng nói (WAV.
- hệ thống sẽ chuyển vê các file tham số mfcc và sau đó được nhận dạng : Hình 26: Xử lý nhận dạng tín hiệu tiếng nói đầu vào chưa biết [10].
- TỔNG QUAN VỀ HỆ THỐNG TRUY VẤN THÔNG TIN TIẾNG NÓI 2.1.
- Giới thiệu truy vấn tiếng nói 2.1.1.
- Khái niệm Truy vấn tiếng nói là tìm tất cả sự xuất hiện của một term (một dãy các từ ngắn liền kề nhau, và có ý nghĩa về mặt ngữ pháp) trong một cơ sở dữ liệu tiếng nói tương đối lớn.
- Các công việc cần thực hiện của hệ thống STD - Đánh chỉ mục cho tập dữ liệu tiếng nói cần khai thác thông tin.
- Một số lượng tương đối lớn các term tìm kiếm và các loại dữ liệu khác nhau (tiếng nói được ghi âm tại các môi trường khác nhau.
- Kết quả đầu ra của hệ thống STD Đối với mỗi term được tìm kiếm, hệ thống sẽ đưa ra danh sách các giả thuyết với thông tin về thời điểm bắt đầu và kết thúc của term được phát hiện trong tập dữ liệu tiếng nói truy vấn.
- 36Tspeech là tổng thời gian tính bằng giây của các file âm thanh trong kho dữ liệu tiếng nói.
- Kiến trúc chung của một hệ truy vấn tiếng nói Hình 27: Kiến trúc chung của hệ truy vấn tiếng nói 2.2.1.
- Kiến trúc một số hệ thống truy vấn tiếng nói trên thế giới Do nhu cầu tìm kiếm thông tin trên lượng dữ liệu tiếng nói khổng lồ ngày càng cao, viện tiêu chuẩn và công nghệ quốc gia của Mỹ (NIST) đã xây dựng một chương trình định giá (evaluation) ban đầu cho Truy vấn tiếng nói (Spoken Term Detection- STD).
- Tổng quan hệ thống Hình 28: Kiến trúc hệ STD của BNN - Byblos STT- Byblos Speech To Text: là hệ thống nhận dạng tiếng nói Byblos.
- Decider: Module quyết định, cụm từ được truy vấn có trong tập dữ liệu tiếng nói đã cho hay không.
- Hệ thống truy vấn thông tin tiếng nói IBM 2006 a.
- Để xây dựng văn bản đem phân tích và dùng để test hệ thống, ta căn cứ vào bộ dữ liệu tiếng nói dùng để test.
- Phần thử nghiệm: 9 nam, 1nữ, tổng thời gian ghi âm là 134,04 phút [bảng 11] Bảng thống kê cơ sở dữ liệu tiếng nói theo người nói được mô tả ở bảng 9.
- Với thời gian làm luận văn ngắn, cộng với còn nhiều bỡ ngỡ trong bước đầu tiếp cận với vấn đề về nhận dạng tiếng nói.
- Đề tài là xây dựng hệ thống truy vấn thông tin tiếng nói tiếng Việt, tuy nhiên đề tài này lại bao hàm trong đó 64một nội dung quan trọng khác đó là xây dựng hệ nhận dạng tiếng nói tiếng Việt liên tục từ vựng lớn và độc lập người nói.
- 65KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Luận văn này đã trình bày các nội dung liên quan mật thiết đến đề tài, đặc biệt luận văn đưa ra mô hình hệ thống và chi tiết các thuật toán để chỉ mục hóa và tìm kiếm thông tin trong hệ thống truy vấn thông tin tiếng nói tiếng Việt.
- Kiến nghị Việc xây dựng module nhận dạng tiếng nói, cụ thể hơn là việc xây dựng các mô hình âm học có ảnh hưởng lớn đến hiệu năng của hệ thống truy vấn thông tin tiếng nói nói chung và tiếng Việt nói riêng.
- Vì vậy cần phải có nhiều nghiên cứu triển khai các kỹ thuật nhằm xây dựng cho được một hệ nhận dạng tiếng nói tiếng Việt liên lục từ vựng lớn có độ chính xác cao.
- Vũ Quý Ngọc (2009), “Xây dựng hệ thống truy vấn thông tin trong tiếng nói tiếng Việt phát âm liên tục”, Đại học Bách khoa Hà Nội

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt