- Mô hình ngôn ngữ. - xut các ci tin vào nhn dng ting Vit nói. - Tạo mô hình ngôn ngữ. - Mô hình N-grams. - Language Model Mô hình ngôn ng. - xây dng mô hình ngôn ng thng kê. - Mô hình Markov ẩn. - Mô hình Markov ẩn (HMM. - u sn phm nghiên cu v nhn dng ting i dng mã ngun m, có th k n: 2 CMU Sphinx mã ngun m license BSD. - Julius mã ngun m license BSD cung cp nhn dng cho ngôn ng ting Nht. - Đối tƣợng nghiên cứu Nghiên cu tng quan v nhn dng ting Vit nóị Nghiên cu mô hình HMM, mô hình ngôn ng. - Nhiệm vụ nghiên cứu Tìm hiu khái quát v nhn dng ting nói và nhm ca ting Vit nóị Tìm hiu v mô hình HMM, mô hình ngôn ng. - tìm hiu mt s m v ting nói, m ca ting Vit nói, mô hình ngôn ng, các thành phn n ca mt h thng nhn dng ting nói hiu mt s h thng nhn d. - ngh mt s ci tin cho nhn dng ting Vit nóị Ị Cơ sở lý thuyết 1.1. - Các ng dng nhn dng ting nói ít khi. - vì vy nó to ra nhiu kh c thù cho nhn dng ting nóị 5 1.1.1. - Một số khó khăn gặp phải khi thực hiện nhận dạng tiếng nói Nhn dng ting nói có rt nhi. - S ng c ing n - là mt yu t ng ln khi thc hin nhn dng. - c t vng càng ln thì càng khó nhn dng. - ng: h thng nhn dng có th b. - chính xác ca h thng nhn dng. - B gii mã s dng c mô hình ngôn ng. - B thích nghi nhn thông tin t b gi i các tham s ca các mô hình âm hc, mô hình ngôn ng nhm nâng cao kt qu nhn dng. - Mô hình ngôn ng (Language Models. - Pháp u công trình nghiên cu nhn dng ti c kt qu tt. - cho phép i dùng có th nói nhng t khóa. - là h thng h tr h ng ting Vi n thoi, s dng công ngh nhn dng và tng hp bng ting Vit v. - Dch t ng: không cn phiên dch viên, h thng t nhn dng ting nói và chuyn sang ngôn ng tùy chn. - Ngoài ra nhn dng ti t các tác v n hình n ph. - tài là nhn dng ting nói Vit, do vy mc này s trình by ngn gn v h thng ting Vit. - Ðó là cách phát âm ca các âm ti nhng âm ti c dù trên ch vit, ph âm vng m c t i bu bng m. - Ting Vic nói bi các vùng min khác nhau, rng làm cho nhn dng tr. - Ngoài ra h thng ng c tp làm n chng nhn dng. - Mô hình ngôn ngữ 1.6.1. - mô hình ngôn ng ch có th tính toán g. - Các mô hình ngôn ng ng rt hiu qu vi. - Các h thng nhn dng ting nói này c t v. - Tầm quan trọng của mô hình ngôn ngữ Mô hình ngôn ng có tm quan trng rt ln trong các h thng nhn dng và tìm kim thông tin. - tin hành nhn dng ting Vit. - WER là t l nhn dng li, t l này càng th. - nhn dng các tên. - nhn d ụ D liu nhn dng là các t c lp. - tài s tin hành tích hp thanh u vào nhn dng. - V t t: Sphinx là công c nhn dng da trên xác su. - trình bc thc hin nhn dng ting nói bng công c Sphinx m ting Vi. - vào trong h thng nhn dng. - nhn dng. - thông tin khi nhn dng. - 18 c cui cùng là nhn dng: s dng mô hình ngôn ng, mô hình âm hc, Pocket. - tin hành nhn dng. - D liu nhn dng có th là nhng d li c hun luyn t c. - Sau khi nhn dng s c t l nhn dng l. - Nhng d liu này c hun luyn ti các hoàn c. - hun luyn: o Nhn dng d liu mi nói vi các t n: 1 gi. - nhn dng có thanh u, không thanh u hoc t t. - thng nhn dng ting nói khác, hong da trên hc nhng m (tham s) ca tp h. - Còn quá trình s dng nhng d liu (kin thc. - tín hiu gi là quá trình gi n gi là nhn dng. - Quá trình nhn dng có th dùng PocketSphinx hoc Sphinx. - o your_db_train.fileids lit kê nhng file âm thanh s hun luyn. - to mô hình ngôn ng ta s dng b CMULTK. - công c to mô hình ngôn ng thng kê. - tnh dng ARPẠ Tuy nhiên kt qu phc sp xp. - nhn dng (gii mã) các file âm thanh. - PocketSphinx là b nhn dng ting nói có th dùng trong nhin Bên cnh PocketSphinx ta có th. - H thng nhn dng da trên HMM: m. - Mô hình nhận dạng của PocketSphinx Th tc cn thit khi nhn dng bng PocketSphinx Hình 2.8.Thủ tục nhận dạng bằng PocketSphinx. - Sau khi có kt qu nhn dng ca PocketSphin. - Kt qu này nh dng ging file transcript phn hun luyn. - u vào quá trình mã hóa và nhn dng. - u vào mã hóa và nhn dng. - m bo vic nhn dng ting nói là khách quan. - tài chia d liu thành 2 tp: hun luyn và nhn dng. - t l nhn dng ụ Bn cht là th nghim là u - c ký hiu là ACNT-LMMN. - tài s th nghim vi nhn dng ting Vi u. - tài nên thc hin các th nghim nhn dng trên các mô hình ngôn ng khác nhau y khng công vic thc hin s rt l. - mt t l nhn dng caọ 3.6. - thng kê kt qu th nghim: nhn dng d liu VOV bng d liu hun luyn t thu âm. - nhn dng các file âm thanh ting Vit, bng các b nhn d. - ng pháp s dng, các thuc tính c i các h thng nhn dng khác. - T l nhn dng tt nhu i tin) vi t l li WER= 25,5. - T l nhn dng tt nht cho vic áp d. - T l nhn dng tt nht cho vic áp d t u WER = 19,2. - T l nhn dng tt nht cho vic áp d t u WER= 19. - nghim vic nhn dng ting nói vi ngun d liu hoàn toàn khác so vi d lin luyn. - là nhn dng ting âm c. - ging ca các vùng min nên khi nhn dng d liu ngu nhiên có th b ng. - u ca ting Vi. - c này s m bo h thng nhn dng có kh n dng nhng ging nói khác nhau trong các ng cnh khác nhau t. - Tích hp h thng nhn dng vào các h th. - gii quyt nhng v. - Vi thi gian thc hin nghiên cu v nhn dng ting Vit u nên chc ch. - vi nhng di tn s khác nhaụ Mô hình Markov n cho phép xây dng mt ki. - to nhng d liu nhỵ Nn tng ca nhn dng ting nói liên tc da trên mô hình Markov c thit t i các nhóm ti Carnegie Mellon và IBM, phòng thí nhim Bell Labs. - Ti nhng thm ri ru, h thng thc hin s i trng thái (có th quay tr li tr. - Mi quan h gia mô hình Markov vi ting nói Nguyên tc ca mt h thng nhn dng ting nói liên tc mô t. - C th b gii mã s tìm: Vì P(w|Y) khó tìm trc tip, áp dng lut Bayes nh bng mô hình ngôn ng. - Mô hình ngôn ng s c mô t. - Mô hình ngôn ngữ thống kê B.1. - Mô hình n kê grams
Xem thử không khả dụng, vui lòng xem tại trang nguồn hoặc xem
Tóm tắt