« Home « Kết quả tìm kiếm

Phát hiện và sửa lỗi chính tả Tiếng Việt


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Phát hiện và sửa lỗi chính tả tiếng Việt Tác giả luận văn: Vũ Thành Bút Khóa: 2015B Người hướng dẫn: PGS.TS.
- Lỗi chính tả xuất hiện là điều không thể tránh khỏi và có thể do nhiều nguyên nhân khác nhau: lỗi đánh máy, người soạn thảo không biết mình đang viết sai.
- Những lỗi sai này, người soạn thảo văn bản thường không hoặc khó có thể nhận ra lỗi chính tả của mình.
- Để phát hiện và sửa lỗi cho một văn bản có thể mất rất nhiều thời gian.
- Điều này đã dẫn nhu cầu phát hiện và sữa lỗi chính tả tự động cho nhiều ngôn ngữ trên các hệ soạn thảo văn bản khác nhau.
- Phát hiện và sửa lỗi chính tả văn bản tự động là vấn đề được nhiều cá nhân, đơn vị nghiên cứu và phát triển.
- Với tiếng Việt, hiện cũng đã có các công trình nghiên cứu và ứng dụng để giải quyết bài toán, tuy nhiên các ứng dụng sửa lỗi chính tả này chủ yếu sử dụng từ điển và các luật.
- Việc sử dụng thông tin ngữ cảnh vào việc sửa lỗi chính tả còn rất ít hoặc không đạt kết quả như mong đợi.
- Do đó, nghiên cứu và phát triển một ứng dụng phát hiện và sửa lỗi chính tả tiếng Việt sử dụng thông tin ngữ cảnh sẽ giúp cho việc sửa lỗi chính tả đạt hiệu quả cao hơn.
- Có hai loại lỗi chính tả tiếng Việt là lỗi sai âm tiết và lỗi sai từ vựng.
- Phạm vi của luận văn sẽ phát hiện và sửa loại lỗi thứ nhất.
- Trong chương này luận văn trình bày về các đặc điểm của tiếng Việt, các nguyên nhân gây ra lỗi chính tả, phân loại lỗi và bài toán về phát hiện và sửa lỗi chính tả.
- Trong chương 2 trình bày cơ sở lý thuyết về mạng nơ-ron nhân tạo, là cơ sở thực hiện xây dựng mô hình sửa lỗi chính tả trong luận văn.
- Chương 3 là “Ứng dụng RNN cho bài toán sửa lỗi chính tả tiếng Việt”.
- Chương này trình bày việc ứng dụng mạng nơ-ron đã nghiên cứu và mô hình cụ thể sử dụng cho bài toán sửa lỗi chính tả tiếng Việt.
- d) Phương pháp nghiên cứu.
- Sử dụng phương pháp nghiên cứu tài liệu, phương pháp xử lý dữ liệu.
- e) Kết luận Kiểm tra và sửa lỗi chính tả trong tiếng việt sử dụng RNN mở ra một hướng đi mới cho bài toán phát hiện và sửa lỗi chính tả tự động.
- Chính vì thế, việc chuẩn bị tập dữ liệu lớn và phong phú về mặt từ vựng là vô cùng cần thiết cho một mô hình sửa lỗi chính tả tự động tiếng Việt.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt