« Home « Kết quả tìm kiếm

Tóm tắt văn bản Tiếng Việt.


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Tóm tắt văn bản Tiếng Việt Tác giả luận văn: Mai Thị Thảo Khóa:2012A Người hướng dẫn: PGS.TS Lê Thanh Hương Nội dung tóm tắt: a) Lý do chọn đề tài Tóm tắt văn bản là quá trình chắt lọc những thông tin quan trọng nhất từ một nguồn để tạo ra một bản ngắn gọn hơn đáp ứng các nhiệm vụ cụ thể và người dùng cụ thể.
- Tóm tắt văn bản làm nhiệm vụ chọn ra các câu hàm chứa ý chính, các câu quan trọng nên về bản chất nó thuộc lĩnh vực của Khai phá văn bản.
- Tuy nhiên trong quá trình chắt lọc, rút gọn thì cần có sự áp dụng của các phương pháp Xử lý ngôn ngữ tự nhiên nếu muốn kết quả ra là một văn bản dễ đọc, dễ hiểu và mang ý nghĩa ngôn ngữ tự nhiên như đầu vào của nó.
- Trên thế giới đã có rất nhiều các ứng dụng Tóm tắt văn bản, với những mục đích nghiên cứu cũng như thương mại.
- Nhưng với những khó khăn và thách thức riêng, Tóm tắt văn bản hiện chưa được nghiên cứu nhiều ở Việt Nam.
- Chính vì lý do này chúng tôi đã chọn Tóm tắt văn bản tiếng Việt là đề tài khóa luận, mong muốn góp một phần công sức cho sự phát triển của Khai phá văn bản tiếng Việt nói riêng và Công nghệ thông tin Việt Nam nói chung.
- Tìm hiểu cơ sở lý thuyết của Tóm tắt văn bản nói chung và tóm tắt đơn văn bản nói riêng.
- Nghiên cứu phương pháp tóm tắt văn bản tiếng Việt - Xây dựng hệ thống tóm tắt văn tiếng việt Đối tượng.
- Phạm vi: Nghiên cứu trong phạm vi đơn văn bản c) Tóm tắt cô đọng các nội dung chính và đóng góp mới của tác giả Nội dung của luận văn được trình bày theo 4 chương với các nội dung cụ thể như sau: Chương 1: Tổng quan về bài toán TTVB Trình bày về các khái niệm cơ bản của TTVB nói chung.
- Chương 2: Bài toán tóm tắt đơn văn bản và các phương pháp tóm tắt văn bản Tiếng Việt Trình bày qúa trình tóm tắt văn bản, các hướng tiếp cận cho việc giải quyết bài toán tóm tắt đơn văn bản.
- Chương 3: Xây dựng hệ thống tóm tắt trích rút đơn văn bản tiếng Việt Trình bày chi tiết về hệ thống tóm tắt trích rút đơn văn bản tiếng Việt gồm: Mô hình hệ thống, các giai đoạn xử lý, cấu trúc chương trình.
- c) Phương pháp nghiên cứu.
- “Tóm tắt văn bản tiếng Việt” sử dụng phương pháp thống kê dựa trên TF.ISF tính trọng số câu kết hợp với mô hình không gian vector.
- d) Kết luận Với ý tưởng tóm tắt văn bản theo tỉ lệ được chọn.Tôi đã xây dựng phần mềm tóm tắt giúp cho quá trình đọc các tài liệu nhanh hơn và người dùng tập trung vào trọng tâm các ý chính của văn bản thay vì mất hàng giờ đọc tài liệu.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt