« Home « Kết quả tìm kiếm

Trích rút thông tin từ Hồ sơ nghiệp vụ Công an nhân dân.


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN THẠC SĨ Đề tài: Trích rút thông tin từ Hồ sơ nghiệp vụ Công an nhân dân.
- Trong những năm gần đây, bài toán trích rút thông tin trong các tài liệu tiếng Việt nổi lên như là một vấn đề thách thức thuộc lĩnh vực xử lý ngôn ngữ tự nhiên của con người.
- Nhận dạng thực thể là một bài toán con, đồng thời là bài toán đơn giản nhất của bài toán trích rút thông tin, nhằm hướng tới nhận dạng chính xác và đầy đủ tên các thực thể xuất hiện trong các văn bản, hồ sơ tài liệu liên quan nhằm giúp quá trình tìm kiếm các thông tin có giá trị ẩn giấu sau các hồ sơ tài liệu một cách nhanh chóng và đạt hiệu quả cao.
- Xuất phát từ thực tế khối lượng hồ sơ nghiệp vụ của Công an nhân dân (CAND) các cấp ngày càng lớn, số lượng ngày càng nhiều, công việc thủ công của cán bộ làm công tác hồ sơ nghiệp vụ không đáp ứng được yêu cầu việc khai thác sử dụng hồ sơ phục vụ cho công tác đảm bảo an ninh chính trị và giữ gìn trật tự an toàn xã hội.
- Bởi tầm quan trọng của việc nhận dạng thực thể trong các tài liệu văn bản tiếng Việt đã được nhiều nhà nghiên cứu khoa học tìm hiểu khá lâu và có khá nhiều các công cụ sẵn có để hỗ trợ như các từ điển, các kho ngữ liệu, các thuật toán hiệu quả.
- Vì vậy tôi chọn đề tài “Trích rút thông tin từ hồ sơ nghiệp vụ Công an nhân dân” để một phần hỗ trợ cho công việc của mình đang thực hiện.
- Mục đích nghiên cứu, đối tượng, phạm vi áp dụng.
- Mục đích: Luận văn tập trung nghiên cứu và nắm rõ các khái niệm cơ bản về thực thể, bài toán nhận dạng thực thể trong các tài liệu văn bản tiếng Việt, các hướng tiếp cận cũng như áp dụng các mô hình, phương pháp để giải quyết bài toán trích rút thông tin từ hồ sơ nghiệp vụ Công an nhân dân.
- Nghiên cứu, tìm hiểu các kiến thức có liên quan về các loại thực thể, bài toán nhận dạng, nhận dạng tên thực thể có sẵn hiện nay.
- Áp dụng các hướng tiếp cận vào bài toán nhận dạng được nhiều thực thể đáng quan tâm từ hồ sơ nghiệp vụ Công an nhân dân.
- Xây dựng bộ dữ liệu, đề xuất mô hình sử dụng phần mềm áp dụng trong thực tế việc nhận dạng thực thể từ hồ sơ nghiệp vụ Công an nhân dân.
- Phân tích, đánh giá, so sánh kết quả đạt được khi thực hiện mô hình nhận dạng thực thể với các bộ dữ liệu thử đơn giản rút ra từ hồ sơ nghiệp vụ.
- Triển khai thực nghiệm với bộ dữ liệu từ hồ sơ nghiệp vụ Công an nhân dân.
- Đối tượng, phạm vi áp dụng Nghiên cứu các đặc điểm, đặc trưng của hồ sơ nghiệp vụ Công an nhân dân.
- Luận văn đã nghiên cứu về lý thuyết của nhận dạng thực thể, xây dựng chương trình, mô hình ứng dụng khai thác, sử dụng tập dữ liệu xây dựng thủ công từ hồ sơ nghiệp vụ CAND, cài đặt chạy thử nghiệm trong thực tế, có độ đo được đánh giá có hiệu quả so với các phương pháp khác.
- Là cơ sở cho sự phát triển sâu hơn về bài toán nhận dạng thực thể, phục vụ cho công việc thực tế hàng ngày của cán bộ khai thác, sử dụng hồ sơ nghiệp vụ CAND.
- Phương pháp nghiên cứu.
- Tổng hợp các tài liệu lý thuyết về nhận dạng thực thể.
- Biểu diễn bài toán nhận dạng thực thể trong thực tế bằng cơ sở dữ liệu được rút ra từ hồ sơ nghiệp vụ CAND.
- Phương pháp nghiên cứu thực nghiệm: Phân tích, thiết kế hệ thống theo quy trình nhận dạng thực thể.
- Xây dựng hệ thống cơ sở dữ liệu đánh giá và mô hình áp dụng.
- Thử nghiệm hệ thống, đánh giá kết quả dựa trên bộ dữ liệu thực tế từ hồ sơ nghiệp vụ CAND.
- Kết luận - Về mặt lý thuyết, luận văn đã trình bày được nội dung sau: Giới thiệu tổng quan nhận dạng thực thể và khả năng áp dụng trong thực tế.
- Xây dựng mô hình áp dụng nhận dạng thực thể từ các cách tiếp cận khác nhau nhằm trích rút thông tin từ hồ sơ nghiệp vụ CAND.
- Về mặt thực nghiệm, luận văn tiến hành xây dựng các cơ sở dữ liệu nêu trong phần lý thuyết.
- Kết quả đạt được cho thấy: Mô hình nhận dạng được các thực thể đáng quan tâm, có độ đo F đảm bảo tính khả quan, đáp ứng yêu cầu đặt ra.
- Dữ liệu đầu ra có thể xuất ra được các tệp định dạng khác nhau như Word, các trường dữ liệu khác nhau…Do tính bí mật của ngành nên việc xây dựng bộ dữ liệu thực nghiệm còn hạn chế, mô hình áp dụng vẫn thể hiện tính khả thi

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt