« Home « Kết quả tìm kiếm

Nghiên cứu một số kỹ thuật khai phá dữ liệu XML ứng dụng trong thực hiện xử lý dữ liệu quan hệ


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN THẠC SỸ KHOA HỌC Tên đề tài: Nghiên cứu một số kỹ thuật khai phá dữ liệu XML ứng dụng trong thực hiện xử lý dữ liệu quan hệ.
- Nội dung tóm tắt: a) Lý do chọn đề tài Xuất phát từ bài toán thực tế về nhu cầu đồng bộ dữ liệu phân tán tại các đơn vị mà không làm ảnh hưởng tới kiến trúc cũng như hệ thống ứng dụng tại các địa điểm phân tán đó.
- Nội dung và yêu cầu cụ thể của bài toán như sau: Có 1 hệ thống phân tán được chia làm 3 cấp, sử dụng mạng diện rộng như sau.
- Tổng cục: Bao gồm các máy chủ chạy DB và các máy chủ chạy App, đầu ngày làm việc cán bộ nhận dữ liệu từ cấp Cục và Chi cục về qua phương thức truyền File và giao thức FTP từ ngày hôm trước.
- Cục: Bao gồm các máy chủ chạy DB và các máy chủ chạy App, đầu ngày làm việc cán bộ nhận dữ liệu từ cấp Chi cục về qua phương thức truyền File và giao thức FTP từ ngày hôm trước.
- Chi cục: Bao gồm các máy chủ chạy DB và các máy chủ chạy App, cuối ngày làm việc cán bộ sử dụng phương thức truyền File qua giao thức FTP lên cấp Cục và Tổng cục để đồng bộ dữ.
- Vấn đề đặt ra: Xây dựng một mô hình cho phép truyền nhận dữ liệu một cách tự động, hạn chế việc.
- Chức năng xây dựng cho phép tự động truyền nhận, đồng bộ dữ liệu, khi đường truyền gặp sự cố thì ngưng việc truyền nhận dữ liệu và tiếp tục truyền nhận dữ liệu khi thông suốt.
- Đảm bảo dữ liệu được đồng bộ tốt hơn (mục tiêu 5- 10 phút/ 1 lần) thay vì hàng ngày như hiện tại.
- Việc đồng bộ dữ liệu trong suốt với người sử dụng, hạn chế sử dụng nhiều tài nguyên, và chạy với yêu cầu thấp nhất về việc bổ xung, nâng cấp phần cứng.
- b) Mục đích nghiên cứu của luận văn Trên cơ sở hiểu biết của tác giả về XML và hệ quản trị cơ sở dữ liệu quan hệ, đề xuất giải pháp thực hiện các yêu cầu của bài toán.
- Chương 1: Tìm hiểu chung về XML: Giới thiệu chung về XML, lịch sử ra đời và các ứng dụng của XML trong các hệ thống công nghệ thông tin hiện nay.
- Chương 2: Khai phá dữ liệu XML: Giới thiệu các quy tắc tạo thành, cách biểu diễn dữ liệu XML.
- Cách sử dụng XPath để phân tích, xử lý dữ liệu trong một tài liệu XML.
- Chương 3: SQL Server và Dữ liệu XML: Giới thiệu về kiểu dữ liệu XML trong SQL Server, cách thức để tạo ra tài liệu XML và cách thức khai thác sử dụng dữ liệu trong tài liệu XML của hệ quản trị cơ sở dữ liệu SQL Server.
- Chương 4: Ứng dụng khai phá dữ liệu XML trong cơ sở dữ liệu quan hệ: Giới thiệu bài toán thực tế và một số phương pháp hiện tại dùng để giải quyết bài toán đó, phân tích ưu nhược điểm của phương pháp.
- Phân tích ưu nhược điểm của phương pháp và mô tả cụ thể cách thức thực hiện giải pháp.
- d) Phương pháp nghiên cứu Dựa trên hiểu biết của tác giả về hệ thống hiện tại ở một số các đơn vị trong nước, cũng như mô hình hiện tại của các nước đồng thời qua phân tích các mô hình truyền nhận dữ liệu trên thực tế.
- Đồng thời tính toán các khả năng tích hợp, mở rộng hệ thống trong tương lai.
- e) Kết luận Trước đây, các hệ thống công nghệ thông tin của nước ta hoạt động trong tình trạng nhỏ lẻ, đối với các hệ thống phát triển từ trước thì chủ yếu ở dạng cơ sở dữ liệu phân tán.
- Khi công nghệ phát triển đồng thời các yêu cầu ngày càng cao dẫn đến nhu cầu các hệ thống phải chạy ở dạng tập trung đồng thời cơ sở dữ liệu cũng cần phải tập trung lại, vì vậy phát sinh yêu cầu đồng bộ dữ liệu phân tán trước đây lại trong một hệ thống tập trung.
- Do nhiều lý do, các hệ thống của nước ta có từ trước hầu hết đều được phát triển trên nền hệ điều hành của Microsoft với hệ quản trị cơ sở dữ liệu chính là SQL Server.
- Để thực hiện được yêu cầu về đồng bộ, tập trung dữ liệu trên hệ quản trị cơ sở dữ liệu này có rất nhiều phương pháp như: Replication, DataMirror… Tuy nhiên các phương pháp đó đều có các yêu cầu rất cao trong việc cài đặt vận hành, bảo trì cũng như là vấn đề chi phí cho hạ tầng công nghệ.
- XML là một kiểu dữ liệu có thể tự định nghĩa cấu trúc, được phát triển bởi cộng đồng lập trình viên đông đảo và ngày càng cho thấy vai trò quan trọng của nó trong các hệ thống công nghệ thông tin.
- Nội dung đồ án này đề cập đến từ các khái niệm cơ bản về XML đến tới cách khai thác, sử dụng dữ liệu XML để phát triển các ứng dụng có tính ứng dụng cao trong thực tế, qua đó cho thấy vai trò của kiểu dữ liệu XML.
- Nội dung của đồ án này đề xuất một phương pháp giúp cho việc đồng bộ dữ liệu tiến được hành một cách dễ dàng, không yêu cầu cao về mặt hạ tầng truyền thông, việc cài đặt tiến hành dễ dàng không đòi hỏi trình độ cao đồng thời việc vận hành diễn ra hoàn toàn tự động không cần có sự can thiệp của con người.
- Tại thời điểm hiện tại, giải pháp này đã được ứng dụng trên thực tế trong việc đồng bộ dữ liệu của Ngành Hải quan, mô hình được triển khai bao gồm dữ liệu tại hơn 250 Chi cục được đồng bộ lên cấp Tổng cục Hải quan và 33 Cục Hải quan Tỉnh, Thành phố.
- Trong hơn 200 Chi cục Hải quan trên có rất nhiều nơi được đặt tại địa bàn sát biên giới hoặc vùng xa, hải đảo là những nơi có hạ tầng truyền thông kém, máy chủ lạc hậu, tuy nhiên hệ thống vẫn hoạt động rất ổn định.
- Đồ án này đã được áp dụng trong thời điểm hiện tại, tuy nhiên để phát triển và nâng cao hiệu năng của hệ thống thì còn cần thêm nhiều thời gian để đánh giá cũng như tìm hiểu nâng cấp hệ thống.
- Do đó trong thời gian tới, em rất mong nhận được sự đóng góp giúp đỡ của các thầy cô để hoàn thiện thêm hệ thống này.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt