« Home « Kết quả tìm kiếm

Nghiên cứu một số kỹ thuật khai phá dữ liệu XML ứng dụng trong thực hiện xử lý dữ liệu quan hệ


Tóm tắt Xem thử

- Bùi Ngọc Dũng NGHIÊN CỨU MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU XMLỨNG DỤNG TRONG THỰC HIỆN XỬ LÝ DỮ LIỆU QUAN HỆChuyên nghành: Đảm bảo toán học cho máy tính và hệ thống tính toán LUẬN VĂN THẠC SỸ KHOA HỌC ĐẢM BẢO TOÁN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TOÁN NGƯỜI HƯỚNG DẪN KHOA HỌC: 1.
- HUỲNH QUYẾT THẮNG Hà Nội - 2011 Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán LỜI CAM ĐOAN Kính gửi.
- Tôi xin cam đoan: Toàn bộ kiến thức và nội dung trong bài luận văn của tôi là các kiến thức tự nghiên cứu từ các tài liệu tham khảo trong và ngoài nước, không có sự sao chép hay vay mượn dưới bất kỳ hình thức nào để hoàn thành luận văn tốt nghiệp luận văn tốt nghiệp Cao học chuyên nghành Đảm bảo toán học cho máy tính và hệ thống tính toán.
- Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán MỤC LỤC LỜI CAM ĐOAN MỞ ĐẦU Chương 1.
- TÌM HIỂU CHUNG VỀ XML XML là gì Lý do ra đời của XML Ứng dụng của XML trong các hệ thống thông tin hiện đại Chương 2.
- KHAI PHÁ DỮ LIỆU XML Biểu diễn dữ liệu trong XML Tạo một tài liệu XML đúng cấu trúc Chỉ thị xử lý và ghi chú Không gian tên CDATA và thực thể tham chiếu XPath và xử lý tài liệu XML Biểu diễn XML trong XPath Đường dẫn trong XML Đường dẫn tuyệt đối Đường dẫn tương đối Đường dẫn và điều kiện Tập hợp và chỉ mục Từ khóa và các phép toán Từ khóa Phép toán sàng lọc (Filter Phép toán so sánh (Compare Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Phép toán hội (Union Các phép toán khác Chương 3.
- SQL SERVER VÀ DỮ LIỆU XML .
- SQL Server và kiểu dữ liệu XML .
- Khai phá dữ liệu XML trong SQL Server .
- Cách sinh ra một tài liệu XML trong SQL Server .
- Thao tác với dữ liệu XML trong SQL Server Chương 4.
- ỨNG DỤNG KHAI PHÁ DỮ LIỆU XML TRONG CƠ SỞ DỮ LIỆU QUAN HỆ Phát biểu bài toán Các giải pháp thực hiện Replication DataMirror Giải pháp đề nghị Thực hiện giải pháp Thực hiện Một số chú ý KẾT LUẬN TÀI LIỆU THAM KHẢO Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán MỞ ĐẦU Hiện nay, trong ngành Công nghệ thông tin, XML (eXtensible Markup Language) chiếm một vai trò rất quan trọng.
- Để thấy ảnh hưởng rộng lớn của XML trong ngành Công Nghệ Thông Tin ta chỉ cần để ý rằng XML chính là lý do của sự xuất hiện Microsoft.Net.
- Hãng phần mềm Microsoft đã đầu tư hơn 3 tỷ đô la Mỹ vào kỹ thuật này, và sau sự xuất hiện của XML trong WindowsXP thì các ứng dụng của Microsoft nếu không thể chuyển qua chạy trên nền .NET thì ít nhất cũng sẽ được chuyển thành dùng cho .NET được thông qua XML.
- Đi song song với .NET là SQLServer một cơ sở dữ liệu dần hổ trợ XML một cách hoàn toàn.
- Việc sử dụng Web Service cho phép ta có thể xây dựng các ứng dụng mà có thể kết nối trao đổi thông tin với nhau mà không cần phải đồng bộ hóa các ứng dụng này trên cùng một nền, trên cùng hệ điều hành.
- Các ứng dụng có thể được xây dựng bới nhiều loại ngôn ngữ lập trình khác nhau: .Net, Visual Basic, ASP, php, java..
- Trong khuân khổ của đồ án này, ngoài việc tập trung vào tìm hiểu về XML em tập trung vào nghiên cứu về ứng dụng của XML vào trong cơ sở dữ liệu SQLServer, đề xuất bài toán ứng dụng thực tế để khai phá dữ liệu XML trong cơ sở dữ liệu SQLServer trên mô hình WAN diện rộng mục tiêu đồng bộ dữ liệu từ các đơn vị cấp thấp lên các đơn vị cao hơn.
- Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Chương 1.
- XML là gì? XML là viết tắt của eXtensible Markup Language (Ngôn ngữ đánh dấu văn bản có thể mở rộng) là một bộ qui luật về cách chia một tài liệu ra làm nhiều phần, rồi đánh dấu và ráp các phần khác nhau lại để dễ nhận diện chúng.
- Ðược công nhận bởi W3C và trở thành một trong những chuẩn dữ liệu được sử dụng phổ biến nhất hiện nay.
- XML là ngôn ngữ xây dựng cấu trúc tài liệu văn bản, dựa theo chuẩn SGML (Standard Generalized Markup Language: siêu ngôn ngữ có khả năng sinh ngôn ngữ khác).
- SGML được phát triển cho việc định cấu trúc và nội dung tài liệu điện tử, do tổ chức ISO (International Organization for Standards) chuẩn hoá năm 1986.
- Lý do ra đời của XML Lý do ra đời của XML vì SGML rất rắc rối, và HTML có nhiều giới hạn nên năm 1996 tổ chức W3C thiết kế XML.
- Điểm quan trọng của XML là nó không thuộc riêng về một công ty nào mà là một sản phẩm mà trí tuệ của nó thuộc về cả thế giới, là một tiêu chuẩn được mọi người công nhận vì được soạn ra bởi World Wide Web Consortium - W3C (Một tổ chức độc gồm rất nhiều các chuyên gia soạn thảo ra các tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ) và các cá nhân muốn đóng góp thông qua trao đổi bằng Email.
- Bản thân của XML tuy không có gì khó hiểu, nhưng các công cụ chuẩn được Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán định ra để làm việc với XML như Document Object Model - DOM, XPath, XSL, v.v..
- Hiện nay MSXML đã có version 6.0 và gồm nhiều các modul trong đó nổi bật là: MSXML Parse (đọc và phân tích) và Validate (kiểm tra sự hợp lệ) của XML file.
- Ứng dụng của XML trong các hệ thống thông tin hiện đại Dưới sự tác động của Microsoft và các hãng lập trình hàng đầu, cũng như những người yêu thích công nghệ.
- Ngày nay, XML xuất hiện hầu như ở tất cả các hệ điều hành, ngôn ngữ lập trình, hệ quản trị cơ sở dữ liệu cũng như các ứng dụng phát triển.
- Từ sau hệ điều hành WindowsXP của Microsoft việc xuất hiện của XML càng phổ biến hơn, nó xuất hiện và được hỗ trợ tại hầu hết các ứng dụng nền của hệ điều hành, của các ứng dụng Plugin.
- Cho tới thời điểm hiện tại, các phần mềm được sử dụng nhiều của Microsoft mà tại đó ta đều thấy sự xuất hiện không thể thiếu của XML như: Microsoft Word, Microsoft Excel, InfoPath..
- Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Các hệ quản trị cơ sở dữ liệu quan hệ cũng nhận ra được vai trò to lớn của XML cụ thể như SQL Server đã bắt chấp nhận XML như một kiểu dữ liệu từ phiên bản SQL Server 2005 và cùng với kiểu dữ liệu là những cú pháp hỗ trợ cho việc khai phá dữ liệu XML ngay trên nền hệ quản trị cơ sở dữ liệu.
- Đến phiên bản SQL Server 2008 thì sự hỗ trợ càng trở nên rõ nét với việc tối ưu hóa về tốc độ cho kiểu dữ liệu cũng như các thao tác xử lý với kiểu dữ liệu XML.
- Ngoài ra còn rất nhiều các ứng dụng khác do các lập trình trên thế giới phát triển sử dụng cũng như hỗ trợ XML.
- Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Chương 2.
- KHAI PHÁ DỮ LIỆU XML 2.1.
- Biểu diễn dữ liệu trong XML 2.1.1.
- Tạo một tài liệu XML đúng cấu trúc Một tài liệu XML được gọi là có cấu trúc đúng khi nó tuân thủ đầy đủ các luật lệ về thẻ (Tag), phần tử (Element), thuộc tính (Attribute), giá trị (Value)… chứa bên trong để bộ phân tích có thể nhận diện.
- Có một phần tử gốc duy nhất gọi là Root Element hay Document Element nó chứa tất cả các phần tử khác trong tài liệu.
- Tại luật thứ nhất: tài liệu XML sau không đúng cấu trúc vì nó không có phần tử gốc: Chair Desk Tài liệu XML như trên được gọi là XML phân mảnh, muốn cho tài liệu này trở thành đúng cấu trúc ta phải đặt các phần tử vào trong một phần tử gốc, ví dụ: Chair Desk Tại luật thứ hai: Mỗi một thẻ mở phải có một thẻ đóng giống như nó, trường hợp một thẻ mà không có dữ liệu thì có thể viết ngắn gọn lại như sau như vậy tài liệu sau không đúng cấu trúc Helen Mooney Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Để tài liệu XML trên được đúng cấu trúc, ta cần có thẻ đóng cho thẻ đầu tiên.
- 2002-6-14 Helen Mooney 2 1 4 3 Tại luật thứ ba: Tên của thẻ có phân biệt chữ hoa chữ thường, như vậy OrderDate khác với Orderdate do đó tài liệu XML sau không đúng cấu trúc Graeme Malcolm Để tài liệu XML này trở thành đúng cấu trúc ta phải chuyển chữ d trong thẻ đóng thành D Graeme Malcolm Nghiên cứu một số kỹ thuật khai phá dữ liệu XML Ứng dụng trong thực hiện xử lý dữ liệu quan hệ Bùi Ngọc Dũng Đảm bảo toán Tại luật thứ bốn: Mỗi một phần tử con phải nằm trọn trong phần tử cha của nó, tức là không thể bắt đầu một phần tử mới khi chưa kết thúc một phần tử trước đó

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt