intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Đề tài nghiên cứu khoa học cấp trường: Xây dựng bộ siêu dữ liệu ứng dụng để tự động tạo các báo cáo thống kê kết xuất với cơ sở dữ liệu

Chia sẻ: Bobietbay | Ngày: | Loại File: PDF | Số trang:35

27
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục đích nghiên cứu của đề tài nhằm nghiên cứu siêu dữ liệu mô tả cho bài toán tự động tạo báo biểu kết xuất với cơ sở dữ liệu và các kỹ thuật xử lý XML với C# để giải quyết bài toán đã nêu.

Chủ đề:
Lưu

Nội dung Text: Đề tài nghiên cứu khoa học cấp trường: Xây dựng bộ siêu dữ liệu ứng dụng để tự động tạo các báo cáo thống kê kết xuất với cơ sở dữ liệu

  1. TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN THUYẾT MINH ĐỀ TÀI NCKH CẤP TRƯỜNG ĐỀ TÀI XÂY DỰNG BỘ SIÊU DỮ LIỆU ỨNG DỤNG ĐỂ TỰ ĐỘNG TẠO CÁC BÁO CÁO THỐNG KÊ KẾT XUẤT VỚI CƠ SỞ DỮ LIỆU Chủ nhiệm đề tài: TS. TRẦN THỊ HƯƠNG Thành viên tham gia: K.S Nguyễn Cao Văn Hải Phòng, tháng 05 /2015
  2. Thuyết minh đề tài NCKH Error! Reference source not found. Mục lục Mở đầu ............................................................................................................................ 5 Chương 1. Cơ sở lý thuyết về siêu dữ liệu ..................................................................... 7 1.1. Giới thiệu về siêu dữ liệu. ............................................................................... 7 1.2. Mục đích của siêu dữ liệu. .............................................................................. 7 1.3. Cấu trúc của siêu dữ liệu. ............................................................................... 7 1.4. Tạo siêu dữ liệu. .............................................................................................. 8 1.5. Ứng dụng siêu dữ liệu để tạo liên kết động................................................... 8 Chương 2. Xây dựng các bộ siêu dữ liệu .................................................................... 9 2.1. Cấu trúc của báo biểu....................................................................................... 9 2.2. Các nguyên tắt thiết kế báo biểu ......................................................................... 9 2.3. Ứng dụng siêu dữ liệu để tạo báo biểu ............................................................. 12 2.3.1. Siêu dữ liệu mô tả cho quan hệ và thuộc tính của quan hệ trong cơ sở dữ liệu. ................. 12 2.3.2. Siêu dữ liệu mô tả cho cột dữ liệu. ...................................................................................... 13 2.3.3. Siêu dữ liệu mô tả báo biểu ................................................................................................. 13 2.3.4. Siêu dữ liệu mô tả thành phần báo biểu kết xuất ................................................................ 14 Chương 3. Các kỹ thuật xử lý XML với C# ................................................................. 15 3.1. XML ............................................................................................................... 15 3.1.1. Tài liệu XML từ một cấu trúc cây: ............................................................................ 15 3.1.2. Các yếu tố trong XML ................................................................................................ 16 3.1.3. Các thuộc tính trong XML. ........................................................................................ 16 3.2. Các kỹ thuật xử lý XML với C#. ................................................................. 19 3.2.1. Giới thiệu về namespace System.xml ......................................................................... 19 3.2.2. Đọc và Ghi XML. .............................................................................................................. 20 3.2.3. Các phương thức Read. .................................................................................................... 21 3.2.4. Lấy thuộc tính của dữ liệu:.............................................................................................. 22 3.2.5. Sử dụng Schema property. ............................................................................................... 24 3.2.6. Sử dụng lớp XmlTextWriter. ........................................................................................... 24 Chương 4. Chương trình tự động lập báo ................................................................ 26 biểu tự động kết xuất với cơ sở dữ liệu ..................................................................... 26 4.1. Mô tả chức năng của hệ thống ........................................................................ 26 Danh sách các usecase................................................................................................................... 26 4.2. Mô tả các usecase ............................................................................................ 26 2
  3. Thuyết minh đề tài NCKH Error! Reference source not found. 4.3. Giao diện chương trình ................................................................................... 28 KẾT LUẬN ................................................................................................................. 34 3
  4. Thuyết minh đề tài NCKH Error! Reference source not found. 4
  5. Thuyết minh đề tài NCKH Mở đầuError! Reference source not found. Mở đầu Khi máy tính chỉ được sử dụng bởi các chuyên gia thì thiết kế giao diện người dùng chưa được chú trọng đến. Ngày nay, người dùng máy tính đã đa dạng hơn, máy tính và các ứng dụng của nó được dùng rộng rãi cả trong và ngoài lĩnh vực công nghệ thông tin. Do vậy, giao diện người dùng nên được thiết kế theo các nhu cầu và dự định của người dùng để họ thực hiện nhiệm vụ. Người dùng sẽ hài lòng dẫn đến tinh thần và năng suất làm việc của họ sẽ được nâng cao khi được làm với hệ thống máy tính có giao diện người dùng dễ hiểu, dễ dùng. Một giao diện người dùng được thiết kế khó hiểu, không dễ dùng có thể khiến cho người dùng bất mãn và thất vọng trong công việc dẫn đến giảm năng suất làm việc. Nghiên cứu, thiết kế hệ thống kết xuất gồm báo biểu và giao diện sao cho chúng có khả năng đáp ứng được những ý định mà người dùng muốn thực hiện ngay trong lúc họ muốn tương tác với máy tính để thực hiện nhiệm vụ là một trong những vẫn đề đang được quan tâm nghiên cứu hiện nay. Mặc dù đã có nhiều hỗ trợ từ phía các nhà sản xuất phần mềm và sự nỗ lực của các nhà lập trình, nhưng việc thiết kế nên kết xuất như các báo biểu và các giao diện vẫn chưa linh động, mềm dẻo theo cấu trúc của cơ sở dữ liệu bên trong và theo ý muốn của người dùng muốn kết xuất theo từng thời điểm. Vì vậy vấn đề đặt ra cho nghiên cứu, thiết kế và phát triển hệ thống kết xuất phải có hướng thiết kế sao cho kết xuất thích nghi được sự thay đổi cấu trúc bên trong của cơ sở dữ liệu và tùy biến được theo từng thời điểm sử dụng nhằm tăng tính tiện dụng cho sản phẩm. Nhu cầu thiết kế hệ thống kết xuất thay đổi được kết xuất theo yêu cầu của người dùng trong từng ngữ cảnh sử dụng khác nhau và mềm dẻo theo cấu trúc bên trong của sơ sở dữ liệu là rất cần thiết và thu hút sự quan tâm hiện nay. Mục đích của đề tài: nghiên cứu siêu dữ liệu mô tả cho bài toán tự động tạo báo biểu kết xuất với cơ sở dữ liệu và các kỹ thuật xử lý XML với C# để giải quyết bài toán đã nêu. Xây dựng bộ siêu dữ liệu để mô tả các đối tượng: - Siêu dữ liệu mô tả các thuộc tính của từng quan hệ và thuộc tính của cơ sở dữ liệu quan hệ để mô tả sự thay đổi về cấu trúc của các quan hệ và thuộc tính trong cơ sở dữ liệu quan hệ để mô tả sự thay đổi về cấu trúc của các quan hệ và thuộc tính trong cơ sở dữ liệu quan hệ. - Siêu dữ liệu mô tả từng thuộc tính của quan hệ được kết xuất ra hệ thống kết xuất. - Siêu dữ liệu mô tả từng thuộc tính của một báo biểu. 5
  6. Thuyết minh đề tài NCKH Mở đầuError! Reference source not found. - Siêu dữ liệu để mô tả từng thuộc tính của các thành phần báo biểu kết xuất. Ý nghĩa thực tiễn của đề tài: Sự thành công của đề tài sẽ đưa ra một phương pháp mớ để thiết kế hệ thống kết xuất với hình thức thể hiện có khả năng tùy biến được theo từng thời điểm sử dụng và không phụ thuộc vào cấu trúc dữ liệu của cơ sở dữ liệu quan hệ đầu vào mà nó kết nối. Hệ thống kết xuất được thiết kế theo phương pháp này sẽ đáp ứng được nhu cầu sử dụng của người dùng theo từng thời điểm với ngữ cảnh khác nhau và thay đổi về cấu trúc của cơ sở dữ liệu đầu vào. Cấu trúc của báo cáo gồm 4 chương: Chương 1. Cơ sở lý thuyết về siêu dữ liệu. Chương 2. Xây dựng các bộ siêu dữ liệu . Chương 3. Các kỹ thuật xử lý XML với C#. Chương 4. Chương trình tự động lập báo biểu tự động kết xuất với cơ sở dữ liệu. 6
  7. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. Chương 1. Cơ sở lý thuyết về siêu dữ liệu 1.1. Giới thiệu về siêu dữ liệu. Siêu dữ liệu được xây dựng từ thông tin mà nó mô tả, giải thích, xác định. Hay nói cách khác là siêu dữ liệu được dùng để dễ dàng khôi phục, sử dụng hoặc quản lý nguồn thông tin. Siêu dữ liệu thường được gọi là dữ liệu mô tả về một nguồn thông tin nào đó. Có ba loại chính của siêu dữ liệu: - Siêu dữ liệu mô tả( Descriptive metadata): Mô tả nguồn tài nguyên cho mục đích khám phá và phân tích (chứng minh). Nó có thể bao gồm các yếu tố như: tiêu đề, tóm tắt, tác giả, ...Nó được dùng một cách công khai để có thể tới được các hệ thống tìm kiếm. - Siêu dữ liệu cấu trúc (Structural metadata): Mô tả các liên kết giữa các đối tượng thông tin liên quan của tài liệu, hay nói cách khác dùng mô tả tổ chức logic của một tập hợp tệp. Ví dụ: mục lục, chương, phần, trang sách, hình ảnh minh họa, phụ lục,.. được liên kết với nhau như nào trong một tài liệu nhằm giúp người dùng dễ dàng di chuyển đến các thành phần của tài liệu. Ở đây có nghĩa là cuốn sách như 1 tổng thể, Structural metadata được sử dụng để ghi lại mối quan hệ giữa các file vật lý và các trang, các trang và các chương, giữa các chương và cuốn sách. - Siêu dữ liệu quản trị (Administrative metadata): Cung cấp thông tin giúp quản lý nguồn tài nguyên. Ví dụ: một nguồn tài nguyên được tạo ra khi nào, tạo ra như nào, các thông tin kỹ thuật khác của tài nguyên (vd : kích thước, độ phân giải), ai có thể truy cập nó. Siêu dữ liệu có thể diễn tả nguồn tài nguyên ở bất kỳ mức độ nào. Nó có thể diễn tả một tập hợp, một nguồn tài nguyên đơn lẻ hoặc một phần của nguồn tài nguyên lớn. Siêu dữ liệu được gắn vào 1.2. Mục đích của siêu dữ liệu. Một lý do quan trọng cho vệc tạo siêu dữ liệu miêu tả làm dễ dàng cho việc khám phá các thông tin có liên quan. Thêm vào đó là khám phá nguồn tài nguyên. Siêu dữ liệu giúp tổ chức nguồn tài nguyên điện tử được dễ dàng thao tác giữa các phần và tổng hợp lại, cung cấp con số xác thực hỗ trợ, duy trì. 1.3. Cấu trúc của siêu dữ liệu. Các lược đồ siêu dữ liệu là tập hợp các thành phần siêu dữ liệu thiết kế cho mục đích đặc biệt như diễn tả một kiểu riêng biệt của nguồn tài nguyên. Định nghĩa hoặc nghĩa của các phần tử của chúng được biết như nghĩa của lược đồ. Định nghĩa hoặc nghĩa các yếu tố được hiểu là nghĩa của lược đồ. Giá trị của các phần tử siêu dữ liệu là nội dung của lược đồ. Tập các yếu tố siêu dữ liệu và các giá trị của nó dùng để mô tả một nguồn thông tin nào đó tạo thành 1 bản ghi (metadata record). 7
  8. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. 1.4. Tạo siêu dữ liệu. Với câu hỏi “ai tạo siêu dữ liệu” thì câu trả lời khác nhau tùy theo ngành, nguồn tài nguyên mô tả. Nhiều cấu trúc cơ bản và siêu dữ liệu quản trị được cung cấp từ nhân viên kỹ thuật hoặc tạo đối tượng số, hoặc được sinh ra trong quá trình tự động. Đối với siêu dữ liệu miêu tả, người khởi tạo nguồn tài nguyên cung cấp thông tin là tốt nhất. Điều này đặc biệt đúng trong tài liệu của các tập dữ liệu khoa học vì những người này có sự hiểu biết về mối liên kết giữa dữ liệu và tài liệu mô tả. Tuy nhiên, nhiều dự án đã chỉ ra rằng để có hiệu quả phải có sự sắp xếp thông thạo thông tin chuyên nghiệp để mô tả siêu dữ liệu bởi vì các tác giả hoặc người tạo dữ liệu không có thời gian hoặc kỹ năng. 1.5. Ứng dụng siêu dữ liệu để tạo liên kết động. Với các ý nghĩa thiết thực của siêu dữ liệu, việc vận dụng siêu dữ liệu vào thiết kế hệ thống thông tin có ý nghĩa đặc biệt. Siêu dữ liệu giúp mô tả, quản lý, khai thác nguồn tài nguyên thông tin một cách hiệu quả. Trong giới hạn phạm vi của bài toán, nhóm tác giả áp dụng siêu dữ liệu để tạo liên kết động giữa các hệ thống kết xuất với cơ sở dữ liệu. 8
  9. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. Chương 2. Xây dựng các bộ siêu dữ liệu 2.1. Cấu trúc của báo biểu. Một báo biểu được trình bày sau khi thiết kế xong thường gồm 5 phần chính như sau: 1. Phần đầu của báo biểu, 2. Phần đầu trang, 3. Phần thân của báo biểu, 4. Phần chân của báo biểu, 5. Phần chân trang 2.2. Các nguyên tắt thiết kế báo biểu a) Cách sử dụng các đặc tính của font trong hiển thị thông tin. Một font có các đặc tính cơ bản như sau: - Kiểu có chân (Serif), kiểu không chân (Sans Serif); - Kiểu chữ: đậm, nghiêng; - Cỡ chữ và; - Loại chữ: in thường, IN HOA, Ký Tự Đầu Tiên Của Mỗi Từ Được In Hoa (mixed-case). Được dùng như công cụ để:  Tổ chức việc nối kết các phần tử,  Nhận dạng các phần tử quan trọng trên màn hình,  Thiết lập một thứ tự đọc và,  Tạo một đặc điểm riêng biệt. Dùng kết hợp các kiểu thì nên chọn: 9
  10. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found.  Kiểu không chân cho nhan đề và tiêu đề,  Kiểu có chân cho phần thân. b) Cách sử dụng các đặc tính của font: - Kiểu chữ nghiêng được sử dụng khi:  Muốn nhấn mạnh hoặc  Tập trung sự chú ý trên màn hình - Nên định dạng kiểu chữ nghiêng cho:  Một từ hoặc  Một đoạn ngắn, - Không nên sử dụng cho một văn bản dài. - Nên dùng kết hợp kiểu chữ thường và kiểu chữ nghiêng - Về cỡ chữ:  Không nên sử dụng quá ba cỡ chữ cùng lúc trên màn hình. Khuyên dùng:  Cỡ chữ từ 18 - 36 point cho nhan đề và tiêu đề,  Cỡ chữ từ 12 - 14 point cho phần thân. Sử dụng loại chữ trong các trường hợp sau:  Dùng mixed-case cho hầu hết các thành phần: nhãn, dữ liệu, mô tả các điều khiển, thông tin chỉ dẫn, mô tả hình, bảng.  Chữ in hoa: sử dụng cho nhan đề, các từ quan trọng và cho các tiêu đề.  Trường hợp kiểu chữ in thường thì không khuyên sử dụng cho nhan đề. 2.3. Cách thiết kế báo biểu. a) Cách thiết kế thân báo biểu - Các tiêu đề cột:  Tiêu đề cột phải mô tả rõ nội dung của cột,  Tránh các từ viết tắt trong tiêu đề cột. b) Cách thiết kế thân báo biểu - Sử dụng font:  Dữ liệu kiểu số: canh phải và sử dụng kiểu monospaced, 10
  11. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found.  Dữ liệu kiểu ký tự: canh trái, phông chữ: Times New Roman, Arial, Verdana… - Độ rộng thân báo biểu: thân một báo biểu quá rộng, có thể được thu hẹp bằng hai giải pháp:  Giải pháp thứ nhất: thu nhỏ hoặc mở rộng các cột để tất cả các thông tin có thể được nhìn thấy đồng thời,  Một giải pháp khác: phân nội dung ô rộng thành nhiều dòng, như hình minh họa ở cột LANGUAGES: c) Cách thiết kế phần đầu của báo biểu - Một báo biểu thường sẽ gồm nhiều trang. - Phần đầu của báo biểu: xuất hiện chỉ một lần ở trang đầu tiên của toàn báo biểu. - Thông tin ở phần này thường gồm:  Quốc hiệu;  Tên cơ quan, tổ chức đặt ở gốc trên bên trái;  Địa danh và ngày, tháng, năm lập báo biểu;  Nhan đề cho báo biểu. 11
  12. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. d) Cách thiết kế phần chân của báo biểu Phần chân của báo biểu là phần kết xuất thông tin xuất hiện chỉ một lần ở cuối báo biểu. Ví dụ: Các thông tin báo biểu kết xuất ở phần này thường gồm:  Địa danh và ngày, tháng, năm lập báo biểu (nếu phần đầu báo biểu chưa có);  Họ tên người lập báo biểu;  Chức vụ, họ tên người ký báo biểu. 2.3. Ứng dụng siêu dữ liệu để tạo báo biểu 2.3.1. Siêu dữ liệu mô tả cho quan hệ và thuộc tính của quan hệ trong cơ sở dữ liệu. S Loại thực thể con của Siêu dữ liệu mô tt “đối tượng” tả 1 Quan hệ 1. Tên quan hệ. 2. Khóa chính. 3. Số thuộc tính. 2 Thuộc tính 1. Tên thuộc tính. 2. Kiểu dữ liệu. 3. Kích thước dữ liệu. 4. Số chữ số thập phân. 12
  13. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. 2.3.2. Siêu dữ liệu mô tả cho cột dữ liệu. Loại thực S thể con của “đối Siêu dữ liệu mô tả tt tượng” 1 Cột dữ liệu Đối với tiêu đề cột Đối với phần 1. Vị trí dòng trị kết xuất. 1. Vị trí 2. Vị trí cột dòng kết xuất. kết xuất. 2. Vị trí 3. Font. cột kết xuất. 4. Kích thước. 3. Font. 5. Màu. 4. Kích thước. 6. Tên tiêu đề cột. 5. Màu. 6. Trị. 2.3.3. Siêu dữ liệu mô tả báo biểu S Loại thực thể con Siêu dữ liệu mô tả tt của “đối tượng” 2 Báo biểu 1. Tên. 2. Nhan đề chính. 3. Mục đích sử dụng. 4. Khổ rộng. 5. Hướng giấy. 6. Độ rộng biên trái. 7. Độ rộng biên phải. 8. Độ rộng biên trên. 9. Độ rộng biên dưới. 13
  14. Thuyết minh đề tài NCKHChương 1. Cơ sở lý thuyết về siêu dữ liệuError! Reference source not found. 2.3.4. Siêu dữ liệu mô tả thành phần báo biểu kết xuất S Loại thực thể con của Siêu dữ liệu mô tả tt “đối tượng” 3 Thành phần báo biểu 1. Tên. kết xuất 2. Phông chữ. 3. Cỡ chữ. 4. Kiểu chữ. 5. Loại chữ. 6. Kích thước. 7. Màu. 8. Trị thành phần báo biểu kết xuất. 9. Canh lề. 14
  15. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found Chương 3. Các kỹ thuật xử lý XML với C# 3.1. XML Trong thực tế bản thân ngôn ngữ XML có nguồn gốc giống như ngôn ngữ định dạng siêu văn bản HTML (HyperText Markup Language) từ chuẩn ngôn ngữ định dạng văn bản tổng quát có cấu trúc SGML. Mỗi văn bản XML cũng sử các thẻ (tags), các từ được đặt trong ngoặc với ‘’ (mở và đóng) và dùng thuộc tính tên gọi của các phần tử (element) với mẫu name= “value”. Trong khi HTML đặc biệt chú ý tới từng thẻ (tag) và thuộc tính (attribute) có ý nghĩa gì và phần văn bản giữa các thẻ đó hiển thị như thế nào trên trình duyệt thì XML sử dụng các thẻ chỉ để phân định ranh giới giữa các đoạn dữ liệu và coi việc đọc và xử lý dữ liệu hoàn toàn là nhiệm vụ của các ứng dụng. Nhưng khác với ngôn ngữ HTML, số lượng và tên gọi các phần tử trong XML là không hạn chế. XML là một văn bản nhưng không giống với những loại văn bản thông thường mà ta có thể đọc được. Các chương trình dùng để tạo các dữ liệu được cấu trúc hóa thông thường được lưu dữ liệu trên đĩa cứng, sử dụng khuôn dạng text hay nhị phân. Một thuận lợi của khuôn dạng văn bản là cho phép người đọc có thể đọc nó với bất kỳ bộ soạn thảo văn bản nào tùy thích. Các khuôn dạng văn bản cũng cho phép tìm lỗi dễ dàng hơn trong các ứng dụng. Giống như HTML các file XML là những file văn bản được tạo ra không phải với mục đích đề đọc, nhưng vẫn có thể đọc nếu thấy cần thiết. Tuy nhiên XML có điểm không bằng HTML, các luật dùng trong XML rất hạn chế, chỉ cần quên một thẻ, hay một thuộc tính không đi kèm với nội dung sẽ làm cho toàn bộ file XML đó ngừng hoạt động, trong khi đó lỗi này ở file HTML có thể được bỏ qua. XML được xem như là ngôn ngữ mạnh hơn HTML do nó mang lại thông tin đầy đủ về dữ liệu. XML cung cấp “siêu dữ liệu” metadata hay còn được gọi là “dữ liệu về dữ liệu” (data about data). XML cho phép các nhà phát triển và quản trị công nghệ thông tin mô tả thông tin có liên quan tới các nguồn thông tin khác. Đây là phương pháp khai thác thông tin lý tưởng trong môi trường trao đổi thông tin từ các máy chủ ứng dụng cũng như từ các ứng dụng với nhau. Cấu trúc chặt chẽ của XML (nội dung được đặt giữa các thẻ metadata) cho phép các ứng dụng dễ dàng tìm kiếm và sử dụng nội dung đã tạo. Môi trường tài liệu XML trở thành một kho dữ liệu hỏi-đáp (query data repository) tương tự như cơ sở dữ liệu. Ngôn ngữ XML là giải pháp tích hợp cho vấn đề trao đổi dữ liệu tự động giữa các kho thông tin trên mạng Internet. 3.1.1. Tài liệu XML từ một cấu trúc cây: 15
  16. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found - Tài liệu XML phải có một phần tử gốc, nguyên tố này là mẹ (the parent) của tất cả các yếu tố khác. Các yếu tố trong tài liệu XML tạo thành một cây tài liệu. Bắt đầu từ gốc(root), nhánh(branches) đến các mức thấp của cây. - Tất cả các yếu tố có thể chứa các yếu tố phụ, yếu tố con. ..... Các điều khoản parent, child và sibling được sử dụng để mô tả các mối quan hệ giữa các yếu tố. Child cùng cấp với sibling ( brothers or sisters). Tất cả các yếu tố có thể có nội dung văn bản và các thuộc tính giống như HTML. 3.1.2. Các yếu tố trong XML - Một yếu tố XML là tất cả mọi thứ (bao gồm) các phần tử tử tag bắt đầu đến tag kết thúc. - Một yếu tố có thể chứa các yếu tố khác, văn bản đơn giản hoặc hỗn hợp cả 2. Các yếu tố cũng có thể có các thuộc tính. Harry Potter J K. Rowling 2005 29.99 Learning XML Erik T. Ray 2003 39.95 Trong ví dụ trên, tag và có các yếu tố nội dung. Bởi vì chúng chứa các nguyên tố khác. Tag có nội dung văn bản bởi vì nó chứa văn bản. Trong ví dụ trên, chỉ có tag là có 1 thuộc tính (category = “CHILDREN”). 3.1.3. Các thuộc tính trong XML. 16
  17. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found Nhìn chung các thuộc tính của các yếu tố XML giống như trong HTML. Các thuộc tính cung cấp thông tin bổ sung về phần tử. Phần này đề cập đến các vấn đề như các thuộc tính trong XML là gì, cách sử dụng tốt các thuộc tính, thuộc tính XML cho siêu dữ liệu . •Các thuộc tính trong XML là gì? Trong HTML, các thuộc tính cung cấp các thông tin bổ sung cho các phần tử. Các thuộc tính thường cung cấp thông tin, đó không phải là một phần của dữ liệu. Trong ví dụ dưới đây, các loại tập tin là không liên quan đến các dữ liệu, nhưng có thể là quan trọng đối với phần mềm khi chúng ta muốn thao tác trên các phần tử. computer.gif •Các thuộc tính trong XML phải nằm trong dấu trích dẫn “” Giá trị thuộc tính phải luôn nằm trong dấu trích dẫn. Có thể sử dụng dấu nháy đơn hay nháy kép trong từng trường hợp cụ thể được sử dụng. Đối với giới tính của người, phần tử người có thể được viết như thế này: hoặc Nếu giá trị thuộc tính có sử dụng dấu nháy kép thì có thể viết như thế này: Chúng ta cũng có thể sử dụng tham chiếu thực thể: •Các phần tử so với các thuộc tính của XML Chúng ta hãy xem 2 ví dụ dưới đây: Anna Smith female Anna Smith •Cách nên sử dụng: Trong 3 tài liệu XML dưới đây chứa chính xác cùng một thông tin: Một thuộc tính ngày được sử dụng trong ví dụ đầu tiên: 17
  18. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found Tove Jani Reminder Don't forget me this weekend! Một phần tử ngày được sử dụng trong ví dụ thứ 2: 10/01/2008 Tove Jani Reminder Don't forget me this weekend! Khi sử dụng cách thứ 3, chúng ta có thể có những thông tin giống 2 cách đầu tiên. Nhưng khi khai thác thông tin từ phần mềm thì đây là cách hay nhất và tối ưu nhất. •Tránh các thuộc tính XML: Một số vấn đề xảy ra khi sử dụng các thuộc tính là: - Thuộc tính không thể chứa nhiều giá trị (các phần tử có thể). - Thuộc tính không thể chứa các cấu trúc cây (Các phần tử có thể). - Thuộc tính không dễ dàng mở rộng (đối với những thay đổi trong tương lai). - CÁc thuộc tính khó đọc và duy trì. Sử dụng các phần tử cho dữ liệu. Sử dụng các thuộc tính cho các thông tin liên quan đến dữ liệu. Đừng kết thúc như thế này: • Các thuộc tính XML cho siêu dữ liệu Đôi khi các ID tham chiếu được gán cho các phần tử. Những ID có thể được sử dụng để xác định các phần tử(yếu tố) của XML theo cách tương tự như các thuộc tính ID trong HTML. Ví dụ dưới đây sẽ chứng minh điều này: Tove Jani Reminder 18
  19. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found Don't forget me this weekend! Jani Tove Re: Reminder I will not Các thuộc tính id ở trên là để xác định các ghi chú khác nhau, nó không phải là một phần của các ghi chú (note). Những gì mà tôi đang cố gắng nói ở đây là siêu dữ liệu (dữ liệu về dữ liệu) phải được lưu trữ như là các thuộc tính, và các dữ liệu chính nó phải được lưu trữ như là các phần tử(yếu tố). 3.2. Các kỹ thuật xử lý XML với C#. 3.2.1. Giới thiệu về namespace System.xml - namespace System.xml trong .NET cung cấp một số lớp hỗ trợ cho việc xử lý XML. Dưới đây là những lớp đọc và ghi XML. Tên lớp Giải thích XmlReader Một lớp đọc trừu tượng nhanh và non-cached dữ liệu XML. XmlReader được thiết kế giống như bộ phân tách SAX. XmlWriter Một lớp viết trừu tượng nhanh và non-cached dữ liệu XML trong một dòng hoặc định dạng file. XmlTexReader Mở rộng của XmlReader. Cung cấp chuỗi truy cập nhanh dữ liệu XML. XmlTexWriter Mở rộng của XmlWriter. Phát nhanh các dòng XML. - Một vài lớp hữu ích khác trong XML: Tên lớp Giải thích XmlNode Một lớp trừu tượng miêu tả một nút đơn trong một tài liệu XML. Lớp cơ sở cho các lớp khác trong namespace XML. XmlDocument Mở rộng của XmlNode. Đây là một thực thi W3C Document Object Model (DOM). Nó cung cấp một cây miêu tả tài liệu XML trong bộ nhớ cho phép điều hướng và soạn thảo. XmlDataDocument Mở rộng của XmlDocument. Đây là một tài liệu có thể được tải từ dữ liệu XML hoặc từ dữ liệu trong mộtADO.NET DataSet. Cho phép hòa trộn XML và dữ liệu quan hệ trong cùng một view. XmlResolver Một lớp trừu tượng dùng giải quyết các tài nguyên XML ngoài như DTD và tham chiếu sơ đồ. Cũng dùng để xử lí các thành phần và . 19
  20. Thuyết minh đề tài NCKHChương 3. Các kỹ thuật xử lý XML với C#Error! Reference source not found XmlUrlResolver Mở rộng của XmlResolver. Giải quyết các tài nguyên tên như một URI (Uniform Resource Identifier). - Lưu ý: namespace xml có sẵn cho bất kỳ ngôn ngữ nào biết .NET 3.2.2. Đọc và Ghi XML. - Cả 2 lớp XmlReader và XmlWriter đều là những lớp trừu tượng. Hình dưới đây minh họa các lớp kế thừa từ 2 lớp này: + XmlTextReader và XmlTextWriter làm việc chung trên các đối tượng stream hoặc các đối tượng TextReader/TextWriter trong namespace System.IO. + XmlNodeReader sử dụng XmlNode cho một nguồn thay cho một stream. XmlValidatingReader thêm DTD với sơ đồ tích hợp và tất nhiên là cả dữ liệu a) Sử dụng lớp XmlTexReader - XmlTexReader rất giống SAX. Một trong những khác biệt lớn nhất: SAX là một mô hình kiểu push, còn XmlTextReader là một mô hình pull, ở đó dữ liệu được kéo vào ứng dụng yêu cầu nó. Nó tạo ra một mô hình lập trình dễ dàng và trực quan hơn. Một lợi ích khác của mô hình pull là có thể lựa chọn dữ liệu để gởi đến ứng dụng: nếu bạn không muốn tất cả các dữ liệu, vì không cần xử lý tất cả chúng. Còn trong mô hình push, tất cả dữ liệu XML cần phải được xử lý bởi ứng dụng, mặc cho nó có muốn hay không. - Để sử dụng lớp này cần khai báo : using System.Xml; - Bây giờ hãy mở visual studio lên: + Kéo vào một ListBox và một Button như hình bên; + Sau đó viết sự kiện cho button Load XML như sau: private void btnLoadXML_Click(object sender, EventArgs e) { // Đường dẫn tới file xml. string fileName = "Book.xml"; // Tạo một đối tượng TextReader mới XmlTextReader xtr = new XmlTextReader(fileName); while (xtr.Read()) { if (xtr.NodeType == XmlNodeType.Text) { listBox1.Items.Add(xtr.Value); } } 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
30=>0