« Home « Kết quả tìm kiếm

Nghiên cứu phương pháp xếp hạng kết quả tìm kiếm trên cơ sở dữ liệu bệnh viện


Tóm tắt Xem thử

- NGHIÊN CỨU PHƯƠNG PHÁP XẾP HẠNG KẾT QUẢ TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN.
- Ngành: Công nghệ thông tin.
- Chuyên ngành: Hệ thống thông tin Mã số: 60480104.
- LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN.
- Tôi xin cam đoan luận văn “Nghiên cứu phương pháp xếp hạng kết quả tìm kiếm trên cơ sở dữ liệu bệnh viện” là công trình nghiên cứu của tôi.
- Trong quá trình làm luận văn, tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo..
- CHƢƠNG 1:TỔNG QUAN VỀ BÀI TOÁN TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN.
- 1.2 Truy tìm thông tin.
- 1.2.1 Hệ thống tìm kiếm thông tin.
- 1.2.2 Các hệ thống thông tin khác.
- 9 1.2.3 Các mô hình tìm kiếm thông tin.
- 1.2.4 Xếp hạng tài liệu.
- CHƢƠNG 2: MỘT SỐ PHƢƠNG PHÁP XẾP HẠNG Error! Bookmark not defined..
- 2.1 Một số phƣơng pháp tìm kiếm.
- 2.1.1 Mô hình tìm kiếm Boolean.
- 2.1.2 Tìm kiếm tương tự.
- 2.2 Một số phƣơng pháp xếp hạng.
- 2.2.1 Phương pháp xếp hạng dựa trên cấu trúc.
- 2.2.2.1 Phƣơng pháp xếp hạng Cosine.
- 2.2.2.2 Phƣơng pháp xếp hạng Cosine Short SegmentsError! Bookmark not defined..
- 2.2.2.3 Phƣơng pháp xếp hạng Dice.
- 2.2.2.4 Phƣơng pháp xếp hạng Jaccard.
- 2.2.2.5 Phƣơng pháp xếp hạng Matching.
- 2.2.2.6 Phƣơng pháp Overlap.
- CHƢƠNG 3: ĐỀ XUẤT CẢI TIẾN PHƢƠNG PHÁP XẾP HẠNGError! Bookmark not defined..
- 3.1.3 Chức năng tìm kiếm chẩn đoán.
- 3.1.4 Mô hình hệ thống tìm kiếm.
- 3.2 Phƣơng pháp đề xuất.
- 4.1 Dữ liệu thực nghiệm và phƣơng pháp đánh giáError! Bookmark not defined..
- 4.1.1 Chuẩn bị dữ liệu thực nghiệm.
- 4.1.2 Phương pháp đánh giá kết quả tìm kiếm.
- 4.2 Một số kết quả khi chạy chƣơng trình.
- 4.2.1 Kết quả khi chạy các phương pháp xếp hạng khác nhau cho cùng một truy vấn trên tập dữ liệu các loại bệnh.
- 4.2.1.1 Kết quả tìm kiếm.
- 4.2.1.2 Kết quả các phƣơng pháp xếp hạng.
- 4.2.2 Kết quả khi đánh giá các phương pháp với các truy vấn khác nhau Error!.
- Tin học ngày càng phát triển, thay vì việc hàng ngày phải viết thông tin hồ sơ lên giấy, thông tin đó dần dần đƣợc số hóa và lƣu trữ trên máy tính dƣới dạng cơ sở dữ liệu thông qua ứng dụng tin học.
- Lợi ích của việc số hóa là dữ liệu đƣợc lƣu trữ và quản lý tốt hơn, tra cứu, trích xuất thông tin dễ dàng hơn.
- Thông tin hồ sơ đƣợc số hóa ngày càng nhiều vấn đề đặt ra để tìm kiếm thông tin trong tập hồ sơ hàng nghìn thậm trí đến hàng triệu triệu một cách nhanh nhất, hiệu quả nhất đòi hỏi ứng dụng tin học cần phải xây dựng các giải thuật tìm kiếm tối ƣu nhất đảm bảo tốc độ tìm kiếm và giá trị ngƣời dùng cần..
- Đối với lĩnh vực tìm kiếm thông tin, mỗi khi ngƣời dùng tìm kiếm sẽ thu đƣợc kết quả phù hợp hoặc không có kết quả, nếu kết quả trả về là một lƣợng lớn giá trị phù hợp, ngƣời dùng khó có thể dò tìm từng kết quả để tìm ra nhanh nhất kết quả mình muốn tìm.
- Theo tâm lý thông thƣờng ngƣời dùng chỉ xem qua vài chục bản ghi đầu tiên và không đủ thời gian để xem tất cả các kết quả trả về.
- Do đó xếp hạng là kỹ thuật đánh giá giá trị từng kết quả trong tập dữ liệu trả về, xếp hạng độ quan trọng để ngƣời dùng dễ dàng nhìn thấy giá trị phù hợp mong muốn..
- Có rất nhiều hệ thống tìm kiếm cần đến kỹ thuật xếp hạng để cung cấp cho ngƣời dùng có thể tìm thấy các tài liệu của mình nhanh nhất và xếp nó ở ngay đầu tiên và nhu cầu hệ thống tìm kiếm trên cơ sở dữ liệu bệnh viện cũng cần tới nó.
- Đề tài nghiên cứu hƣớng tới các phƣơng pháp xếp hạng.
- Trên cơ sở tìm hiểu nắm vững các phƣơng pháp xếp hạng và vận dụng vào việc tìm kiếm xếp hạng trên cơ sở dữ liệu bệnh viện..
- Tổng quan về bài toán tìm kiếm trên cơ sở dữ liệu bệnh viện trình bày tổng quan về bài toán tìm kiếm trên cơ sở dữ liệu bệnh viện..
- Một số phương pháp xếp hạng trình bày về các phƣơng pháp xếp hạng, áp dụng công thức cũng nhƣ ví dụ minh họa thực nghiệm cho các phƣơng pháp đó..
- Đề xuất cải tiến phương pháp xếp hạng trình bày về bài toán ứng dụng áp dụng phƣơng pháp xếp hạng, cách thức cải tiến phƣơng pháp xếp hạng để đạt đƣợc kết quả xếp hạng tốt hơn..
- Thực nghiệm và đánh giá thực thi chƣơng trình tìm kiếm áp dụng các phƣơng pháp xếp hạng với số liệu thu thập đƣợc, so sánh kết quả từng phƣơng pháp.
- Đánh giá kết quả các phƣơng pháp để chọn ra đƣợc phƣơng pháp xếp hạng tốt nhất..
- CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN TÌM KIẾM TRÊN CƠ SỞ DỮ LIỆU BỆNH VIỆN.
- Một số bệnh viện có khối lƣợng bệnh nhân lớn là những nơi đang rất cần những công cụ hỗ trợ của Tin học một phần trong những công cụ đó là ứng dụng tìm kiếm dữ liệu..
- Mỗi khi ngƣời dùng tìm kiếm sẽ thu đƣợc kết quả phù hợp hoặc không có kết quả, nếu kết quả trả về là một lƣợng lớn giá trị phù hợp, ngƣời dùng khó có thể dò tìm từng kết quả để tìm ra nhanh nhất kết quả mình muốn tìm.
- Do đó xếp hạng là kỹ thuật đánh giá giá trị từng kết quả trong tập dữ liệu trả về, xếp hạng độ quan trọng để ngƣời dùng dễ dàng nhìn thấy giá trị phù hợp mong muốn.
- Vì vậy đề tài nghiên cứu hƣớng tới các phƣơng pháp xếp hạng, đánh giá chọn ra phƣơng pháp nào thực sự tốt nhất.
- Trên cơ sở tìm hiểu nắm vững các phƣơng pháp xếp hạng và vận dụng vào việc tìm kiếm trên cơ sở dữ liệu bệnh viện, điển hình là bài toán xếp hạng chẩn đoán theo danh mục bệnh tật quốc tế..
- Thông thƣờng việc ghi chẩn đoán đúng có tầm quan trọng nhƣ sau:.
- Giúp thầy thuốc phát triển tƣ duy, tích cực suy nghĩ lựa chọn chẩn đoán theo logic (Ví dụ: chẩn đoán tử vong một cách lƣời biếng “Sốc không hồi phục”.
- Thầy thuốc ghi chẩn đoán đúng - thống nhất theo danh mục và mã số bệnh tật quốc tế sẽ là đóng góp lớn cho khoa học, vì: ghi chẩn đoán đúng sẽ là những dữ liệu có giá trị trong nghiên cứu khoa học.
- Rất quan trọng trong thời đại Công Nghệ Thông Tin..
- Nhận thấy vấn đề chẩn đoán đúng bệnh và tầm quan trọng trong việc ghi chẩn đoán đúng là rất quan trọng.
- Đề tài nghiên cứu, cài đặt, đánh giá các phƣơng pháp xếp hạng dựa trên dữ liệu chẩn đoán theo danh mục bệnh tật quốc tế lựa chọn phƣơng pháp xếp hạng tốt nhất vận dụng cho việc tìm kiếm chẩn đoán đúng bệnh..
- Xét trên dữ liệu chẩn đoán với dữ liệu là các bản ghi danh mục bệnh tật quốc tế là những câu hay đoạn (ngắn), đề tài lựa chọn phƣơng pháp xếp hạng để xác định độ tƣơng đồng giữa các câu hay đoạn, sau đó chọn ra câu hay đoạn có độ liên quan lớn nhất..
- Đề tài nghiên cứu các phƣơng pháp xếp hạng, đánh giá kết quả tìm kiếm trên cơ sở dữ liệu bệnh viện..
- Ứng dụng nhằm trợ giúp đáp ứng đƣợc nhu cầu tìm kiếm cho ngƣời sử dụng tìm kiếm thông tin dễ dàng nhìn thấy giá trị phù hợp mong muốn..
- Kết quả xếp hạng giảm dần thứ tự độ quan trọng của chẩn đoán để ngƣời dùng dễ dàng nhìn thấy chẩn đoán phù hợp, nâng cao chất lƣợng khám chữa bệnh, có thể kết luận đƣợc ngay từ thời kì đầu của quá trình bệnh rất có lợi cho điều trị và phòng bệnh..
- Đƣa ra những hƣớng điều trị, đặt ra những giai đoạn điều trị và có thể đƣa ra thêm những thông tin về bệnh..
- Mục đích của đề tài là tìm hiểu các phƣơng pháp xếp hạng, cài đặt, đánh giá, thực nghiệm các phƣơng pháp xếp hạng lựa chọn phƣơng pháp xếp hạng phù hợp vận dụng tốt nhất trong bài toán tìm kiếm trên cơ sở dữ liệu bệnh viện.
- Về mặt lý thuyết: Tìm hiểu kiến thức về tìm kiếm thông tin, xếp hạng trong hệ thống tìm kiếm thông tin, các phƣơng pháp xếp hạng tài liệu, tiêu chí đánh giá kết quả xếp hạng..
- Về mặt thực nghiệm: Cài đặt, đánh giá các phƣơng pháp xếp hạng và chọn lựa thực nghiệm đƣợc phƣơng pháp xếp hạng tốt nhất..
- Từ những năm 1940, vấn đề lƣu trữ và truy tìm thông tin [1] đã thu hút sự chú ý của các nhà nghiên cứu.
- Hệ thống tìm kiếm đang trở nên cần thiết, vấn đề đó là: chúng ta có một lƣợng thông tin rất lớn, yêu cầu truy tìm thông tin một cách chính xác và nhanh chóng..
- “Sự phù hợp”, đó là khái niệm trung tâm của truy tìm thông tin.
- Mục đích của một chiến lƣợc truy tìm tự động là truy tìm tất cả các tài liệu phù hợp ở cùng thời điểm truy tìm, có thể bao gồm một vài tài liệu không thỏa mãn.
- Tìm ra các đặc trƣng của tài liệu để khi tài liệu phù hợp với truy vấn, nó cho phép tài liệu đƣợc truy tìm để trả lời truy vấn..
- Mục đích của hệ thống tìm kiếm thông tin là trả về các thông tin liên quan nhất đến nhu cầu thông tin của ngƣời dùng.
- Nhu cầu thông tin của ngƣời dùng ở đây có thể xem nhƣ một câu truy vấn.
- Thông tin liên quan ở đây có thể là một câu, một đoạn mà ta gọi chung là tài liệu..
- Hệ thống tìm kiếm thông tin thƣờng gặp phải vấn đề sự khác biệt giữa câu truy vấn và tài liệu.
- Một ví dụ là câu truy vấn thì ngắn (có thể là hai từ và thậm chí các từ này là những từ không thông dụng) trong khi tài liệu thì rất nhiều.
- Để khắc phục vấn đề này các hệ thống tìm kiếm thông tin thƣờng tạo ra các hàm biểu diễn để xử lý câu truy vấn và dữ liệu khác nhau sau đó áp dụng phƣơng pháp xếp hạng để xếp hạng kết quả trả về..
- Hệ thống tìm kiếm thông tin gồm có 3 bộ phận chính: bộ phận phân tích văn bản, bộ phận lập chỉ mục, bộ phận so khớp và sắp xếp các tài liệu trả về..
- Bộ phận so khớp và sắp xếp các tài liệu trả về: Các từ trích đƣợc từ câu truy vấn và các từ chỉ mục của văn bản sẽ đƣợc so khớp với nhau để tìm ra các tài liệu liên quan đến câu truy vấn.
- Mỗi tài liệu có một độ tƣơng quan với câu truy vấn.
- Các tài liệu này sẽ đƣợc sắp xếp theo độ tƣơng quan giảm dần và trả về cho ngƣời sử dụng..
- Hiện nay các hệ thống thông tin quan trọng nhất là: hệ quản trị cơ sở dữ liệu (DBMS), hệ quản lý thông tin (MIS), hệ hỗ trợ ra quyết định (DSS), hệ trả lời câu hỏi (QAS) và hệ tìm kiếm thông tin (IR).
- Việc hiểu biết sự khác nhau giữa hệ thống tìm kiếm thông tin và các hệ thống thông tin khác giúp ta hiểu rõ các kỹ thuật tìm kiếm văn bản..
- Hệ quản trị cơ sở dữ liệu (DBMS).
- DBMS đơn giản là một hệ thống đƣợc thiết kế nhằm thao tác và duy trì điều khiển cơ sở dữ liệu.
- DBMS tổ chức các dữ liệu của mình dƣới dạng các bảng.
- Mỗi một cơ sở dữ liệu đƣợc lƣu trữ thành nhiều bảng khác nhau.
- Mỗi một cột trong bảng là một thuộc tính, mỗi một dòng là một bộ dữ liệu cụ thể.
- DBMS có một tập các lệnh để hỗ trợ cho ngƣời sử dụng truy vấn đến dữ liệu của mình.
- Vì vậy muốn truy vấn đến cơ sở dữ liệu trong hệ quản trị cơ sở dữ liệu ta phải học hết các tập lệnh này.
- Nhƣng ngƣợc lại nó sẽ cung cấp cho ta các dữ liệu đầy đủ và hoàn toàn chính xác.
- Hệ quản lý thông tin (IMS): IMS là DBMS nhƣng có thêm nhiều chức năng về việc quản lý.
- Những chức năng này phụ thuộc vào giá trị của nhiều kiểu dữ liệu khác nhau.
- Nói chung bất kỳ hệ thống nào có mục đích đặc biệt phục vụ cho việc quản lý thì ta gọi là IMS..
- Hệ thống này đang đƣợc áp dụng nhiều cho công việc nhận dạng và chẩn đoán bệnh..
- Đặng Văn Đức Bài giảng Cơ sở dữ liệu đa phương tiện.