« Home « Kết quả tìm kiếm

Đề xuất sử dụng phương pháp tiếp cận Pareto để lựa chọn các điểm ảnh


Tóm tắt Xem thử

- Đề xuất sử dụng phương pháp tiếp cận Pareto để lựa chọn các điểm ảnh.
- Abstract — Trong bài báo này, chúng tôi đề xuất sử dụng phương pháp tiếp cận Pareto để lựa chọn các điểm ảnh.
- Phương pháp này thường được sử dụng trong hệ thống truy xuất hình ảnh dựa trên nội dung (CBIR) có nhiều tính năng (ví dụ: màu sắc, hình dạng, kết cấu).
- Trong phương pháp này, các hệ thống thường biểu diễn mỗi hình ảnh dưới dạng vectơ đặc trưng riêng biệt.
- Từ đó nối các vectơ đặc trưng thành phần với một ảnh truy vấn, tính toán số đo khoảng cách của nó với ảnh trong cơ sở dữ liệu.
- Mặc dù đơn giản, phương pháp này không đề cập đến độ phức tạp của thuật toán.
- Một phương pháp khác thường tính toán sự kết hợp tuyến tính có trọng số của các phép đo khoảng cách riêng lẻ và việc gán trọng số cho mỗi phép đo dựa trên phản hồi về mức độ liên quan (RF) từ người dùng để xác định tầm quan trọng của từng thành phần.
- Trong bài báo này, nhóm tác giả đề xuất sử dụng phương pháp tiếp cận Pareto để lựa chọn các điểm ảnh.
- Đề xuất thuật toán tạo ra một tập hợp nhỏ gọn các điểm ảnh khi so sánh với toàn bộ tập dữ liệu và tập này cũng chứa các kết quả thu được từ tất cả toán tử.
- Keywords- Truy xuất hình ảnh dựa trên nội dung (CBIR), phản hồi mức độ liên quan (RF), phương pháp tiếp cận Pareto.
- Ví dụ, khi làm việc với văn bản, chỉ cần gõ từ khóa vào các công cụ tìm kiếm như Google hay Bing, chúng ta có thể nhận ngay danh sách các trang web phù hợp nhất với chất lượng (nói chung) có thể chấp nhận được.
- Một hệ thống tương đương như vậy cho hình ảnh, tức là lấy đầu vào hình ảnh từ người dùng, cố gắng sắp xếp các hình ảnh tương tự nhất trong tập dữ liệu hình ảnh của nó, sau đó trả lại cho người dùng.
- Sự tương đồng ở đây là dựa trên sự tương đồng của các hình.
- Các hệ thống đó được gọi là truy xuất hình ảnh dựa trên nội dung (CBIR).[11].
- Một hệ thống CBIR điển hình hoạt động như sau..
- Đầu tiên, nó thực hiện trích xuất tính năng, tức là cách liên kết mỗi hình ảnh với một vectơ định lượng..
- Vectơ định lượng này được gọi là vectơ đặc trưng của hình ảnh.
- Tính năng của tất cả các hình ảnh trong cơ sở dữ liệu.
- Sau đó, đối với hình ảnh đầu vào (thường được gọi là hình ảnh truy vấn), hệ thống sẽ tính toán thước đo khoảng cách của các đối tượng vector với hình ảnh trong cơ sở dữ liệu.
- Cuối cùng, những hình ảnh gần nhất có thước đo khoảng cách nhỏ nhất được trả lại cho người dùng.
- Hệ thống CBIR thường thể hiện tính năng của hình ảnh bằng màu sắc, kết cấu, hình dạng và bố cục hình ảnh.
- Sự kết hợp của màu sắc, kết cấu và hình dạng được đề xuất trong [9].
- sử dụng các thành phần điểm màu.
- Hơn nữa, phát hiện cạnh màu và biến đổi wavelet rời rạc được sử dụng để biểu diễn độ phức tạp của thuật toán [1]..
- Như vậy, chúng ta thấy xu hướng trong nhiều hệ thống CBIR là sử dụng kết hợp nhiều tính năng để truy xuất hình ảnh.Về mặt trực quan, người dùng không dễ dàng nhận ra hình ảnh dựa trên các khía cạnh như màu sắc và hình dạng, những người khác nhau với cùng một hình ảnh có thể cho ra 1 hình ảnh khác nhau.
- Hình ảnh khác nhau có thể có ý nghĩa khác nhau hoặc mức độ quan trọng khác nhau đối với mỗi người.
- Ví dụ: cho một hình ảnh cho thấy một con chim trên bầu trời, một số người có thể quan tâm đến con chim, trong khi những người khác có thể quan tâm đến bầu trời..
- Giả sử rằng mỗi đối tượng được liên kết với một thước đo khoảng cách, thì mỗi hình ảnh có nhiều khoảng cách liên quan đến một hình ảnh truy vấn trong không gian tìm kiếm nhiều chiều.
- Cho một hình ảnh truy vấn, theo từng đặc điểm của hình ảnh,.
- chúng ta có thể tìm một số hình ảnh lân cận [2,3]..
- Nếu xét bài toán trong không gian nhiều chiều, điểm ảnh thường là tập con của các điểm lân cận trước đó liên kết với mỗi chiều.
- Chức năng được sử dụng để sắp xếp mức độ phù hợp giữa điểm ảnh đó.
- Do đó phải tính toán số đo khoảng cách tổng hợp cho mỗi điểm ảnh dựa trên một số thuật toán kết hợp có trọng số của các phép đo khoảng cách riêng lẻ..
- Trong bài báo này, nhóm tác giả đề xuất sử dụng phương pháp tiếp cận Pareto để lựa chọn các điểm ảnh.Thay vì thuật toán truy vấn cho các hình ảnh có liên quan đã chọn hoặc chỉ áp dụng phương pháp SVM.
- Nhóm tác giả đề xuất một thuật toán nhằm tạo ra một tập hợp nhỏ gọn các điểm ảnh khi so sánh với toàn bộ tập dữ liệu và tập này và các kết quả thu được từ tất cả các phép tính toán..
- Bài báo được trình bày như sau: Phần 2: Cơ sở toán học, Phần 3: Đề xuất thuật toán dựa trên phương pháp tiếp cận Pareto để tối ưu không gian tìm kiếm..
- CƠ SỞ TOÁN HỌ C.
- Phương pháp tiếp cận Pareto.
- Phương pháp Pareto có thể được tìm thấy trong nhiều công trình liên quan đến cơ sở dữ liệu [4], hoặc [5].
- Trong [8] đề xuất một kỹ thuật sử dụng tính tối ưu Pareto để thực hiện quá trình lọc trước nhằm loại bỏ các đối tượng ít đại diện hơn khỏi quá trình lựa chọn k-láng giềng trong khi vẫn giữ lại những đối tượng đại diện nhất.
- Công việc này nhận được kết quả của một truy vấn bao gồm tất cả các điểm Pareto.
- Bộ Pareto bao gồm các đối tượng liên kết không gian với truy vấn nhiều hơn phương pháp sử dụng phương pháp đo khoảng cách.
- Trong bài báo [2] đã kết hợp hai phương pháp phản hồi mức độ liên quan dựa vào phương pháp đo dựa trên khoảng cách..
- Đối với mỗi truy vấn, EMR được sử dụng để tạo ra một danh sách các kết quả được sắp xếp dựa trên độ đo tương tự.
- Sau đó, phương pháp Pareto được xây dựng dựa trên các kết quả này..
- Ưu điểm của phương pháp Pareto trong hệ thống CBIR, có thể thu gọn không gian tìm kiếm..
- Do đó, nó có khả năng cải thiện hiệu suất của hệ thống CBIR.
- Chúng tôi đề xuất sử dụng cách tiếp cận Pareto, kết hợp với phương pháp phản hồi về.
- mức độ liên quan để hiểu được nhận thức của người dùng.
- Bằng cách tương tác với người dùng, phản hồi về mức độ liên quan cung cấp thêm thông tin để chúng tôi có thể suy luận chính xác hơn về sở thích của người dùng trong số nhiều tính năng, tức là tính năng nào quan trọng hơn những tính năng khác trong nhận thức của họ..
- Bài toán tối ưu trên miền không gian độ đo khoảng cách.
- Tập Pareto là một tập con của tập các điểm thoả hiệp của các lời giải trong đó chứa tất cả các điểm mà có ít nhất một mục tiêu tối ưu trong khi giữ nguyên mọi mục tiêu khác.
- Các điểm đó được gọi là các điểm tối ưu Pareto..
- Bài toán tối ưu trên miền không gian độ đo khoảng cách của truy vấn với các mẫu trong cơ sở dữ ảnh phát biểu như sau:.
- trong đó truy vấn Q biểu diễn bởi một tập T đặc trưng và các phần tử ảnh I của tập dữ liệu E F gồm M ảnh bao gồm các đặc trưng tương ứng như truy vấn.
- D Q t ( I ) D(Q t , I t ) là độ đo khoảng cách giữa đặc trưng thứ t biểu diễn bởi các thành phần Q t và I t.
- (Tập Pareto trên độ đo khoảng cách) Cho truy vấn Q, xác định một quan hệ trội (ký hiệu là f) trên tập độ đo khoảng cách của hai ảnh I 1 và I 2 như sau:.
- ĐỀ XUẤT THUẬT TOÁN 2.1 Bài toán:.
- Giả sử chúng ta có hai đặc trưng màu (C) và kết cấu (T).
- Độ đo khoảng cách của ba đối tượng tương ứng với truy vấn Q là:.
- Khoảng cách toàn cục áp dụng kết hợp tuyến tính độ đo khoảng cách thành phần của các đặc trưng màu và kết cấu tương ứng là:.
- Dễ dàng xếp hạng độ đo khoảng cách là .
- Khi không kết hợp tuyến tính độ đo khoảng cách toàn cục, xếp hạng dựa vào độ đo khoảng cách thành phần chúng ta chỉ có thể xếp hạng được 0 1 , 0 2 đối tượng 0 3 không thể so sánh được với hai đối tượng còn lại..
- Như vậy cách xếp hạng sử dụng tổng toàn bộ độ đo khoảng cách của các thành phần trong kết quả cuối cùng còn nhiều vấn đề cần xem xét và cải tiến.
- Do đó nhóm tác giả đề xuất thuật toán sau..
- 2.2 Thuật toán A, Mệnh đề 1.
- Thuật toán đề xuất sử dụng mệnh đề 1 và mệnh đề 2..
- Sau khi sắp xếp T danh sách, thuật toán chỉ thực hiện trên phép so sánh, lần lượt lấy từng ảnh chưa được đánh dấu trong mỗi danh sách so sánh tập độ đo khoảng cách với tập giá trị ngưỡng aTupleMax.
- Tập giá trị ngưỡng aTupleMax được thiết lập sao cho mỗi thành phần của nó có giá trị cao nhất trong tất cả các điểm Pareto đã tìm được..
- Thuật toán đề xuất sử dụng định nghĩa 3.1 kết hợp với tập giá trị aTupleMax để so sánh lấy ra các điểm Pareto theo nhiều mức, quá trình tiếp tục đến khi số điểm cần lấy đạt được k điểm, được gọi là tập Pareto nhiều mức sâu.
- Quá trình tăng dần mức độ sâu đến khi tìm đủ số điểm theo độ sâu hoặc hết cơ sở dữ liệu..
- 2.3 Đánh giá độ phức tạp của thuật toán Thuật toán có độ phức tạp là O (n.
- trong đó các phép toán được sử dụng chỉ toàn các phép so sánh nên thời gian thực hiện nhanh..
- Theo mệnh đề A, tập Pareto nhiều mức sâu chứa các điểm có độ đo khoảng cách tối thiểu theo thành phần và tối thiểu theo cách kết hợp tuyến tính..
- Theo mệnh đề B, các điểm trong cùng một mức sâu thì không thể so sánh với nhau, các điểm ở mức trong sâu hơn thì bị làm trội ở mức ngoài..
- Như vậy tập Pareto depth bao được các điểm liên quan về độ đo khoảng cách mức thấp.
- Tuỳ thuộc số mức rìa, tập này có số mẫu nhỏ hơn toàn bộ cơ sở dữ liệu.
- Tập Pareto chứa tất cả các điểm không trội với các điểm khác trong E F , D Q ( I.
- Tập này chứa tất cả các phần tử tối thiểu hoá bằng cách kết hợp tuyến tính, nhưng cũng chứa các phần tử khác mà không tìm thấy nếu kết hợp tuyến tính..
- Thuật toán đề xuất Đầu vào:.
- /*Danh sách sắp thứ tự Tuple có T danh sách N ảnh, mỗi ảnh có T giá độ đo khoảng cách theo từng đặc trưng với truy vấn Q.
- cùng với T độ đo khoảng cách D Q (I i.
- PF_Next=θ.
- Trong bài báo này, phương pháp tiếp cận Pareto trong không gian tìm kiếm sử dụng hệ thống CBIR bằng cách sử dụng các mẫu được gắn nhãn và dữ liệu đầu vào theo thời gian thực.
- Từ đó khắc phục những hạn chế với các kỹ thuật mở rộng truy vấn trong MARS.
- Để kiểm tra chức năng PRaTo tất cả mẫu của các cặp từ các thí nghiệm đều được thu.
- thập trongcơ sở dữ liệu qPCR.
- [12] được truy xuất và xử lý bằng thuật toán PRaTo.Trong tương lai, nhóm tác giả tiếp tục mở rộng phương pháp Pareto để giảm tập hợp không gian tìm kiếm và áp dụng cho hình ảnh mục tiêu truy xuất trong dữ liệu lớn.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt