« Home « Kết quả tìm kiếm

Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.


Tóm tắt Xem thử

- Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- Họ và tên tác giả luận văn Mai Đình Lợi CÔNG NGHỆ THÔNG TIN TÊN ĐỀ TÀI LUẬN VĂN GIẢI THUẬT RỪNG NGẪU NHIÊN GIẢI BÀI TOÁN PHÂN ĐOẠN ẢNH THEO ĐỐI TƢỢNG LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN 2013B Hà Nội – 2015 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- Họ và tên tác giả luận văn Mai Đình Lợi TÊN ĐỀ TÀI LUẬN VĂN GIẢI THUẬT RỪNG NGẪU NHIÊN GIẢI BÀI TOÁN PHÂN ĐOẠN ẢNH THEO ĐỐI TƢỢNG LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.
- Huỳnh Thị Thanh Bình Hà Nội – 2015 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- iii TÓM TẮT NỘI DUNG LUẬN VĂN TỐT NGHIỆP Vấn đề phát hiện, nhận dạng, phân tách và hiểu ngữ nghĩa của đối tượng trong ảnh đã được nghiên cứu rộng rãi trong trong lĩnh vực thị giác máy tính hàng thập kỷ qua.
- Đây là bài toán có ý nghĩa thực tiễn rất lớn trong nhiều lĩnh vực của đời sống.
- Mục đích đề tài nhằm nghiên cứu tổng quan về bài toán phân đoạn ảnh theo đối tượng (Object Segmentation), cài đặt và chạy thử nghiệm chương trình phân đoạn ảnh.
- Trên cơ sở đó, đề xuất giải thuật rừng ngẫu nhiên nhằm nâng cao chất lượng của ảnh đầu ra, so sánh và đưa ra đánh giá về hiệu năng của các giải thuật.
- Chương 2 trình bày tổng quan về giải thuật rừng ngẫu nhiên và ứng dụng.
- Chương 3 trình bày về định nghĩa bài toán phân đoạn ảnh theo đối tượng và ứng dụng, mô hình giải thuật rừng ngẫu nhiên để giải quyết bài toán.
- Chương 4 trình bày kết quả thực nghiệm của luận văn, so sánh và đánh giá hiệu năng của các thuật toán.
- Đồng thời, em xin gửi lời cảm ơn tới thầy Đinh Viết Sang, các bạn trong tập thể CNTT2 khóa 2013B, các em sinh viên K55, đặc biệt là em Nguyễn Tiến Quảng K55 đã cùng giúp đỡ, hỗ trợ em trong suốt quá trình nghiên cứu và thực hiện luận văn này.
- Cuối cùng, em xin được gửi lời cảm ơn chân thành tới gia đình, bạn bè đã quan tâm, động viên, đóng góp ý kiến và giúp đỡ trong quá trình học tập, nghiên cứu và hoàn thành luận văn tốt nghiệp.
- Hà Nội, ngày 12 tháng 3 năm 2015 Mai Đình Lợi Lớp CNTT2 – Khóa 2013B Viện CNTT & TT Đại học Bách Khoa Hà Nội Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- vi LỜI MỞ ĐẦU Trong thập niên đầu của thế kỷ 21, học máy được nghiên cứu và phát triển mạnh mẽ, đánh dấu bước ngoặt quan trọng thay đổi nền tảng nghiên cứu của Trí tuệ nhân tạo.
- Học máy liên quan đến việc xây dựng các chương trình máy tính có thể tự động thu thập tri thức, cải thiện khả năng của mình thông qua các kinh nghiệm, và việc nghiên cứu các nguyên lý của quá trình học.
- Các kết quả và công nghệ của học máy được thể hiện qua các ứng dụng đa dạng trong thực tế trong các lĩnh vực như: xử lý ngôn ngữ tự nhiên, thị giác máy tính, tìm kiếm và nhận dạng, robotics, khai phá dữ liệu, v.v.
- Thị giác máy tính, một lĩnh vực nghiên cứu liên ngành, liên quan đến việc nghiên cứu các lĩnh vực khoa học và công nghệ về các hệ thống máy móc có khả năng nhìn và hiểu như hệ thống thị giác con người.
- Đây là một lĩnh vực được quan tâm nghiên cứu rộng rãi trong một vài thập niên gần đây bởi những ứng dụng thực tế đa dạng của nó.
- Một số ứng dụng có thể kể đến là: tự động hóa trong dây chuyền sản xuất công nghiệp, viễn thám, giám sát giao thông, bảo mật bằng sinh trắc học, y học, an ninh, web 3D, giải trí… Vấn đề phát hiện, nhận dạng, phân tách và hiểu ngữ nghĩa của đối tượng trong ảnh/video đã được nghiên cứu rộng rãi trong trong lĩnh vực thị giác máy tính hàng thập kỷ qua.
- Các nghiên cứu được nhanh chóng phát triển nhờ những tiến bộ trong một số lĩnh vực liên quan như: việc phát triển các mô hình toán học phức tạp, các nghiên cứu chuyên sâu về nhận thức tri giác (cognitive vision), năng lực của các hệ thống tính toán, các giải thuật thông minh, cũng như đòi hỏi của kiểm thử trên các bộ dữ liệu lớn.
- Mặc dù đã có rất nhiều kết quả nghiên cứu khả quan về phát hiện và nhận dạng đối tượng thì đây vẫn còn là một thách thức trong lĩnh vực thị giác máy bởi các đối tượng có những tính chất và thể hiện rất khác nhau.
- Ngoài ra các đối tượng trong cùng một lớp cũng rất đa dạng.
- Điều này yêu cầu các đặc trưng được trích Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- vii chọn phải có tính phân biệt cao cho các đối tượng trong các lớp khác nhau, và các thuật toán học phải có khả năng phân tách hiệu quả các lớp trên không gian đặc trưng của đối tượng.
- Hơn thế nữa mỗi đối tượng có một loạt các đặc trưng và mỗi đặc trưng có một vai trò khác nhau trong việc nhận dạng đối tượng.
- Các giải thuật học tiên tiến phải có khả năng vừa kết hợp được nhiều đặc trưng vừa trích rút, đưa ra các mức ưu tiên khác nhau cho các đặc trưng, cao hơn nữa là kết hợp chúng với yếu tố ngữ cảnh và mức đáp ứng của các bộ phân lọai một cách hiệu quả.
- Bên cạnh đó, nhiều ứng dụng thị giác máy tính yêu cầu thời gian thực.
- Do đó, các thuật toán học ứng dụng cho thị giác máy tính phải có thời gian tính toán ít.
- Cuối cùng, các thuật toán học truyền thống thường yêu cầu xây dựng cơ sở dữ liệu hoàn chỉnh ngay từ ban đầu.
- Việc xây dựng cơ sở dữ liệu là một công việc khó khăn, tốn kém về thời gian, sức người và trong nhiều trường hợp không thể thực hiện được.
- Các giải thuật học mới có thể cho phép xây dựng dần dần cơ sở dữ liệu trong quá trình hoạt động của hệ thống, thích ứng với sự biến động của môi trường cũng như sự biến đổi của đối tượng theo thời gian.
- Bài toán phân đoạn ảnh theo đối tượng (object segmentation) là bài toán cơ bản trong lĩnh vực thị giác máy tính.
- Hiện tại, các nhà nghiên cứu trên thế giới đã đưa ra rất nhiều mô hình cho bài toán này, cũng như các cải tiến để nâng cao hiệu năng phân đoạn ảnh, nhưng các kết quả đưa ra vẫn còn một vài hạn chế như : tỷ lệ ảnh gán nhãn đúng chưa cao (xấp xỉ 75.
- tập nhãn giới hạn và một số nhãn có kết quả tương đối thấp.
- Luận văn này tập trung nghiên cứu mô hình giải thuật rừng ngẫu nhiên giải quyết bài toán, đồng thời đề xuất giải thuật để cải thiện hiệu năng của bài toán.
- Qua đó đưa ra các đánh giá và hướng phát triển tiếp theo của bài toán phân đoạn ảnh theo đối tượng.
- TỔNG QUAN VỀ XỬ LÝ ẢNH.
- 2 1.2 Ảnh số.
- 3 1.3 Độ phân giải của ảnh.
- 12 CHƢƠNG II: GIẢI THUẬT RỪNG NGẪU NHIÊN VÀ.
- 14 ỨNG DỤNG.
- Tổng quan giải thuật rừng ngẫu nhiên.
- 14 1.1 Lịch sử nghiên cứu.
- 16 1.3 Sơ đồ giải thuật.
- Ứng dụng.
- 18 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- ix 3.1 Giải thuật rừng ngẫu nhiên xiên phân RF-ODT trong bài toán nhận dạng dấu vân tay.
- 18 3.2 Giải thuật rừng ngẫu nhiên trong bài toán phân loại dữ liệu gen.
- 21 CHƢƠNG III: GIẢI THUẬT RỪNG NGẪU NHIÊN TRONG BÀI TOÁN ĐOẠN ẢNH THEO ĐỐI TƢỢNG.
- BÀI TOÁN PHÂN ĐOẠN ẢNH THEO ĐỐI TƯỢNG.
- Giới thiệu bài toán.
- Các ứng dụng của bài toán phân đoạn ảnh theo đối tượng.
- Các nghiên cứu liên quan.
- GIẢI THUẬT RỪNG NGẪU NHIÊN TRONG BÀI TOÁN PHÂN ĐOẠN ẢNH THEO ĐỐI TƯỢNG.
- Tổng quan giải thuật.
- Mô hình trường ngẫu nhiên Markov (Markov random fields.
- Cải tiến thuật toán STF sử dụng mô hình trường ngẫu nhiên Markov.
- 38 CHƢƠNG IV: KẾT QUẢ THỰC NGHIỆM.
- Bộ dữ liệu thử nghiệm.
- 1 Bộ dữ liệu MSRC 21-lớp.
- 41 1.2 Bộ dữ liệu Pascal VOC 2007.
- Kết quả thử nghiệm và so sánh.
- 44 4.1 Kết quả thử nghiệm bộ MSRC 21-class.
- 45 4.2 Kết quả thử nghiệm bộ dữ liệu Pascal VOC 2007.
- Các kết quả đạt được.
- 53 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- x DANH MỤC HÌNH VẼ Hình 1: Biểu diễn ảnh số.
- 19 Hình 5: Ví dụ về phân đoạn ảnh không giám sát (sử dụng thuật toán mean-shift [5.
- 23 Hình 6: Ví dụ về bài toán nhận dạng đối tượng.
- 23 Hình 7: Ví dụ về bài toán phân đoạn ảnh theo đối tượng.
- 31 Hình 12: Mô tả rừng ngẫu nhiên.
- 34 Hình 15: Mô phỏng biểu diễn đồ thị lưới các pixel (y) được gán nhãn( x.
- 39 Hình 18: Bộ dữ liệu MSRC 21-class.
- Cột a-d là một số ảnh trong bộ dữ liệu.
- 42 Hình 19: Bộ dữ liệu VOC 2007.
- Cột 1 là một ảnh trong bộ dữ liệu.
- 43 Hình 20: Hình ảnh kết quả trên bộ dữ liệu MSRC.
- 47 Hình 21: Kết quả ảnh đầu ra trên bộ dữ liệu VOC 2007.
- 48 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- Kết quả tốt nhất tìm được của giải thuật RF sau khi chạy 20 lần trên bộ dữ liệu MSRC.
- 46 Bảng 3: Kết quả trung bình trên bộ dữ liệu MSRC các thuật toán: Joint boost, STFs và 2 thử nghiệm trong luận văn.
- 47 Bảng 4: Bảng kết quả (tỉ lệ phần trăm) trên bộ dữ liệu VOC 2007.
- Số lượt chạy thử nghiệm các giải thuật.
- Thông số cài đặt giải thuật.
- 50 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- xii DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ Từ viết tắt Từ đầy đủ Ý nghĩa CGA Color Graphics Adapter Card màn hình CGA VGA Video Graphics Adapter Card màn hình VGA RF Random Forest Rừng ngẫu nhiên STFs Semantic Texton Forests Giải thuật rừng ngẫu nhiên dựa trên ngữ nghĩa đặc trưng vân của ảnh MRF Markov random fields Mô hình trường ngẫu nhiên Markov CART Classification and Regression Trees Giải thuật phân loại hồi quy trên cây MSRC 21-class Microsoft Research Cambridge 21-class Bộ dữ liệu của Microsoft Research Cambridge, gồm 21 nhãn PASCAL VOC 2007 The PASCAL Visual Object Classes Challenge 2007 Bộ dữ liệu của nhóm PASCAL cho nhận dạng, năm 2007 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy.Xử lý ảnh cũng là một trong những mảng quan trọng nhất trong lĩnh vực thị giác máy tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này.
- Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển.
- Để máy tính có thể hiểu và phân tích ảnh thì ảnh cần được mã hóa và biểu diễn dưới dạng số gọi là ảnh số.
- Việc xử lý ảnh số trên máy tính nhằm mục đích phân tích ảnh và phục hồi các thông tin bị sai lệch trong quá trình thu nhận ảnh.
- Trong quá trình số hoá, Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.
- Ảnh số được biểu diễn như một ma trận hai chiều kích thước WxH, hai thông số này cho biết thông tin về độ rộng và chiều cao ảnh.
- Giá trị của mỗi phần tử của ma trận I[i,j] biểu diễn cho mức xám hay cường độ ảnh tại vị trí của phần tử đó.
- Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính.
- 4 Hình 1: Biểu diễn ảnh số Trong hình 1: a) Hệ trục tọa độ trong Image Processing Toolbox b) Ma trận biểu diễn ảnh số 1.3 Độ phân giải của ảnh Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị.
- Các phép biến đổi ảnh 2.1 Tăng cƣờng ảnh, khôi phục ảnh Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh.
- Với một hệ thống tuyến tính, ảnh của một đối tượng có thể biểu diễn bởi: g(x,y.
- (x,y) là hàm biểu diễn nhiễu cộng.
- f(a,ß) là hàm biểu diễn đối tượng

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt