- LÊ THÁI LINH NGHIÊN CỨU, THỬ NGHIỆM PHƢƠNG PHÁP NHẬN DẠNG BIỂU CẢM KHUÔN MẶT SỬ DỤNG XẤP XỈ ĐA THỨC Chuyên ngành: Công Nghệ Thông Tin LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS. - 5 DANH MỤC CÁC BẢNG Bng 2-1: Mt s hàm truyn thông dng. - Bng thng kê kt qu thc nghim trên. - Bng thng kê kt qu thc nghim trên ng. - 54 6 DANH MỤC HÌNH VẼ Hình 1-1: Thành phn kin trúc chính ca mt h thng nhn dng. - 17 Hình 2-3..Mô hình phân tn kt hp các b phân loi y. - Ví d v ng cong Bézier. - Mng truyn thng. - D liu nh hun luyn JAFFE Database. - D liu nh hun luyn Cohn Kanade Database. - D liu nh hun luyn FEI Database. - Kin trúc OpenCV. - 9 CHƢƠNG 1 - TỔNG QUAN BÀI TOÁN NHẬN DẠNG BIỂU CẢM. - Biểu cảm của gƣơng mặt. - Các thành phần chính của hệ thống nhận dạng biểu cảm. - Những khó khăn trong bài toán nhận dạng biểu cảm. - Đƣờng cong Bezier. - Mạng nơ-ron. - Định nghĩa mạng nơ-ron. - Nơ-ron sinh học và nơ-ron nhân tạo. - Mô hình mạng nơ-ron. - Huấn luyện mạng nơ-ron. - 29 CHƢƠNG 3 - THỰC NGHIÊM VÀ KẾT QUẢ. - Kịch bản nhận dạng biểu cảm. - Áp dụng thành phần liên thông vào bài toán. - Kiến trúc mạng nơ-ron ứng dụng vào bài toán. - Kết quả thực nghiệm. - Kết quả đạt đƣợc trong luận văn. - 10 CHƢƠNG 1 - TỔNG QUAN BÀI TOÁN NHẬN DẠNG BIỂU CẢM 1.1. - Nội dung của chương này sẽ trình bày các vấn đề sau: o Định nghĩa bài toán nhận dạng biểu cảm o Các thành phần chính của bài toán nhận dạng biểu cảm o Những thách thức trong bài toán nhận dạng biểu cảm o Nghiên cứu liên quan o Định hướng giải pháp của tác giả 11. - Các thành phần chính của hệ thống nhận dạng biểu cảm sition, pre-processing, feature extraction, classification và post processing [14] Hình 1-1. - Nội dung của chương này sẽ trình bày các vấn đề sau: o Đặc trưng Haar-like o Bộ phân loại Adaboost o Đặc trưng hình học của khuôn mặt o Đường cong Bezier o Mạng nơ-ron và. - Ƣu điểm của đƣờng cong Bezier [12. - ng cong Bezier có tính cc b: m. - L m cui: ng cong Bezier d m kim soát p0, p1. - pL i suy t tt c m kim soát m cui Có tính bt bin: khi thc hin phép bii cho mng cong Bezier ta không cn phi bii hm thung cong mà ch cn bi m 20 ki o lng cong Bezier da trên tm kim soát mi này Tính cht bao li: vì các giá tr c c Bernstein không âm và có tng là 1 nên mm cng cong Bezier s luôn nm trong bao li cm kim soát. - Mm cng cong Bezier s luôn nm trong bao li ca các m kim soát Hình 2-6. - Mạng nơ-ron 2.5.1. - Nơ-ron sinh học và nơ-ron nhân tạo Qua quá trình nghiên cu v b i ta thy rng: b i bao gm khong 1011. - n, x lý và truyn các tín hiu ng này to nên h thng giao tip ca b não. - M c có 3 thành phn dendrites. - bào (cell body) i trc ra (axon) Các nhánh hình cây truyn tín hin thân t bào. - Thân t bào tng hp và x lý cho tín hi i trc truyn tín hiu ra t thân t bào này sang. - Trong cui cá th, mt s liên kt mc hình thành, mt s khác b hy b. - x lý thông tin và là thành phn ca mt m u trúc ca m c mô t i. - Các thành phn ca m o bao gm. - Tập các đầu vào: Là các tín hiu vào (input signals) c. - Tập các liên kết: Mi liên kc th hin bi mt trng s (gi là trng s liên kt Synaptic weight). - Trng s liên kt gia tín hiu vào th j v c kí hiu là wkj ng, các trng s c khi to mt cách ngu nhiên thm khi to mng và c cp nht liên tc trong quá trình hc mng. - tính tng c u vào vi trng s liên kt ca nó. - lch - bias t thành phn ca hàm truyn. - gii hn phm vi u ra ca m u vào là kt qu ca hàm t ng, phu ra ca m c gii h n [0,1] hoc [-1, 1]. - Vic la chn hàm truyn nào là tu thuc vào tng bài toán và kinh nghim ca i thit k mng. - Mt s hàm truyng s dng trong các mô hình mng ng 1. - Đầu ra: Là tín hiu ra ca m i m. - có tmu ra. - c mô t bi các tín hiu u vào (x1, x2. - wkp) là các trng s liên kt c. - bk là mng. - f là hàm truyn và yk là tín hiu ra c. - Mô hình mạng nơ-ron Mc dù m. - có th thc hin nhng ch. - yc nh s kt h trong mt kin trúc thng nht. - ng có th kt n. - Kin trúc phn hi (Feedback architecture): là kiu kin trúc mng có các kt ni t u ra tu vào. - Mi các tr trng thái tip theo không ch ph thuc vào các tín hiu vào mà còn ph thuc vào các tr a mng. - 29 Tt c các hàm liên tu có th xp x bi mt mng MLP 2 tng s dng hàm truy ng n và hàm truyn tuy tng ra vi sai s nh tùy ý. - Huấn luyện mạng nơ-ron 2.5.5.1. - thc hin t. - Tc s dng cho hun luyn mc gi là tp hun luyn (training set). - Các phn t x thuc gi là các mu hun luyn (training example). - Quá trình hun luyn bn cht là s i các trng s liên kt ca mng. - Trong quá trình này, các trng s ca mng s hi t dn ti các giá tr sao cho vi m u vào x t tp hun luyn, mng s n c ph bin là hc có giám sát (supervised learning), hc không giám sát (unsupervised learning) và h. - Học có giám sát: Là quá trình hc có s tham gia giám sát ca m Vi hc có giám sát, tp mu hun luy i dng D = {(x,t. - xN u ca mu hun luyn và t = (t1, t2. - sao cho vi m u vào thì sai s gia giá tr u ra thc s ca mng và giá tr m ng là nh nht. - y vi hc có giám sát, s lp cn phân lo. - Trong bài toán hc không giám sát, tp d liu hun luy i dng: D = {(x1, x2. - c a mu hun luyn. - 37 CHƢƠNG 3 - THỰC NGHIÊM VÀ KẾT QUẢ ron la. - Kịch bản nhận dạng biểu cảm ron. - Áp dụng thành phần liên thông vào bài toán n. - m còn l nh nh ng thng tip tuyn vi mt t P1 và P4 sau: o V ng thng có chiu thng t P1 hoc P4, dch góc nghiêng ca ng thng này t v trí thng theo góc ng v vùng cha mt. - ng thng này chm vào s c chm kim soát tip theo 3.5. - Kiến trúc mạng nơ-ron ứng dụng vào bài toán Trong lu. - tác gi xây dng 1 m-ron gm có 1 tu vào, 2 tng n và 1 tu ra. - Mi nút ca tu vào gm có: o m (x,y) kim soát cho ph c ni suy t ng cong xp x Bezier 46 o m (x,y) kim soát cho phn m c ni suy t ng cong xp x Bezier o m (x,y) kim soát cho phn mt ph c ni suy t ng cong xp x Bezier o. - cao và rng ca mt phi Tu vào gm 122 nút Tng n th 1 gm 50 nút Tng n th 2 gm 75 nút Tu ra gm 4 nút T l hc 0.00001 Trng s khi to: 0.05 S vòng lp: 500. - j: nơron thứ j (hay nút thứ j. - η: tốc độ học f: hàm truyền với f(x. - Hàm bezier_position(Bitmap b): Hàm này thc hin vic ly các thông s v ng cong bezier ca các khu v t, vu vào là nh vùng môi hoc vùng mt. - Hàm này thc hin vic ly nhãn t. - d liu cho u vào Hàm skin_color(Bitmap b): Hàm này thc hin tìm ra vùng da mt trên u vào b Hàm big_connect(Bitmap b): Hàm này thc hin tìm vùng da ln nht không phi da m. - ng vin môi và mt Hàm bezier_eye(Bitmap b): Hàm này thc hin vic áp dng cong u vào là mt Hàm bezier_lip(Bitmap b): Hàm này thc hin vic áp dng cong u vào là môi 53. - ng vin môi và mt Hàm bezier_eye(Bitmap b): Hàm này thc hin vic áp dng cong u vào là mt Hàm bezier_lip(Bitmap b): Hàm này thc hin vic áp dng cong bezier u vào là môi Hàm write_to_db. - Hàm này thc hin vic ghi l. - Kết quả thực nghiệm 3.9.1. - Bảng thống kê kết quả thực nghiệm trên ảnh tĩnh, đối tượng là người Châu Á Biểu cảm Bình thƣờng (50) Vui vẻ (50) Ngạc nhiên (50) Buồn(50) Trung bình. - Bảng thống kê kết quả thực nghiệm trên ảnh động Biểu Cảm Bình thƣờng (50) Vui vẻ (50) Ngạc nhiên (50) Buồn (50) Trung bình. - Kết quả đạt đƣợc trong luận văn sau
Xem thử không khả dụng, vui lòng xem tại trang nguồn hoặc xem
Tóm tắt