« Home « Kết quả tìm kiếm

Luận văn Thạc sĩ Khoa học máy tính: Nghiên cứu mạng nơron CNN và ứng dụng trong bài toán phân loại ảnh


Tóm tắt Xem thử

- Bài toán nhận dạng chữ viết tay.
- MCR Miss Classification Rate Tỷ lệ nhận dạng sai.
- Hình 1.10.
- Hình 1.11.
- Hình 1.12.
- Hình 1.13.
- Hình 1.14.
- Hình 2.10.
- Hình 2.11.
- Hình 2.12.
- Hình 2.13.
- Hình 2.14.
- Hình 2.16.
- Lớp input gồm 28x28 nơ ron cho nhận dạng chữ từ tập dữ liệu MNIST.
- Hình 2.17.
- Hình 2.18.
- Hình 2.19.
- Hình 2.20.
- Hình 2.21.
- Hình 2.22.
- Hình 2.23.
- Hình 2.24.
- Một kiến trúc mạng CNN cho nhận dạng chữ viết từ dữ liệu MNIST.
- Giao diện chương trình nhận dạng chữ viết tay.
- Hai cách tiếp cận để nhận dạng captcha bằng CNN.
- Hình 3.10.
- Kiểu dữ liệu captcha dùng trong bài toán nhận dạng.
- Hình 3.11.
- Hình 3.12.
- Hình 3.13.
- Hình 3.14.
- Hình 3.15.
- Vùng nhận dạng liên tục nhận 2 ký tự vào 1 ảnh cắt, chưa tốt.
- Hình 3.16.
- Hình 3.17.
- Hình 3.18.
- Chương trình mô phỏng nhận dạng mã Captcha.
- Ứng dụng mạng nơ ron CNN bài toán nhận dạng chữ viết tay và bài toán giải mã Capcha..
- Chương 3 Xây dựng chương trình mô phỏng ứng dụng mạng CNN trong phân loại ảnh: Chương này giới thiệu về hai bài toán nhận dạng chữ viết tay và giải mã Capcha.
- Nhận dạng ảnh.
- Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó.
- Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng.
- Nhận dạng được giám sát và không được giám sát:.
- Bài toán nhận dạng có thể chia thành hai dạng chính là nhận dạng có giám sát và nhận dạng không giám sát..
- Với cách nhận dạng này, ta sẽ dùng một tập thư viện các mẫu chuẩn để “huấn luyện” cho hệ thống nhận dạng trước khi đưa vào sử dụng.
- Loại nhận dạng này yêu cầu phải tự định ra được các lớp mẫu và xác định được các đặc trưng của từng lớp mẫu.
- Bên cạnh phương pháp số, phương pháp cấu trúc là một trong những phương pháp truyền thống để nhận dạng mẫu.
- Cho kết quả nhận dạng với độ chính xác cao.
- Nội dung này kết hợp với kiến thức về mạng CNN trong chương 2 sẽ là nền tảng cho các việc xây dựng các ứng dụng nhận dạng ở chương 3..
- Do đó ta có thể.
- Xử lý và nhận dạng tín hiệu ảnh, radar, siêu âm.
- Nhận dạng và tổng hợp tiếng nói.
- Nhận dạng chữ viết tay và chữ ký.
- Dựa vào các đặc trưng mạng nơron nhân tạo được phân loại như Hình 2.5 sau:.
- đầu vào.
- Ví dụ đối với bài toán nhận dạng chữ viết tay từ tập dữ liệu MNIST, mỗi bức ảnh kích thước 28x28 điểm ảnh.
- Hình 2.15.
- Với bài toán nhận dạng ảnh người ta thường gọi ma trận lớp ẩn đầu vào là feature map, trọng số xác định các đặc trưng là shared weight và độ lệch xác định một feature map là shared bias.
- Tuy nhiên trong nhận dạng ảnh chúng ta cần nhiều hơn một feature map..
- Một kiến trúc mạng CNN cho nhận dạng chữ viết từ dữ liệu MNIST Mạng bắt đầu với 28 × 28 nơron đầu vào, được sử dụng để mã hóa các cường độ điểm ảnh cho ảnh MNIST.
- CNN thường được sử dụng trong các hệ thống nhận dạng hình ảnh [11.
- Thử thách nhận dạng hình ảnh quy mô lớn ImageNet là một chuẩn mực trong phân loại và phát hiện đối tượng, với hàng triệu hình ảnh và hàng trăm lớp đối tượng..
- Năm 2016, tác giả Lê Thị Thu Hằng đã báo cáo luận văn thạc sĩ về “Nghiên cứu về mạng neural tích chập và ứng dụng cho bài toán nhận dạng biển số xe” [5].
- Trong đó, tác giả cũng đã sử dụng một cấu trúc mạng CNN cho việc nhận dạng chữ số từ ảnh chụp biển số xe với tỉ lệ nhận dạng chính xác 99%..
- Năm 2017, trong luận văn “Nhận dạng và phân loại hoa quả trong ảnh màu”.
- Năm 2018, tác giả Huỳnh Văn Nhứt báo cáo luận văn thạc sĩ “Nhận dạng chữ số viết tay sử dụng kỹ thuật học sâu” [6.
- Trong luận văn này, tác giả sử dụng mô hình CNN trong công việc xây dựng nhận dạng ký tự số viết tay đạt được kết quả thực nghiệm dựa trên 10.000 tập mẫu với độ chính xác trên 99%..
- Năm 2019, tác giả Nguyễn Văn Doanh và Phạm Thế Bảo đề xuất sử dụng mạng CNN cho nhận dạng mặt người [3.
- các tác giả nghiên cứu về mạng CNN sử dụng mô hình VGG16 ứng dụng trong việc xây dựng hệ thống nhận dạng khuôn mặt tự động từ video.
- Từ kết luận trên, phần tiếp theo của luận văn sẽ nghiên cứu tìm ra cấu trúc phù hợp của mạng CNN cho hai bài toán nhận dạng chữ viết tay và giãi mã capcha..
- Ứng dụng mạng CNN cho nhận dạng chữ viết tay: Trong phần này, dựa trên bộ dữ liệu MNIST về chữ viết tay.
- Các tham số thu được của quá trình luyện mạng đối với kiến trúc mạng CNN có hiệu suất cao nhất sẽ được sử dụng trong phần mềm mô phỏng để minh họa việc nhận dạng.
- Đồng thời, kiến trúc này cũng sẽ được áp dụng cho bài toán nhận dạng mã Captcha..
- Bài toán nhận dạng chữ viết tay 3.2.1 Mô tả bài toán.
- Để xây dựng và đánh giá hoạt động của mạng CNN cho nhận dạng chữ viết tay, luận văn sử dụng MATLAB phiên bản R2019a và cơ sở dữ liệu MNIST.
- Nạp dữ liệu.
- Để tìm ra cấu trúc mạng CNN phù hợp cho nhận dạng chữ viết tay MNIST, luận văn kiểm tra ban đầu với cấu trúc mạng cơ bản đã đề xuất ở trên.
- Bảng 3.1 tổng hợp hiệu suất của mạng trong các trường hợp, thể hiện ở độ chính xác nhận dạng và thời gian thực hiện..
- Chương trình này cho phép có thể minh họa kết quả nhận dạng bằng cách nạp file ảnh dạng MNIST hoặc vẽ ký tự viết tay bất kỳ trên Bảng Icon Edit Pane (28x28).
- Quá trình hoạt động cho thấy chương trình nhận dạng có độ chính xác cao..
- Giao diện chương trình nhận dạng chữ viết tay..
- Tuy nhiên, đã có những công nghệ nhận dạng tự động được loại captcha này.
- Nhận dạng cứng là một phương pháp nhận dạng tự động mang tính kỹ thuật cao..
- Nhận dạng mềm là một phương pháp nhận dạng tự động mang tính học thuật cao.
- Có thể thấy mô hình CNN vẫn được sử dụng phổ biến do tính năng ưu việt và tiềm năng phát triển phong phú của nó đối với bài toán nhận dạng [10].
- Thông qua các kỹ thuật tiền xử lý để tách được các ký tự trong captcha ra để nhận dạng..
- Phương pháp nhận dạng toàn bộ ký tự có thể áp dụng được với hầu hết các loại captcha từ đơn giản đến phức tạp.
- Và tập kiểm tra chứa 2000 dữ liệu dùng để hiện thị khả năng nhận dạng từng kí tự trong captcha..
- 3.3.2.2 Tiền xử lý dữ liệu.
- Về cơ bản, các thao tác xây dựng mạng CNN cho nhận dạng captcha vẫn được thực hiện như đã trình bày trong phần 3.2.2..
- Mã lệnh tạo cấu trúc mạng CNN cho nhận dạng các ký tự được tách ra từ mã Captcha như sau:.
- Sau khi có được các tham số của mạng CNN từ quá trình huấn luyện, học viên xây dựng thêm một chức năng mô phỏng việc thực hiện nhận dạng mã captcha.
- Việc nhận dạng có thể được thực hiện thông qua việc nạp vào các ảnh Capcha nằm trong 12000 mẫu dữ liệu hoặc người dùng tự thêm vào.
- Chương trình mô phỏng nhận dạng mã Captcha Kết luận chương.
- Với mục đích thử nghiệm khả năng ứng dụng mạng CNN vào phân loại ảnh, nội dung chương ba đã từng bước xây dựng chương trình nhận dạng chữ viết và nhận dạng Captcha.
- Đầu tiên, học viên thực hiện tìm ra cấu trúc mạng CNN phù hợp nhất cho nhận dạng chữ viết tay trong bộ mẫu MINST có kích thước 28x28.
- Trên cơ sở đã xác định được cấu trúc mạng CNN phù hợp, trong ứng dụng nhận dạng Captcha, sau khi xử lý ảnh và tách ra các ký tự, đưa về dạng chuẩn 28x28, mạng CNN 3 lớp lại được áp dụng để huấn luyện tạo ra bộ tham số phù hợp cho xây dựng chương trình mô phỏng.
- Kết quả hoạt động cho thấy tỷ lệ nhận dạng chính xác trên 99.
- [5] Lê Thị Thu Hằng (2016), Nghiên cứu về mạng neural tích chập và ứng dụng cho bài toán nhận dạng biển số xe, Luận văn thạc sĩ công nghệ thông tin, Trường ĐH Công nghệ, ĐH Quốc gia Hà nội..
- [6] Huỳnh Văn Nhứt (2018), Nhận dạng chữ số viết tay sử dụng kỹ thuật học sâu, Luận văn thạc sĩ khoa học máy tính, Trường ĐH Bách Khoa, ĐH Đà Nẵng.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt