« Home « Kết quả tìm kiếm

Nhận dạng chữ cho ảnh màu thương hiệu


Tóm tắt Xem thử

- NHẬN DẠNG CHỮ CHO ẢNH MÀU THƯƠNG HIỆU.
- Nhận dạng chữ in nói chung và nhận dạng chữ in trên ảnh màu là những bài toán có nhiều ứng dụng trong thực tế và thu hút được nhiều sự quan tâm nghiên cứu.
- Ảnh thương hiệu (logo) là một phần không thể thiếu của quá trình này, và luôn được bổ sung vào cơ sở dữ liệu về các doanh nghiệp..
- Để khai thác thông tin ảnh thương hiệu trong các cơ sở dữ liệu, có thể dựa vào hai thành phần chính: phần hình ảnh và phần chữ (text).
- Phương pháp được đề cập trong luận văn này nhằm giải quyết vấn đề trích xuất dữ liệu text từ ảnh thương hiệu một cách tự động, nâng cao độ chính xác và giảm thiểu chi phí cho hoạt động nhập liệu..
- Quan sát một số cơ sở dữ liệu ảnh thương hiệu, có thể thấy ảnh thương hiệu chỉ bao gồm thông tin dạng văn bản (text) chiếm một phần đáng kể, và có thể giải quyết bằng phương pháp nhận dạng chữ thông thường.
- Tuy nhiên, một phần không nhỏ ảnh màu thương hiệu ngoài text thường có các yếu tố hình họa đi kèm, chính sự nhập nhằng giữa vùng chữ in và vùng hình họa làm sự khó khăn khi trích xuất text tăng lên rất nhiều so với nhận dạng chữ in trên ảnh xám truyền thống.
- Để giải quyết vấn đề đó, luận văn đã đề xuất giải pháp kết hợp giữa phương pháp grayscale và phân đoạn ảnh cải tiến, dựa trên chính sự khác biệt về màu sắc và cảm nhận của mắt người, một nguyên tắc thường thấy trong thiết kế ảnh màu thương hiệu..
- Bài toán nhận dạng chữ in trên ảnh màu gồm ba công đoạn chủ yếu:.
- tiền xử lý, nhận dạng kí tự và hậu xử lý.
- Trong luận văn này tập trung chủ yếu vào giai đoạn tiền xử lý, cụ thể là quá trình grayscale và phân đoạn ảnh, nhằm đưa ra những cải tiến để cải thiện độ chính xác của kết quả nhận dạng sau cùng.
- Đồng thời cũng sử dụng máy nhận dạng văn bản Tesseract để xây dựng thành một hệ thống hoàn chỉnh..
- Trong phần thực nghiệm của luận văn, chúng tôi tiến hành nhận dạng.
- chữ in trên ảnh màu thương hiệu với nhiều kích cỡ chữ, font chữ và màu sắc khác nhau.
- Kết quả sau cùng của hệ thống nhận dạng chữ in được cải thiện rõ rệt khi so sánh với các phương pháp phân đoạn khác và hệ thống nhận dạng hiện tại..
- Từ khóa: Nhận dạng chữ in, ảnh thương hiệu màu, biểu đồ Histogram, phân đoạn ảnh, nhị phân hóa..
- 2 Cơ sở lý thuyết cho phân đoạn ảnh 13 2.1 Ảnh màu thương hiệu.
- 2.4 Chuyển đổi ảnh màu sang ảnh mức xám.
- 2.5 Phân đoạn ảnh.
- 2.6 Một số phương pháp phân đoạn.
- 2.7 Máy nhận dạng văn bản Tesseract.
- 3 Phân đoạn ảnh màu thương hiệu 24 3.1 Pha 1: Chuyển đổi ảnh màu sang ảnh mức xám.
- 3.2 Pha 2: Phân đoạn ảnh phân cấp.
- 3.2.3 Thuật toán Arifin cải tiến lựa chọn ngưỡng tự động 29 3.3 Pha 3: Nhận dạng ký tự.
- 4.2 Thực nghiệm về phân đoạn ảnh.
- 4.3 Thực nghiệm nhận dạng.
- 2.1 Ảnh thương hiệu màu.
- 2.4 Ảnh gốc và vùng ảnh sau phân đoạn.
- 3.1 Sơ đồ hệ nhận dạng ký tự cho ảnh màu thương hiệu.
- 3.2 Chuyển đổi ảnh màu sang ảnh mức xám.
- (a): ảnh gốc, (b) ảnh độ sáng, (c) ảnh mức xám áp dụng phương pháp của Rasche, (d) ảnh mức xám áp dụng phương pháp của Mark 26 3.3 Ảnh màu thương hiệu.
- 3.4 Ảnh mức xám sau khi biến đổi sử dụng phương pháp của Mark.
- 3.6 Nhận dạng văn bản trên ảnh đã phân đoạn bằng Tesseract 30 4.1 Ảnh thương hiệu sau phân đoạn áp dụng phương pháp Otsu 34 4.2 Ảnh thương hiệu sau phân đoạn bằng phương pháp phân cấp Arafin.
- 4.3 Ảnh thương hiệu sau phân đoạn bằng phương pháp phân cấp K-means.
- 4.4 Kết quả nhận dạng với các chỉ số RCR, RJR và ER cho mỗi mô hình.
- URL http://dx.doi.org/10.1016/j.patrec .
- URL http://dx.doi.org/10.1109/CSSE.2008.