« Home « Kết quả tìm kiếm

Binarisation d’images de documents graphiques


Tóm tắt Xem thử

- Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents à niveaux de gris.
- La technique de seuillage global est affectée à la première étape et a pour but d’éliminer la partie du fond de l’image.
- La deuxième est basée sur la segmentation hiérarchique floue de Gadi et Benslimane pour rendre l’objet dans l’image plus net.
- La classification finale d’un pixel sera déterminée grâce à la fonction d’agrégation à partir de ses différents degrés d’appartenance qui sont calculés à tous les niveaux de l’arbre.
- CHAPITRE 2 : ETAT DE L’ART ...9.
- Construction de l’arbre quaternaire ...22.
- Figure 3.2 : Image originale – jaures_patie1.tif...21.
- Figure 3.3 : Image intermédiaire de jaures_patie1.tif...21.
- Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape ...21.
- Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire...23.
- Figure 3.6 : Quadrillage de l’image intermédiaire ...25.
- Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif ...27.
- Figure 4.1 : Image originale jaures.tif ...28.
- Figure 4.2 : Image originale harchure.tif...28.
- Figure 4.3 : Image originale plan2.tif ...28.
- Figure 4.4 : Image originale extraire_1.tif ...28.
- Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée .
- Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée .
- Figure 4.7 : Résultats de l’image plan2.tif en appliquant : ...32.
- Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée .
- Le texte risque donc de fusionner des différentes parties du graphique à cause du changement faible d’intensité des pixels du fond et ceux de l’objet.
- Travaillant avec l’image de documents graphiques, nous supposons toujours que l’image contient l’objet noir (des lignes, des textes) sur le fond blanc..
- Ce stage se situe dans la problématique de la segmentation d’images et de chercher une méthode simple mais efficace pour l’image de documents graphiques afin de séparer clairement le fond et l’objet.
- Autrement dit, il s’agit de trouver une méthode de binarisation qui peut déterminer automatiquement et efficacement le seuil pour chaque point de l’image..
- CHAPITRE 2 : ETAT DE L’ART 2.1.
- La segmentation, un traitement essentiel des images, consiste à créer une partition de l’image en des sous-ensembles appelés régions Ri.
- Le but de la segmentation est d’extraire de l’image originale un certain nombre d’entités différentes appelées objets ou régions.
- En général, cette approche ne conduit pas directement à une segmentation de l’image à cause de la continuité rare des contours.
- Il faut donc procéder à une fermeture de contours si on souhaite une partition complète de l’image.
- Définition : la binarisation (le seuillage) est la technique de classification la plus simple où les pixels de l’image sont partagés par un seul seuil s en deux classes : ceux qui appartiennent au fond et ceux qui appartiennent à la scène (l’objet).
- Soit l’image I (M x N), supposons que f(x, y) représente le niveau de gris du pixel aux coordonnées (x, y), 0 ≤ x ≤ M , 0 ≤ y ≤ N et s est le seuil choisi, les pixels de l’objet sont ceux ayant le niveau de gris inférieur à s et les autres ayant le niveau de gris supérieur à s sont des pixel du fond.
- Dans la méthode de binarisation globale un seuil unique est calculé à partir d’une mesure globale sur toute l’image.
- Rohrer afin d’obtenir une bonne méthode de binarisation pour l’image de documents.
- dans l’image d’étiquettes à trois niveaux.
- ‘0’ qui est le résultat de l’opérateur gradient.
- Dans [Gadi,2000], la classification d’un pixel dépend de ses degrés d’appartenance calculés dans des régions locales qui sont créées par le découpage de l’image originale selon le principe de l’arbre quaternaire.
- dans l’intervalle [0, 1] et qui quantifie le degré d’appartenance de l’élément x au sous- ensemble A.
- « noir » à partir de l’image originale à niveaux de gris.
- En définissant un intervalle flou, la fonction d’appartenance nous permet d’obtenir deux sous ensembles flous représentant le « noir » et le « blanc » de l’image..
- Ν qui associe à chaque niveau de gris entre 0 et L-1 la quantité de pixels de l’image qui possèdent cette intensité lumineuse [Braviano,1995]..
- h i , où n i le nombre de pixels de niveau de gris i dans l’image..
- Où δ T 2 , δ B T , δ W 2 sont successivement la variance totale de l’image, la variance inter- classes (between-class variance) et la variance intra-classes (within-class variance)..
- la moyenne totale de tous les points dans l’image.
- • p i : la probabilité d’occurrence du niveau de gris i dans l’image.
- la somme des probabilités d’occurrence des niveaux de gris des pixels du fond et celle de l’objet en prenant le seuil t..
- • [min, max] est l’intervalle dynamique de l’image..
- Selon la théorie de l’information, l’entropie est une mesure de quantité d’information d’un système.
- i = 1 , k , appelé la fonction d’appartenance (membership function), l’entropie floue de l’ensemble S est définie par.
- Le principe de ces méthodes est de chercher une partition de l’image dont l’entropie est la plus grande.
- De nombreuses méthodes sont proposées en se basant sur des variations de l’entropie d’une partition.
- où p i est la probabilité d’occurrence du niveau de gris i dans l’image..
- Dans ce cas, la distribution de probabilité de l’objet P t et la distribution de probabilité du fond (1 - P t ) sont prises en compte en déterminant l’entropie de la partition..
- C’est une méthode qui se spécialise pour l’image de documents historiques..
- Supposons que t soit la couleur apparaissant le plus souvent dans l’image.
- Les deux facteurs mw et mb sont déterminés par expériences en évaluant l’entropie de l’image entière et dédiés particulièrement à un type d’images observé..
- Décrite dans [Gadi,2000], cette méthode est comme une représentante de l’approche locale adaptative.
- Construction de l’arbre quaternaire : l’image originale est divisée consécutivement en quatre sous images de taille de plus en plus petite en évaluant le critère d’homogénéité.
- Chaque sous-image est associée à un nœud de l’arbre quaternaire.
- Calcul des degrés d’appartenance : Les degrés d’appartenance de tous les pixels sont calculés à chaque niveau de l’arbre..
- En conséquence, les faux pixels sont classés facilement comme les pixels de l’objet.
- L’affectation de cette méthode à l’image jaures_partie1.tif (figure 3.2) donne un résultat inattendu (figure 2.3)..
- a) Le découpage b) L’image binarisée, avec h = max.
- L’histogramme de l’image de document contient deux modes : une forte correspondant au fond et une faible correspondant à l’objet.
- Cependant ce qui est important est celui de l’objet.
- La méthode proposée peut être considérée comme la combinaison de l’approche globale et l’approche locale.
- La deuxième étape consiste à raffiner le résultat de l’étape précédente pour rendre l’objet plus net.
- le niveau de gris du pixel (x, y) de l’image originale I..
- le niveau de gris du pixel (x, y) de l’image intermédiaire I I .
- Une méthode de seuillage global nous aide à chercher un seuil pour toute l’image..
- Figure 3.2 : Image originale – jaures_patie1.tif Figure 3.3 : Image intermédiaire de jaures_patie1.tif.
- Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape.
- Cela vient du fait que l’illumination n’est pas le forcément constante sur l’image.
- Soit O Ri l’ensemble des pixels portant la valeur originale d’une région rectangle (une sous-image) quelconque R i de l’image intermédiaire I I .
- On peut considérer R i comme un nœud de l’arbre et R 0 comme la racine I I.
- Construction de l’arbre quaternaire.
- Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire.
- Il faut donc déterminer la taille minimale de l’échantillon pour appliquer le test.
- Card : la cardinalité de l’ensemble O Ri.
- taille min : la taille minimale de l’échantillon pour l’application du test statistique.
- Figure 3.6 : Quadrillage de l’image intermédiaire.
- µ F de chaque pixel sont calculés pour chaque niveau k de l’arbre..
- Comme les données traitées dans cette étape contiennent essentiellement des pixels de l’objet, on doit assurer la qualité de l’objet obtenu à la fin.
- Dans ce cas, Il risque de perdre une partie de l’objet où l’intensité du niveau de gris est forte (plus claire).
- Tandis que si l’on utilise la fonction max (t-conorme de Zadeh), les pixels de l’objet sont bien conservés et à la fois les faux pixels à la frontière objet-fond sont effacés.
- Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif.
- La méthode proposée a été implémentée et testée avec un ensemble des images de documents graphiques existant dans la bibliothèque de l’équipe.
- Figure 4.1 : Image originale jaures.tif.
- Figure 4.2 : Image originale harchure.tif.
- Figure 4.3 : Image originale plan2.tif Figure 4.4 : Image originale extraire_1.tif.
- Nous remarquons que les images c) dans les figures de 4.5 à 4.8 sont des résultats obtenus par la méthode de Gadi et Benslimane avec un changement : la fonction d’agrégation est t-norme (min) de Zadeh..
- Figure 4.7 : Résultats de l’image plan2.tif en appliquant : a) la méthode propos ée .
- Dans la figure 4.5c) il y a des faux pixels classés à l’objet, et les bords de l’objet ne sont pas lisses..
- Le résultat de Trier et Taxt dans 4.7d) serait le meilleur parmi les 4 résultats (figure 4.7a) b) et c)) si une zone solide de l’objet n’est pas disparue..
- La raison ici, c’est que le fond sur l’image originale extrait_1.tif est déjà tout à fait homogène..
- #Régions : le nombre de régions dans l’image sans compter le fond.
- Néanmoins, le résultat final de cette méthode dépend du résultat de l’étape de seuillage global.
- Observant l’image originale et le résultat dans la figure 4.8a), on trouve que le fond de l’image originale est vraiment uniforme et le résultat de la première étape est déjà parfait.
- Il risque de perdre des points de l’objet.
- Cependant, le test d’homogénéité de façon automatique pour une région de l’image est encore un problème ouvert..
- Néanmoins, lorsque l’image issue de la première étape est trop homogène (i.e variance très faible) le résultat issu de la deuxième se dégrade car la condition d’arrêt liée à la construction de l’arbre quaternaire n’est plus vérifiée