Accueil » Actualité » Certaines photocopieuses font des fautes quand elles scannent [MAJ]

Certaines photocopieuses font des fautes quand elles scannent [MAJ]

Etonnant, et parfois très gênant : certaines photocopieuses multifonctions (qui font donc aussi office de scanner) de la marque Xerox font parfois des erreurs quand elles scannent. Plus exactement, les modèles 7530, 7328, 7346, 7545, 7535 et 7556 de la gamme WorkCentre et 9203, 9201 et 8700 de la gamme ColorQube ont dans certains cas précis un comportement atypique qui peut générer des erreurs dans les fichiers scannés. Le problème est simple : il se peut que certains chiffres soient remplacés par d’autres. L’erreur touche essentiellement les chiffres qui se ressemblent, comme 8, 6 et 9.

Un problème de scanner

Premièrement, l’erreur potentielle ne touche que la partie scanner : les copies classiques ne sont pas touchées. Deuxièmement, le problème ne se produit qu’en qualité normale, un mode qui n’est pas sélectionné par défaut. Les appareils scannent en effet en mode « haute qualité » par défaut. Enfin, le problème ne se pose que sur certaines polices, comme l’Arial, et uniquement quand la taille du caractère est faible (de l’Arial 7 pour la personne qui a découvert le problème).

L’explication

Image 1 : Certaines photocopieuses font des fautes quand elles scannent [MAJ]Le mode normalQuand toutes les conditions sont réunies, il est possible que des erreurs apparaissent, l’appareil l’indique d’ailleurs dans certains cas, comme le montre l’image ci-contre. La raison vient de la façon de scanner : en mode normal, le scanner essaye de proposer des images dont la taille (en terme d’octets) est faible, en utilisant une compression de type JBIG2. Cet algorithme de compression est basé sur un dictionnaire d’éléments qui sont répliqués dans l’image finale. Concrètement, quand l’algorithme trouve un caractère (ou plus exactement une zone contenant des caractères), il va la sauvegarder et vérifier si l’image complète contient des zones similaires (et pas identiques, la distinction est importante). Si c’est le cas, les zones en question seront remplacées par la première trouvée, ce qui permet de limiter les artefacts de compression et diminuer la taille de l’image. Ce n’est pas un OCR, dans le sens où il n’y a pas de reconnaissance de caractères, simplement une détection des zones similaires.

Image 2 : Certaines photocopieuses font des fautes quand elles scannent [MAJ]Les erreurs

C’est bien là le problème : quand on travaille avec une résolution faible (200 ppp par exemple) sur des images contenant des textes écrits dans une police qui différencie peu les chiffres (typiquement Arial) et avec des caractères de petite taille, l’algorithme confond les 6 et les 8 (notamment) et considère qu’un 86 et un 66 sont similaires. Il y a donc de fortes chances que ces nombres, s’ils sont présents, soient intervertis ou modifiés.

La personne qui a découvert le problème s’est rendu compte du souci en scannant un plan : les zones contenant les surfaces de chaque pièce étaient peu définies et le scanner a tout simplement remplacé trois valeurs différentes par une seule zone.

En attendant une correction de la part de Xerox, on peut s’étonner de la présence d’un problème de ce type en 2013 : si la taille des fichiers était un problème il y a quelques années, ce n’est plus vraiment le cas actuellement. De plus, l’interface des appareils montre bien que le problème est connu chez le constructeur. Qui plus est, même si le cas est assez rare, il est gênant : rien n’indique dans le fichier final que l’algorithme de compression a pu générer des erreurs…

MAJ : Xerox a réagi, en indiquant d’une part que le problème ne touche que la partie scanner et en expliquant comment régler les paramètres pour éviter que le problème ne survienne. De plus, la société prépare un patch pour les appareils touchés, qui désactivera tout simplement l’algorithme posant des problèmes.