Technologie d'inspection visuelle de l'apparence des canettes en aluminium : une analyse complète de l'imagerie optique à l'apprentissage profond

2025/12/18 13:08

Technologie d'inspection visuelle de l'aspect des canettes en aluminium : une analyse complète, de l'imagerie optique à l'apprentissage profond


1. Introduction : Défis techniques et importance du contrôle d'aspect des canettes en aluminium


Avec le développement rapide de l'industrie agroalimentaire, la demande de canettes en aluminium, utilisées comme emballage courant, ne cesse de croître. Produites à grande vitesse (jusqu'à 15 canettes par seconde), les canettes en aluminium classiques présentent divers risques de défauts d'aspect : rayures, bosses, déformations et renflements du corps ; défauts d'impression sur le fond ; application irrégulière du mastic sur le couvercle et déformation de la languette d'ouverture. Ces défauts affectent non seulement l'esthétique du produit, mais peuvent aussi entraîner des éclaboussures ou une contamination du contenu, engendrant de graves problèmes de sécurité.


L'inspection visuelle des canettes en aluminium se heurte à de multiples défis techniques : la forte réflectivité de la surface métallique peut masquer des défauts réels ; la structure cylindrique et incurvée de la surface rend l'imagerie sujette à la distorsion ; les lignes de production à grande vitesse exigent que le système de détection prenne des décisions en quelques millisecondes ; et la diversité des types de défauts requiert des algorithmes très adaptables. Les méthodes d'inspection manuelles traditionnelles souffrent d'une faible efficacité, de subjectivité et de fatigue, et ne répondent plus aux exigences industrielles modernes. Par conséquent, la technologie d'inspection automatisée basée sur la vision industrielle est devenue incontournable pour le secteur. Elle permet une détection rapide et précise de l'aspect des canettes en aluminium grâce à l'acquisition, au traitement et à l'analyse d'images de haute précision.


Cet article analysera systématiquement le système technique d'inspection visuelle de l'aspect des canettes en aluminium, y compris la conception du système d'imagerie, les algorithmes de détection des défauts, le développement de la plateforme logicielle et les applications industrielles pratiques, fournissant une référence complète au personnel technique des domaines concernés.


2. Conception matérielle du système d'inspection visuelle


2.1 Configuration du système d'imagerie et de la source lumineuse


Le système d'imagerie est fondamental pour le contrôle visuel, et sa conception détermine directement la qualité de l'image. Compte tenu de la structure particulière des canettes en aluminium, une architecture distribuée est généralement adoptée, avec plusieurs stations d'inspection indépendantes chargées respectivement du fond, du corps et du couvercle. La station d'inspection du fond utilise une caméra matricielle haute résolution avec une source lumineuse annulaire, contrôlant précisément l'angle d'incidence de la lumière pour optimiser le contraste des caractères imprimés au laser. La station d'inspection du corps est équipée de trois modules d'acquisition 2D-3D synchronisés, chacun comprenant une caméra linéaire et un profileur laser linéaire, installés à 120° d'intervalle pour une couverture complète du corps de la canette.


La conception de la source lumineuse est essentielle pour résoudre le problème de la réflexion du métal. Compte tenu des propriétés réfléchissantes élevées des canettes en aluminium, diverses sources lumineuses spéciales sont couramment utilisées : une sphère d'intégration utilise une paroi interne hémisphérique à effet d'intégration pour réfléchir uniformément la lumière émise par le fond sur 360°, offrant ainsi une image très homogène du fond concave de la canette ; un système de source lumineuse LED composite se compose d'un éclairage sans ombre à trois anneaux, d'un éclairage sans ombre en forme de dôme, d'un éclairage annulaire à angle faible et d'un éclairage coaxial. En combinant ces sources lumineuses composites, on obtient des contours nets et des images à contraste élevé du couvercle de la canette ; une source lumineuse à double cône est constituée de deux sources lumineuses coniques concentriques, la source supérieure éclairant la partie centrale et la source inférieure la partie périphérique. Le chevauchement des champs lumineux améliore considérablement l'uniformité de l'éclairage.


2.2 Matériel d'acquisition et de traitement d'images


Les lignes de production à grande vitesse imposent des exigences strictes en matière de matériel d'acquisition d'images. Les caméras industrielles intelligentes, telles que la Cognex In-Sight Micro 1400, sont largement utilisées grâce à leur format compact (30 mm x 30 mm x 60 mm) et à leurs puissantes capacités de traitement, permettant leur intégration dans les lignes de production les plus rapides avec un encombrement minimal. Ces caméras intègrent généralement des algorithmes de vision industrielle éprouvés, prenant en charge des fonctions telles que le diagnostic, l'inspection des défauts de surface, la mesure dimensionnelle et la reconnaissance optique de caractères (OCR), ce qui accélère considérablement le développement des systèmes.


Le module de traitement s'articule généralement autour d'un ordinateur industriel, équipé d'un processeur haute performance et d'une mémoire suffisante. Lorsque la canette est acheminée vers le poste d'imagerie, un émetteur-récepteur photoélectrique est activé, envoyant un signal à la carte d'entrée/sortie de l'ordinateur industriel. Ce dernier commande alors l'allumage de la source lumineuse et l'acquisition d'une image par la caméra. L'image acquise est ensuite transmise à l'ordinateur industriel via une interface 1394 pour analyse et traitement.


3. Algorithmes de détection des défauts et implémentation technique


3.1 Détection des défauts de caractères inférieurs


La détection des caractères imprimés sur le fond de la boîte se heurte au défi du faible contraste, car les caractères imprimés au laser sont similaires en termes de matériau à celui du fond métallique de la boîte, ce qui entraîne des caractéristiques faibles. Pour résoudre ce problème, une méthode basée sur la segmentation sémantique saillante fonctionne parfaitement. Le réseau Res18-UNet utilise ResNet18 comme structure de base de l'encodeur, intégrant un module d'attention aux blocs de fonctionnalités amélioré dans chaque étape de sous-échantillonnage. En effectuant un regroupement spatial et un recalibrage des canaux des cartes de caractéristiques, la capacité du modèle à se concentrer sur la zone des personnages est améliorée. La partie décodeur adopte une stratégie de suréchantillonnage progressif, introduisant un mécanisme d'apprentissage résiduel dans chaque connexion sautée, atténuant ainsi efficacement le problème de disparition du gradient. Pour résoudre le problème de l'orientation incohérente des caractères provoquée par la rotation aléatoire des boîtes, un algorithme de correction de rotation basé sur la transformation des coordonnées polaires est largement utilisé. Cet algorithme localise d'abord le centroïde de la région du caractère grâce à une analyse des composantes connectées, calcule l'angle relatif entre le centroïde et le centre de l'image, puis effectue une transformation affine pour corriger l'orientation du caractère. Une structure de réseau convolutionnelle légère est utilisée pour la classification de caractères uniques.  Les convolutions séparables en profondeur réduisent le nombre de paramètres et les opérations de mélange de canaux améliorent la réutilisation des fonctionnalités, atteignant une vitesse de traitement de 300 caractères par seconde tout en maintenant une précision de classification de 99,5 %.


3.2 Détection des défauts du corps de la canette


Les défauts de la caisse comprennent principalement les rayures, les bosses et les déformations. La difficulté de détecter ces défauts réside dans la distorsion de l'image causée par la surface cylindrique et incurvée, ainsi que dans les interférences dues aux motifs complexes de l'arrière-plan. Une méthode d'amélioration d'image des défauts de la caisse, assistée par les informations de profondeur, améliore le taux de détection des défauts convexes et concaves grâce à la fusion de données multimodales. Cette méthode commence par la construction d'un système d'acquisition de vision trinoculaire, effectue un étalonnage conjoint à l'aide d'une mire d'étalonnage de haute précision, et établit une correspondance entre les coordonnées des pixels de l'image 2D et les coordonnées spatiales du nuage de points 3D.


Pour pallier les spécificités d'acquisition de données des boîtes cylindriques, un modèle de rétroprojection cylindrique amélioré est proposé. Ce modèle projette les données du nuage de points sur un système de coordonnées cylindriques paramétré, éliminant ainsi les distorsions de projection dues aux erreurs d'installation grâce à une optimisation de l'ajustement du nuage de points au modèle cylindrique. Lors de l'étape d'amélioration d'image, une stratégie de fusion de caractéristiques multi-échelles effectue une fusion pondérée des images de texture 2D et des cartes de profondeur à différentes résolutions. Elle met en évidence les discontinuités de profondeur pour les défauts d'indentation et renforce les gradients de contour pour les rayures.


L'algorithme HPFST-YOLOv5 améliore la précision de détection dans les environnements complexes grâce à une structure de réseau neuronal innovante. Un mécanisme d'attention hybride est intégré au cœur du réseau, intégrant le module d'auto-attention multi-têtes du Swin Transformer dans les couches d'extraction de caractéristiques à différentes échelles. L'attention locale est utilisée dans les réseaux superficiels pour capturer les défauts subtils, tandis que l'attention globale est utilisée dans les réseaux profonds pour modéliser les dépendances à longue portée. Afin de pallier l'atténuation des contours due au flou de mouvement, un filtre passe-haut est ajouté à l'entrée. Un opérateur différentiel du premier ordre, entraînable, extrait la carte de réponse des contours des défauts, qui est ensuite introduite en parallèle avec l'image originale dans le réseau principal.


3.3 Détection des défauts du couvercle/de l'extrémité de la boîte


La structure du fond de la boîte est complexe et comprend plusieurs parties fonctionnelles telles que le panneau central, les bords périphériques, la jointure et le rebord, chacune pouvant présenter des défauts spécifiques. Pour pallier cette complexité, une stratégie de détection régionale s'est avérée efficace. Des recherches menées à l'Université du Hunan proposent de diviser la zone de détection du couvercle en une région circulaire et une région annulaire. Pour la région circulaire, une méthode de détection des défauts basée sur l'analyse de blobs est utilisée, tandis que pour la détection des défauts dans la région annulaire, un algorithme basé sur l'ajustement par moindres carrés de la courbe de projection verticale en niveaux de gris est employé.


L'algorithme de clustering par taux d'entropie, combiné à des contraintes de forme a priori, localise efficacement le fond de la canette et le divise en plusieurs zones de mesure. Cet algorithme, basé sur la représentation graphique de l'image, assure une séparation précise du fond de la canette par rapport à l'arrière-plan grâce à l'optimisation de la fonction objectif. Lorsque le nombre de clusters k=2, le fond de la canette et l'arrière-plan sont parfaitement séparés ; à mesure que k augmente, le panneau central, le bord extérieur, le panneau de la couture et la courbure sont progressivement extraits. Afin de garantir la fiabilité des résultats de segmentation, des contraintes de forme a priori sont utilisées en post-traitement. Le fond de la canette et toutes ses zones de mesure étant des cercles ou des anneaux concentriques, le centre c(x,y) et le rayon r du fond de la canette sont calculés à l'aide d'un algorithme d'ajustement de cercle.


Pour la détection des défauts dans la zone centrale de l'écran, l'algorithme de regroupement et de sélection des superpixels offre d'excellentes performances. Dans un premier temps, l'algorithme de clustering basé sur le taux d'entropie génère un grand nombre de superpixels (Ni > 6000). Ensuite, un graphe d'adjacence pondéré est construit, chaque superpixel Si servant de nœud, afin de regrouper les superpixels similaires. Un indice spécifique est défini pour évaluer la variation locale de niveaux de gris de chaque région, et les zones défectueuses sont identifiées par seuillage.


3.4 Techniques de traitement de la réflexion et d'amélioration de l'image


La forte réflexion à la surface des boîtes métalliques constitue un facteur de perturbation majeur affectant la précision de la détection. Pour pallier ce problème, une technologie brevetée propose une méthode de suppression des réflexions basée sur l'analyse d'images en niveaux de gris multi-images. Cette méthode acquiert d'abord des images en niveaux de gris multi-images de l'emballage, effectue une détection des contours sur ces images et utilise les régions formées par les contours fermés détectés comme régions cibles. Elle calcule ensuite la probabilité que la région cible soit une zone réfléchissante. Cette probabilité est calculée à partir de la valeur moyenne et maximale des niveaux de gris, ainsi que des caractéristiques de réflexion globales de tous les pixels de la région cible.


La transformation gamma adaptative détermine le coefficient gamma en fonction de la probabilité de réflexion de la zone cible. Pour chaque pixel de cette zone, la valeur de gris d'origine est transformée par transformation gamma afin d'obtenir la valeur de gris actualisée, ce qui permet d'obtenir une image en niveaux de gris améliorée de l'emballage. Cette transformation s'adapte aux différentes conditions d'éclairage et de réflexion. Dans les zones à forte réflexion, le coefficient gamma est ajusté en conséquence afin de réduire l'impact de la réflexion sur la détection des défauts. Le calcul complet des caractéristiques de réflexion de la zone cible prend en compte plusieurs facteurs, notamment le premier indicateur (variation moyenne des niveaux de gris), le deuxième indicateur (cohérence de la direction du gradient) et la similarité multi-images (cohérence de la zone cible entre différentes images). Grâce à l'analyse exhaustive de ces indicateurs, le système peut distinguer avec précision les défauts réels des faux défauts dus aux réflexions, améliorant ainsi considérablement la précision de la détection.


4. Plateforme logicielle et mise en œuvre du système de détection


4.1 Architecture logicielle et flux de travail


Le système d'inspection visuelle des canettes de boissons utilise une technologie de traitement parallèle multithread, articulée autour d'un thread de contrôle principal, d'un thread d'acquisition d'images, d'un thread de traitement algorithmique et d'un thread de sortie des résultats. Le thread de contrôle principal coordonne le flux de travail de chaque module ; le thread d'acquisition d'images acquiert simultanément les données des deux stations grâce à des signaux de déclenchement externes ; le thread de traitement algorithmique exécute simultanément les algorithmes de reconnaissance de caractères et de détection de défauts ; enfin, le thread de sortie des résultats intègre les résultats de détection et pilote le dispositif de tri.


Pour garantir le fonctionnement en temps réel du système, un mécanisme d'interruption par minuterie est utilisé pour limiter strictement le cycle de détection de chaque canette. Une technologie de mappage mémoire permet un échange rapide des données d'image de grande capacité, et une technologie d'accélération GPU est mise en œuvre pour optimiser et déployer les algorithmes d'apprentissage profond. Le système intègre également une fonction d'apprentissage des paramètres, permettant aux opérateurs d'ajuster les paramètres de détection en fonction des spécifications du produit, et un module de base de données stocke les résultats de détection et les informations produit, assurant ainsi la traçabilité de la qualité.


Le logiciel de vision Maotong In-Sight facilite le développement de systèmes. Son algorithme basé sur des tableurs permet de créer des scripts sans nécessiter de connaissances avancées en programmation, offrant ainsi des fonctionnalités telles que la reconnaissance optique de caractères (OCR) et la reconnaissance de caractères, ce qui accélère considérablement le développement. Grâce aux outils de traitement d'images intelligents et aux fonctions de lecture et de vérification de caractères OCR d'In-Sight Explorer, l'apprentissage des caractères à partir d'images et la création d'une bibliothèque de caractères sont simplifiés.


4.2 Intégration du système et évaluation des performances


Le système complet d'inspection visuelle des canettes de boissons intègre trois composants principaux : des dispositifs électromécaniques, un système d'imagerie et un module de traitement. Le dispositif électromécanique assure le contrôle automatique du mouvement et le tri des canettes, incluant le port d'entrée, le système de convoyage et le système de tri ; le système d'imagerie est chargé d'acquérir des images de haute qualité ; et le module de traitement analyse et traite les images acquises.


En termes de performances, le système de détection des défauts des couvercles de canettes développé par l'Université du Hunan atteint une précision de détection supérieure à 96 %, avec un temps de détection moyen de 18,6 ms par couvercle, répondant ainsi aux exigences des lignes de production de l'industrie des boissons. Basée sur l'apprentissage profond, cette technologie de détection obtient d'excellents résultats de reconnaissance après 10 itérations d'entraînement avec un taux d'apprentissage de 0,0005, aboutissant à un taux de reconnaissance binaire final de 99,7 % et un temps d'exécution de l'algorithme de 119 ms. Le système de détection des fonds de canettes atteint quant à lui une précision de détection de 99,48 % pour différents types de fonds circulaires.


5 Applications industrielles et perspectives d'avenir


5.1 Cas d'application pratique


Le système d’inspection visuelle de l’apparence des boîtes de conserve a été appliqué avec succès dans plusieurs scénarios industriels. Les systèmes de vision industrielle de Cognex ont atteint une vitesse de 72 000 canettes par heure et une précision de 99,99 % dans la détection des codes de fond des canettes de boisson, surmontant ainsi le goulot d'étranglement technique rencontré dans l'augmentation de la vitesse de production dans l'industrie agroalimentaire.


Le dispositif de vision industrielle pour la détection des fonds de canettes utilise un système de convoyage pneumatique et d'adsorption sous vide pour assurer une transmission stable et un positionnement précis des fonds. Lors du transport du fond de canette vers le poste d'imagerie, une zone de basse pression est créée sur la surface du convoyeur par une pompe à vide. Grâce à cette différence de pression, le fond de canette est solidement adsorbé sur le convoyeur et transporté le long de celui-ci par un moteur à courant alternatif. Le système de tri classe les fonds de canettes en fonction des résultats de l'inspection, et les fonds défectueux sont séparés du convoyeur par un séparateur actionné par des impulsions d'air comprimé.


5.2 Défis techniques et tendances de développement


Malgré les progrès significatifs réalisés dans les technologies existantes, l'inspection visuelle des boîtes de conserve reste confrontée à certains défis : la détection de défauts minuscules est difficile, en particulier l'identification de micro-rayures sur des fonds complexes ; les interférences par réflexion n'ont pas été complètement résolues, notamment pour les surfaces très brillantes ; l'équilibre entre les performances en temps réel de l'algorithme et sa précision nécessite une optimisation supplémentaire ; et l'adaptabilité du système est limitée, ce qui nécessite des ajustements de paramètres lorsque la conception de la boîte change.


Les tendances de développement futures comprennent : la technologie de fusion de données multimodales combinera la texture 2D, la morphologie 3D et les informations spectrales pour fournir une description plus complète des caractéristiques des défauts ; les algorithmes d’apprentissage adaptatif optimiseront en continu le modèle à partir des données de la chaîne de production, réduisant ainsi la charge de travail liée au réglage manuel des paramètres ; une architecture combinant calcul en périphérie et calcul en nuage garantira des performances en temps réel tout en utilisant le Big Data basé sur le nuage pour entraîner des modèles plus précis ; et le développement de puces d’IA embarquées permettra de réduire la taille et la consommation d’énergie des systèmes de détection. 6. Conclusion


La technologie d'inspection visuelle des canettes de boissons intègre des avancées majeures issues de multiples domaines, tels que l'optique, la mécanique, l'électronique et la vision par ordinateur, et constitue un indicateur important du niveau d'automatisation industrielle. De la conception du système d'imagerie à l'optimisation des algorithmes, du choix du matériel au développement de la plateforme logicielle, chaque étape influe directement sur les performances de détection finales. Actuellement, les méthodes de détection basées sur l'apprentissage profond surpassent les algorithmes traditionnels à bien des égards, mais dans les applications industrielles concrètes, il est généralement nécessaire de combiner les avantages des méthodes de traitement d'images classiques et des techniques d'apprentissage profond afin de concevoir un système de détection hybride.


Avec la mise en œuvre approfondie de la stratégie nationale « Made in China 2025 », la technologie d'inspection visuelle des canettes de boissons évoluera vers une approche plus intelligente, efficace et fiable. Ceci permettra non seulement aux fabricants de canettes d'utiliser l'intelligence artificielle pour promouvoir une production intelligente et réduire les coûts de main-d'œuvre, mais s'inscrit également dans la stratégie nationale de modernisation de l'industrie manufacturière, avec des implications pratiques significatives. À l'avenir, grâce aux progrès constants des technologies de capteurs, de la théorie des algorithmes et des capacités de calcul, les systèmes d'inspection visuelle des canettes de boissons joueront sans aucun doute un rôle encore plus important dans l'industrie agroalimentaire, garantissant ainsi la qualité des produits.


Produits connexes

x