Facebook a apporté des améliorations majeures au modèle d'IA qu'il utilise pour aider les aveugles et les malvoyants à identifier les images sur la plateforme. Les mises à jour de cet outil d'intelligence artificielle l'ont rendu encore plus fiable pour fournir des descriptions précises des images.
Dans un article de blog À propos de Facebook, Facebook a décrit les modifications apportées à son outil d'IA d'identification d'image. Facebook appelle cette technologie le texte alternatif automatique (AAT).
Ce système d'IA a été initialement déployé en 2016 et a depuis permis aux malvoyants d'entendre des descriptions d'images générées par l'IA à l'aide de lecteurs d'écran. Aujourd'hui, Facebook présente "la nouvelle génération" d'AAT.
Facebook a amélioré le nombre d'éléments et de concepts que son IA peut reconnaître de manière fiable. Il s'est également efforcé de rendre ces descriptions plus précises, car l'IA peut désormais reconnaître les animaux, les activités et les points de repère sur une photo. Par exemple, une description pourrait être la suivante :"Peut être un selfie de 2 personnes, à l'extérieur, la tour penchée de Pise."
L'outil AI peut même identifier l'emplacement et la taille des éléments sur une photo. Cela permet à l'outil de peindre une meilleure image de ce à quoi ressemble réellement la photo. Auparavant, le système se limitait à fournir des descriptions vagues qui n'incluaient pas la position des personnes et des objets dans une image.
Facebook a atteint ce nouveau niveau de détail en utilisant un modèle "formé sur des données faiblement supervisées sous la forme de milliards d'images Instagram publiques et de leurs hashtags". Cela permet à l'IA de reconnaître avec précision plus de 1 200 concepts, ce qui est bien plus que ce que l'outil d'origine pouvait faire.
Malgré cette précision améliorée, Facebook laisse encore place à l'erreur. C'est pourquoi l'expression "peut être" précède chaque description de photo, juste au cas où l'outil rapporte de manière inexacte le contenu de l'image.
Facebook a noté l'impact positif que cette mise à jour aura sur la communauté, déclarant :
Ces avancées aident les utilisateurs aveugles ou malvoyants à mieux comprendre ce qu'il y a dans les photos publiées par leur famille et leurs amis, et dans leurs propres photos, en fournissant des informations plus (et plus détaillées).
Le nouvel outil d'IA amélioré de Facebook est prometteur pour la croissance des outils d'accessibilité sur le Web et établit une nouvelle norme d'accessibilité sur les réseaux sociaux. Espérons que d'autres plates-formes mettront en œuvre un outil similaire, car il serait d'une aide précieuse pour les utilisateurs malvoyants.