
IA composable – intelligence structurée
Cet article a été traduit de digitalassetmanagementnews.com
L’intelligence artificielle peut donner l’impression d’un esprit artificiel – un cerveau pensant créé par un ordinateur. Mais elle ressemble plutôt à des fleurs artificielles : de loin, on dirait la réalité, mais il lui manque la capacité essentielle sous‑jacente. Apple a récemment testé plusieurs services d’IA pour voir s’ils pouvaient raisonner – penser réellement. La conclusion est qu’ils ne le peuvent pas.
L’IA est indéniablement utile en gestion des ressources numériques (DAM). Alors, comment devons‑nous envisager son utilisation ? Elle peut accomplir de nombreuses tâches très bien, mais elle ne comprend rien de ce qu’elle fait. Une conséquence est que vous ne devriez probablement pas confier la réflexion à l’IA pour l’instant. Fondamentalement, elle ne sera pas capable de comprendre le support ni l’objectif de votre collection de médias. Cependant, l’IA peut être très utile pour certaines tâches, et la liste de ces tâches s’allonge rapidement.
Vous verrez beaucoup d’implémentations d’IA dans le DAM qui vous demandent de faire confiance à l’IA pour comprendre traiter vos fichiers multimédias. Les fleurs artificielles sont parfaites pour la décoration, mais elles ne vous seront d’aucune utilité si vous plantez un jardin.
Il a toujours été vrai qu’il existe beaucoup d’informations qui échappent à l’IA, en particulier les informations contextuelles :
– Quel est l’objectif de cette collection dans votre organisation ?
– Pourquoi un élément de contenu a‑t‑il été créé et sélectionné pour figurer dans le DAM ?
– Pourquoi cette personne ou cet événement est‑il important pour l’organisation ?
La liste des choses que l’IA ne peut pas savoir est très longue.
Une vision réaliste de l’IA
Au lieu de voir l’IA comme un magicien omniscient, considérons‑la comme un travailleur infatigable qui excelle dans certaines tâches. Comme ce travailleur ne comprend pas vraiment le contenu ni la finalité de votre organisation, il faut lui donner des tâches précises et évaluer les résultats. On peut même comparer plusieurs « travailleurs » (agents IA) pour voir lequel effectue la tâche le mieux ou de manière plus économique. Certaines tâches peuvent s’appliquer à tous les fichiers, d’autres ne concernent qu’un sous‑ensemble restreint.
L’IA, sous diverses formes, est présente en DAM depuis environ une décennie. On distingue :
- Des tâches matures et fiables : transcription voix‑texte, reconnaissance optique de caractères (OCR), reconnaissance faciale, identification basique d’objets, etc.
- Une nouvelle vague de capacités fiables : synthèse de texte, description d’éléments visibles dans des images, identification d’objets spécifiques, traduction de langues, etc.
- D’autres domaines en progrès rapide mais encore partiellement fiables : analyse émotionnelle ou situationnelle, autres inférences.
- Les avancées en traitement du langage naturel (NLP), qui facilitent grandement la recherche et donnent l’impression que l’IA « comprend ».
- Des limites importantes avec les grands modèles de langage (LLM), notamment leur tendance à halluciner.
L’humain aux commandes
Comme l’IA ne comprend vraiment rien et pourrait même « halluciner », elle doit agir comme un employé supervisé, non comme un acteur autonome. Confiez‑lui des tâches bien définies et vérifiez les résultats. Plusieurs cycles de formation peuvent être nécessaires avant de laisser l’agent IA travailler seul. Le rôle du gestionnaire DAM inclura de plus en plus l’évaluation et la supervision des agents d’IA.
Les évaluations devront prendre en compte : l’absence de raisonnement général, les performances sur des tâches spécifiques, l’importance de chaque analyse pour l’organisation, la personnalisation possible pour certains sous‑ensembles de fichiers, la possibilité d’optimiser les invites, la comparaison de différents modèles de base et la capacité à évoluer au fur et à mesure que de nouvelles fonctions sont ajoutées.
Ces éléments seront essentiels pour construire une IA plus consciente du contexte à l’avenir. Dans la section suivante, nous décrivons comment une solution Composable AI peut redonner le contrôle de ces puissantes capacités au gestionnaire DAM.
IA Composable
L’IA Composable désigne un système où les administrateurs peuvent créer des agents IA personnalisés pour des objectifs précis. La personnalisation peut inclure :
- Le choix du modèle de base (Foundation Model).
- La personnalisation et la révision de l’invite.
- La possibilité de tester et comparer les résultats.
- La sélection des données sources (médias, texte extrait, métadonnées…).
- Un fonctionnement manuel ou automatique.
- La sélection des champs de destination pour les résultats.
- L’enregistrement de la date, du modèle de base, de l’invite et du niveau de confiance.
- L’intégration avec votre taxonomie.
- La création de données structurées ou semi‑structurées.
- Des actions en chaîne.
- L’accessibilité via API.
- L’ajout rapide de nouvelles capacités et de nouveaux modèles.
Quelques exemples
Voici une liste d’actions possibles avec une IA composable :
- Compter le nombre de personnes dans une image.
- Rédiger une description d’image en mettant l’accent sur certains éléments.
- Tester les derniers modèles LLM pour la reconnaissance d’écriture manuscrite.
- Identifier la langue principale d’un document.
- Traduire un document dans la langue de son choix et repérer ceux qui nécessitent une traduction.
- Classer des photos selon la meilleure action de basket‑ball (ou un autre critère esthétique).
- Créer un résumé pour chacun de 100 000 documents, avec réglage précis de la longueur.
- Extraire les concepts et les personnes clés d’un document.
- Résumer une vidéo et extraire ses concepts et personnages clés.
- Trouver des liens web pertinents pour une personne, un événement, un objet ou une idée.
Ces exemples ne représentent qu’une fraction des analyses possibles. Toutes peuvent répondre à vos besoins de façon ciblée et rentable.
Tester et réviser avant le déploiement
Avec les LLM, il faut toujours tester avant de lancer une action sur un grand nombre de fichiers. Il est essentiel de pouvoir réviser les prompts. Idéalement, tout cela se fait dans la DAM, avec un groupe d’essai de fichiers et plusieurs versions de l’action pour choisir la meilleure combinaison modèle/invite. Nombre de gestionnaires DAM se plaignent de passer trop de temps à corriger les erreurs de l’IA ; il convient donc de vérifier si le taux d’erreur est acceptable, ce qui peut impliquer des tests sur des centaines ou des milliers de fichiers.
Créer des données structurées et vérifiables
Les données structurées sont primordiales pour rendre l’analyse IA utile. L’IA composable permet de générer des données structurées et semi‑structurées plutôt que des listes de mots clés opaques.
- Créez des champs dédiés, souvent personnalisés, avec des restrictions (valeur unique, multiples, libre, contrôlée…).
- Les champs à valeur contrôlée (avec liste d’options fixes) facilitent la recherche, la vérification et la correction.
- Il peut être pertinent d’autoriser l’IA à proposer de nouveaux termes contrôlés, ou au contraire de l’en limiter à une liste.
- Les résultats peuvent être ajoutés à des champs standard (par exemple pour rendre la description multilingue accessible dans les fichiers téléchargés).
- Intégrez l’analyse IA directement à votre taxonomie si vous limitez l’IA à des termes précis et si les tests montrent une haute précision.
Plus les données sont structurées, plus leur examen et leur correction sont aisés. Dans tous les cas, les administrateurs doivent pouvoir les consulter facilement.
Vers une IA DAM consciente du contexte
Aujourd’hui, l’IA ne sait ni penser ni raisonner, mais l’IA composable permet d’exploiter au mieux les capacités existantes. Même si l’IA générale n’est pas à l’horizon, on se dirige vers des systèmes plus conscients du contexte.
L’état de l’art actuel est la Génération Augmentée par Récupération (RAG). La RAG prend les données structurées pour construire une base de connaissances et fournir un contexte aux médias et à l’organisation. Elle permet d’obtenir des réponses précises à des questions formulées en langage naturel.
Pour mettre en œuvre la RAG dans la DAM, il faut des données structurées. L’IA peut extraire et analyser une partie de ces informations (notamment dans les collections riches en texte), mais une curation humaine restera indispensable pour enrichir le contexte. Le recours à une IA composable dans la DAM contribuera à rendre cette approche économiquement viable.
Des données qui valent la peine d’être conservées
Lors du développement de solutions d’IA, nous accordons une grande attention à la qualité des données, à l’impact sur les administrateurs DAM et à l’impact environnemental. L’idée est de créer des données réellement utiles et de réduire les tâches répétitives des administrateurs, afin qu’ils puissent se concentrer sur la curation et la collaboration (tout en économisant de l’énergie).
Il est également essentiel de préserver ces données lorsque vos fichiers passent d’un système DAM à un autre ou à d’autres applications. Des données structurées et plusieurs options d’exportation garantissent que le travail réalisé grâce à l’IA composable reste exploitable tout au long de la vie de la collection, quel que soit l’endroit où elle sera hébergée.