Cet article est tiré de l’article « AI & Water management – What utilities need to know now » (IA et gestion de l’eau – Ce que les services publics doivent savoir maintenant). Vous trouverez l’article complet ici.

Il est temps de sonner la cloche et de rallier l’industrie de l’eau autour de modèles et d’outils d’IA révolutionnaires, sinon vous risquez d’être laissé pour compte. La dernière itération du grand modèle de langage (LLM) GPT-4 (Generative Pre-trained Transformer 4) d’OpenAI, récemment publiée après GPT-3, a inauguré une révolution de l’IA générative. GPT-4 est multimodal car il peut recevoir des invites de texte et d’image en entrée (version limitée uniquement). Pour les entrées d’image, GPT-4 essaiera de comprendre le contenu de l’image. Il est étrange de voir la puissance de ce LLM multimodal. Le nombre de paramètres dans un LLM est souvent une mesure de sa taille et de sa complexité. Ce LLM, et d’autres semblables, utilise des centaines de milliards à des billions de paramètres. Il utilise également une combinaison de techniques d’entraînement supervisées et non supervisées par l’homme pour s’améliorer continuellement et devenir plus précis.

Ces LLM sont différents des capacités linguistiques standard que vous avez l’habitude d’obtenir de quelque chose comme Alexa ou Siri. Leur capacité avancée à travailler avec le langage naturel et les images les rend extrêmement flexibles et adaptables. Non seulement ils peuvent être incités dans un langage simple à produire un texte écrit de type humain, mais ces modèles peuvent également apprendre de nouveaux comportements simplement en leur fournissant de nouvelles données d’entraînement et en s’appuyant sur eux pour de nouvelles applications. C’est ce que l’on appelle parfois l’entraînement des données du dernier kilomètre du modèle pour une verticale spécifique, suivi d’un entraînement de type réglage fin.

Alors que ChatGPT, un chatbot, peut générer du texte de type humain à partir d’invites en langage naturel et d’images, DALL-E-2 utilise le même modèle de langage GPT-4 pour générer des images à partir d’invites en langage naturel. DALL-E-2 est un modèle d’IA basé sur un réseau neuronal développé par OpenAI capable de générer des images de haute qualité à partir de descriptions textuelles. Contrairement aux modèles traditionnels de génération d’images qui reposent sur un ensemble de données d’images préexistant, DALL-E-2 utilise une combinaison de techniques d’apprentissage profond et de traitement du langage naturel (NLP) pour générer des images originales à partir d’entrées textuelles.

DALL-E-2 a généré cette image originale en quelques secondes à partir de la simple invite en langage clair « un réseau de canalisations 3D en forme de robot ».

Ce n’est que le début. Bien que ces modèles ne soient capables que d’une complexité limitée pour le moment, de futures itérations plus puissantes et plus sophistiquées seront éventuellement publiées. Le modèle de GPT-3 est basé sur 175 milliards de paramètres, par exemple, et bien qu’il ne soit pas clair au moment de la publication combien de paramètres GPT-4 possède, certains prédisent que d’autres LLM pourraient utiliser jusqu’à un billion de paramètres. Ainsi, bien que ces modèles de langage soient puissants maintenant, ils ne feront que s’améliorer, ce qui amène à se demander ce qu’ils pourraient faire d’autre.

Et c’est pourquoi l’industrie de l’eau devrait intervenir maintenant, car les outils d’IA auront des impacts différents selon le domaine pour lequel ils sont développés et les données sur lesquelles ils sont formés. Pour que ces modèles aient une application profonde et véritable dans l’industrie de l’eau, ils ont besoin de données et d’informations spécifiques à l’industrie.

Conduire le dernier kilomètre de données dans le secteur de l’eau

Nous devons commencer à examiner ce que nous pourrions appeler « le dernier kilomètre de données » dans l’industrie de l’eau. C’est là que nous devenons très précis sur les données et les concepts de notre industrie, afin que nous puissions commencer à former ces modèles, et les personnes qui les utilisent, pour aider à relever les défis uniques du secteur de l’eau. Des données volumineuses, diversifiées et représentatives qui reflètent fidèlement l’industrie de l’eau sont essentielles pour que ces IA soient utiles à l’industrie. Nous devons enseigner à ces modèles le vocabulaire spécialisé, le jargon, les données pertinentes et les concepts qui sont uniques au secteur de l’eau.

Parce que, comme nous l’avons vu ici, l’un des défis liés à la précision de ces nouveaux LLM est qu’ils sont influencés par leurs biais de données et d’entraînement. Le modèle GPT-4, par exemple, apprend à la fois à partir de données textuelles et de renforcement d’humains, à l’aide d’une technique appelée apprentissage par renforcement à partir de commentaires humains (FLHF). La technique affine le modèle de base en utilisant la rétroaction humaine pour guider le processus d’apprentissage de l’IA. Cependant, les données et les personnes participant à la formation du modèle peuvent ne pas être représentatives des utilisateurs finaux potentiels, ce qui peut affecter les types de résultats produits par ces modèles.

Il y a d’autres problèmes avec ces modèles. Par exemple, le modèle de ChatGPT peut halluciner, vous donnant de mauvaises réponses qui semblent logiquement solides. Ce n’est pas non plus une IA explicable, ce qui en fait une sorte de boîte noire où nous ne comprenons pas comment elle arrive à ses réponses. Nous avons besoin de personnes ayant des connaissances de l’industrie pour tester l’exactitude de ces modèles et les superviser pour s’assurer que les modèles sont adaptés à notre secteur.

Imaginez ce qui pourrait arriver si les services publics du monde entier mettaient en commun leurs données de compteurs horaires anonymisées pour aider à former et à exploiter ces nouveaux modèles d’IA pour notre secteur. Avec un énorme ensemble de données de compteurs mondiaux, par exemple, il peut être possible de fournir le concept de compteurs virtuels à des services publics qui n’ont peut-être pas les ressources nécessaires pour installer et déployer des compteurs AMI. Les compteurs virtuels pourraient servir d’entrée de données puissantes pour tous les types d’analyses opérationnelles, y compris les jumeaux numériques. En collaborant sur les données du dernier kilomètre du secteur de l’eau, les services publics pourraient utiliser la puissance de l’IA pour créer une compréhension plus complète de l’utilisation et des modèles d’eau, ce qui pourrait éclairer des stratégies de gestion de l’eau plus efficaces et conduire à de meilleurs résultats pour les clients et l’environnement.

C’est une opportunité pour tous les acteurs du secteur de l’eau, des entreprises innovantes de l’eau aux opérateurs de services publics ayant des décennies de connaissances tacites (y compris certains qui sont sur le point de prendre leur retraite et d’emporter ces connaissances avec eux), de collaborer ensemble à l’échelle mondiale et d’introduire le contexte, la supervision et les données de l’industrie de l’eau dans ces modèles, afin que les innovateurs de notre secteur puissent développer et combiner des solutions d’IA adaptées aux connaissances et aux objectifs spécifiques de l’industrie de l’eau au profit de tous les services publics. grands et petits.

Démocratiser les opportunités d’IA pour les services publics de toutes tailles; ne remplace pas le travail

Pour les petits services publics ou les services publics aux ressources limitées, ces nouveaux développements en matière d’IA peuvent sembler intimidants ou hors de portée. Mais en réalité, ces nouveaux modèles de langage démocratisent la technologie de l’IA parce que les gens n’ont pas besoin de changer leurs habitudes de manière aussi significative ou de s’entraîner sur un programme entièrement nouveau pour voir les avantages. Ils permettent aux gens d’accéder à la puissance de l’IA sans avoir besoin de connaissances et de compétences spécialisées – tout ce dont vous avez besoin est un langage simple et un peu de créativité pour que l’IA produise ce dont vous avez besoin (l’ingénierie rapide pourrait être un objectif intéressant pour le secteur de l’eau).

Les possibilités de synthèse offertes par ces outils à elles seules contiennent des applications utiles dans le travail quotidien. Imaginez que vous introduisiez tous les types de données utilitaires dans un assistant d’IA utile qui pourrait ensuite vous donner des informations en langage clair sur les données en quelques secondes. Avant même d’analyser les données, ces modèles peuvent aider les non-experts à écrire un bon échantillon de code pour extraire des informations pertinentes, telles que la consommation moyenne d’eau, différents types de lectures de pression ou des données sur la qualité de l’eau. Il peut être en mesure d’aider notre secteur à prétraiter les données qui n’ont pas encore été nettoyées, ou même de nous dire ce qui doit se passer pour prétraiter les données.

Vous pourriez être un opérateur dans un très petit service public qui a beaucoup d’expertise et vous savez que vous avez une fuite parce que vous l’avez entendue, mais vous avez besoin de plus d’informations à ce sujet. Ces nouveaux modèles de langage ouvrent la porte aux opérateurs de services publics utilisant le langage naturel pour communiquer avec le modèle d’IA et expérimenter les types d’informations qu’il peut vous donner. Peut-être qu’il pourrait suggérer les données dont vous avez besoin pour mieux comprendre le problème, presque comme avoir un assistant de données. Et en ce sens, ces modèles d’IA ne sont pas un remplacement du travail, mais un partenariat avec l’IA parce qu’ils n’ont tout simplement pas l’expérience du monde réel et l’expertise tacite que les êtres humains dans le secteur de l’eau ont.

Bien qu’il existe déjà beaucoup de données pour commencer à expérimenter et à entraîner ces modèles pour le secteur de l’eau, il existe également des « données en tant que service » (DAAS – voir Forum des cygnes pour en savoir plus sur ce sujet), des modèles commencent à émerger pour combler le fossé pour les petits services publics qui peuvent manquer de données, de ressources, de capacités et d’expertise pour collecter les données dont ils ont besoin pour obtenir des réponses de qualité de l’IA. Ces nouveaux modèles commerciaux prennent la responsabilité d’acquérir les bons capteurs pour les bons problèmes et emplacements, ainsi que de mettre en place des communications de données, un nettoyage des données et des analyses afin que le service public puisse se concentrer sur les avantages des données. Cette combinaison de logiciels et de services peut amener n’importe quel petit utilitaire à bord avec les avantages de ces technologies très rapidement.

Le secteur de l’eau ne devrait pas avoir peur de tester, de jouer et d’expérimenter avec ces nouveaux outils d’IA pour voir comment ils peuvent fonctionner pour eux. Des petites villes aux mégapoles, du personnel de terrain aux cadres, les services publics peuvent intervenir et commencer à jouer, à innover et à apprendre, même avec un minimum de données, comment l’IA peut faciliter leur travail.

Enfin, il s’agit d’un appel à toutes les sources d’expertise et de connaissances approfondies de l’industrie de l’eau – opérateurs et gestionnaires de services publics, ingénieurs, scientifiques, universitaires – à apporter leurs connaissances spécialisées à l’apprentissage automatique afin de faire évoluer son résultat intelligent et d’explorer comment ces LLM peuvent mieux prendre des décisions dans le secteur de l’eau.

#QatiumExperts

Qatium est co-créé avec des experts et des leaders d’opinion de l’industrie de l’eau. Nous créons du contenu pour aider les services publics de toutes tailles à faire face aux défis actuels et futurs.

Gigi Karmous-Edwards, experte et consultante en jumeaux numériques dans le secteur de l’eau chez Karmous Edwards Consulting LLC, est membre de la communauté de Qatium.

You might also like...