Skip to main content

Dit artikel is afkomstig uit het artikel “AI &waterbeheer – Wat nutsbedrijven nu moeten weten.” Het volledige artikel vind je hier.

Het is tijd om aan de bel te trekken en de waterindustrie te mobiliseren rond baanbrekende AI-modellen en -tools, anders loopt u het risico achter te blijven. De nieuwste iteratie van OpenAI’s Large Language Model (LLM) GPT-4 (Generative Pre-trained Transformer 4), onlangs uitgebracht na GPT-3, heeft een generatieve AI-revolutie. GPT-4 is multimodaal omdat het zowel tekst- als afbeeldingsprompts als invoer kan ontvangen (alleen beperkte release). Voor beeldinvoer zal GPT-4 proberen de inhoud van de afbeelding te begrijpen. Het is griezelig om de kracht van deze multimodale LLM te zien. Het aantal parameters in een LLM is vaak een maat voor de grootte en complexiteit ervan. Deze LLM, en degenen zoals deze, gebruikt honderden miljarden tot biljoenen parameters. Het maakt ook gebruik van een combinatie van door mensen gecontroleerde en onbewaakte trainingstechnieken om voortdurend beter en nauwkeuriger te worden.

Deze LLM’s verschillen van de standaard taalvaardigheden die je gewend bent te krijgen van zoiets als Alexa of Siri. Hun geavanceerde vermogen om te werken met natuurlijke taal en beelden maakt ze uiterst flexibel en aanpasbaar. Niet alleen kunnen ze in gewone taal worden aangespoord om mensachtige geschreven tekst te produceren, deze modellen kunnen ook nieuw gedrag leren door ze eenvoudigweg nieuwe trainingsgegevens te geven en erop voort te bouwen voor nieuwe toepassingen. Dit wordt ook wel last-mile datatraining van het model voor een specifieke vertical genoemd, gevolgd door fine-tuning type training.

Terwijl ChatGPT, een chatbot, mensachtige tekst kan genereren uit natuurlijke taal- en beeldprompts, gebruikt DALL-E-2 hetzelfde GPT-4-taalmodel om afbeeldingen te genereren uit natuurlijke taalprompts. DALL-E-2 is een op een neuraal netwerk gebaseerd AI-model ontwikkeld door OpenAI dat in staat is om afbeeldingen van hoge kwaliteit te genereren uit tekstuele beschrijvingen. In tegenstelling tot traditionele beeldgeneratiemodellen die afhankelijk zijn van een reeds bestaande dataset van afbeeldingen, gebruikt DALL-E-2 een combinatie van deep learning-technieken en natuurlijke taalverwerking (NLP) om originele afbeeldingen te genereren uit tekstuele invoer.

DALL-E-2 genereerde deze originele afbeelding in een paar seconden van de eenvoudige duidelijke prompt "een 3D-pijpnetwerk in de vorm van een robot."

Dit is nog maar het begin. Hoewel deze modellen op dit moment slechts tot zoveel complexiteit in staat zijn, zullen toekomstige, krachtigere, geavanceerde iteraties uiteindelijk worden vrijgegeven. Het model van GPT-3 is bijvoorbeeld gebaseerd op 175 miljard parameters, en hoewel het op het moment van publicatie niet duidelijk is hoeveel parameters GPT-4 heeft, voorspellen sommigen dat andere LLMs tot een biljoen parameters. Dus hoewel deze taalmodellen nu krachtig zijn, zullen ze alleen maar beter worden, waardoor je je afvraagt, wat zouden ze nog meer kunnen doen?

En daarom moet de waterindustrie nu inspringen, omdat AI-tools verschillende effecten zullen hebben, afhankelijk van het domein waarvoor ze zijn ontwikkeld en de gegevens waarop ze zijn getraind. Om ervoor te zorgen dat deze modellen een diepe, echte toepassing hebben in de waterindustrie, hebben ze branchespecifieke gegevens en intelligentie nodig.

We moeten gaan kijken naar wat we ‘de laatste mijl aan data’ in de waterindustrie zouden kunnen noemen. Het is waar we heel specifiek worden over gegevens en concepten in onze industrie, zodat we kunnen beginnen met het trainen van deze modellen en de mensen die ze gebruiken, om de unieke uitdagingen van de watersector aan te pakken. Grote, diverse, representatieve gegevens die de waterindustrie nauwkeurig weerspiegelen, zijn van cruciaal belang voor deze AI om nuttig te zijn voor de industrie. We moeten deze modellen de gespecialiseerde woordenschat, jargon, relevante gegevens en concepten leren die uniek zijn voor de watersector.

Want zoals hier besproken

, een van de uitdagingen met de nauwkeurigheid van deze nieuwere LLMs is dat ze worden beïnvloed door hun gegevens en trainingsvooroordelen. Het GPT-4-model leert bijvoorbeeld van beide tekstgegevens en versterking van mensen, met behulp van een techniek die reinforcement learning van menselijke feedback

wordt genoemd (FLHF). De techniek stemt het basismodel af door menselijke feedback te gebruiken om het leerproces van de AI te begeleiden. De gegevens en de mensen die deelnemen aan de training van het model zijn echter mogelijk niet representatief voor potentiële eindgebruikers en dat kan van invloed zijn op het soort resultaten dat deze modellen produceren.

Er zijn andere problemen met deze modellen. Het model van ChatGPT kan bijvoorbeeld hallucineren, waardoor je verkeerde antwoorden krijgt die logisch verantwoord lijken. Het is ook niet verklaarbare AI, waardoor het een soort zwarte doos is waar we niet begrijpen hoe het tot zijn antwoorden komt. We hebben mensen met kennis van de industrie nodig om deze modellen op nauwkeurigheid te testen en erop te toezien om ervoor te zorgen dat de modellen zijn afgestemd op onze sector.

Stel je voor wat er zou kunnen gebeuren als nutsbedrijven over de hele wereld hun geanonimiseerde metergegevens per uur zouden bundelen om deze nieuwe AI-modellen voor onze sector te trainen en te benutten. Met een enorme wereldwijde meterdataset is het bijvoorbeeld mogelijk om het concept voor virtuele meters te leveren aan nutsbedrijven die mogelijk niet over de middelen beschikken om AMI-meters te installeren en te implementeren. Virtuele meters kunnen dienen als krachtige gegevensinvoer voor alle soorten operationele analyses, waaronder digitale tweeling. Door samen te werken aan de last-mile-gegevens van de watersector, kunnen nutsbedrijven de kracht van AI gebruiken om een uitgebreider begrip van watergebruik en -patronen te creëren, wat effectievere waterbeheerstrategieën kan informeren en kan leiden tot betere resultaten voor klanten en het milieu.

Dit is een kans voor iedereen in de watersector, van innovatieve waterbedrijven tot nutsbedrijven met tientallen jaren stilzwijgende kennis (waaronder sommigen die op het punt staan met pensioen te gaan en die kennis mee te nemen), om wereldwijd samen te werken en de context, het toezicht en de gegevens van de waterindustrie in deze modellen te introduceren, zodat innovators in onze sector AI-oplossingen kunnen ontwikkelen en combineren die zijn aangepast aan de specifieke kennis en doelen van de waterindustrie ten behoeve van alle nutsbedrijven, groot en klein.

Het democratiseren van AI-kansen voor nutsbedrijven van elke omvang; geen vervanging van werk

Voor kleinere nutsbedrijven, of nutsbedrijven met beperkte middelen, kunnen deze nieuwe ontwikkelingen in AI ontmoedigend of buiten bereik aanvoelen. Maar eigenlijk democratiseren deze nieuwe taalmodellen AI-technologie omdat mensen hun gewoonten niet zo significant hoeven te veranderen of op een geheel nieuw programma hoeven te trainen om voordelen te zien. Ze geven mensen toegang tot de kracht van AI zonder de noodzaak van gespecialiseerde kennis en vaardigheden – alles wat je nodig hebt is duidelijke taal en een beetje creativiteit om de AI te laten produceren wat je nodig hebt (snelle engineering kan een interessante focus zijn voor de watersector).

De samenvattende mogelijkheden met deze tools alleen al bieden nuttige toepassingen in het dagelijks werk. Stel je voor dat je alle soorten hulpprogrammagegevens invoert in een behulpzame AI-assistent die je vervolgens binnen enkele seconden duidelijke inzichten over de gegevens kan geven. Zelfs voordat gegevens worden geanalyseerd, kunnen deze modellen niet-experts helpen bij het schrijven van een goed codemonster om relevante informatie te extraheren, zoals gemiddeld waterverbruik, verschillende soorten drukmetingen of waterkwaliteitsgegevens. Het kan onze sector misschien helpen bij het verwerken van gegevens die nog niet zijn opgeschoond, of ons zelfs vertellen wat er moet gebeuren om gegevens vooraf te verwerken.

 

Je zou een operator kunnen zijn in een heel klein hulpprogramma dat veel expertise heeft en je weet dat je een lek hebt omdat je het hebt gehoord, maar je hebt er meer informatie over nodig. Deze nieuwe taalmodellen openen de deur voor nutsbedrijven die natuurlijke taal gebruiken om te communiceren met het AI-model en te experimenteren met de soorten inzichten die het u kan geven. Misschien kan het gegevens suggereren die u nodig hebt om het probleem beter te begrijpen, bijna alsof u een gegevensassistent hebt. En in die zin zijn deze AI-modellen geen vervanging van werk, maar een partnerschap met AI, omdat ze simpelweg niet de praktijkervaring en stilzwijgende expertise hebben die mensen in de watersector hebben.

Hoewel er al veel gegevens zijn om aan de slag te gaan met het experimenteren en trainen van deze modellen voor de watersector, is er ook “data as a service” (DAAS – zie
SWAN Forum
voor meer informatie over dat onderwerp) beginnen modellen te ontstaan om de kloof te overbruggen voor kleine nutsbedrijven die mogelijk geen gegevens, middelen, capaciteit en expertise hebben om de gegevens te verzamelen die ze nodig hebben om hoogwaardige antwoorden van AI te krijgen. Deze nieuwe bedrijfsmodellen nemen de verantwoordelijkheid op zich om de juiste sensoren voor de juiste problemen en locaties te verwerven en datacommunicatie, gegevensopschoning en analyse in te stellen, zodat het hulpprogramma zich kan concentreren op het profiteren van de gegevens. Deze combinatie van software en diensten kan elk klein nutsbedrijf zeer snel aan boord brengen met de voordelen van deze technologieën.

De watersector moet niet bang zijn om deze nieuwe AI-tools te testen en te spelen en ermee te experimenteren om te zien hoe ze voor hen kunnen werken. Van kleine steden tot megasteden, van buitendienstmedewerkers tot leidinggevenden, nutsbedrijven kunnen inspringen en beginnen te spelen, innoveren en leren, zelfs met minimale gegevens, hoe AI hun werk gemakkelijker kan maken.

Ten slotte is dit een oproep aan alle bronnen van diepgaande expertise en kennis in de waterindustrie – nutsbedrijven en managers, ingenieurs, wetenschappers, academici – om hun gespecialiseerde kennis bij te dragen aan machine learning om de intelligente uitkomst ervan te ontwikkelen en te onderzoeken hoe deze LLMs de besluitvorming in de watersector beter kunnen maken.

#QatiumExperts

Qatium is gemaakt in samenwerking met experts en thought leaders uit de waterindustrie. We creëren inhoud om nutsbedrijven van elke omvang te helpen de huidige en toekomstige uitdagingen het hoofd te bieden.

Gigi Karmous-Edwards, Water Sector Digital Twin Expert &Consultant bij Karmous Edwards Consulting LLC, is lid van de community van Qatium.