Skip to main content

Denne artikel blev taget fra papiret “AI &; Water management – Hvad forsyningsselskaber har brug for at vide nu.” Du finder hele papiret her.

Det er tid til at ringe med klokken og samle vandindustrien omkring banebrydende AI-modeller og -værktøjer, ellers risikerer vi at blive hægtet af. Den nyeste iteration af OpenAIs Large Language Model (LLM) GPT-4 (Generative Pre-trained Transformer 4), der for nylig blev frigivet efter GPT-3, har indledt en generativ AI-revolution. GPT-4 er multimodal, fordi den kan modtage både tekst- og billedmeddelelser som input (kun begrænset udgivelse). For billedinput vil GPT-4 forsøge at forstå indholdet af billedet. Det er uhyggeligt at se kraften i denne multimodale LLM. Antallet af parametre i en LLM er ofte et mål for dens størrelse og kompleksitet. Denne LLM, og dem som den, bruger hundreder af milliarder til billioner af parametre. Det bruger også en kombination af menneskeovervågede og uovervågede træningsteknikker til løbende at blive bedre og mere præcis.

Disse LLM’er er forskellige fra de standardsprogevner, du er vant til at få fra noget som Alexa eller Siri. Deres avancerede evne til at arbejde med naturligt sprog og billeder gør dem ekstremt fleksible og tilpasningsdygtige. Ikke alene kan de blive bedt i almindeligt sprog om at producere menneskelignende skrevet tekst, disse modeller kan også lære ny adfærd blot ved at fodre dem med nye træningsdata og ved at bygge videre på dem til nye applikationer. Dette kaldes undertiden last-mile datatræning af modellen for en bestemt lodret efterfulgt af finjustering af typetræning.

Mens ChatGPT, en chatbot, kan generere menneskelignende tekst fra naturligt sprog og billedprompter, bruger DALL-E-2 den samme GPT-4-sprogmodel til at generere billeder fra meddelelser på naturligt sprog. DALL-E-2 er en neuralt netværksbaseret AI-model udviklet af OpenAI, der er i stand til at generere billeder i høj kvalitet fra tekstbeskrivelser. I modsætning til traditionelle billedgenereringsmodeller, der er afhængige af et allerede eksisterende datasæt af billeder, bruger DALL-E-2 en kombination af deep learning-teknikker og naturlig sprogbehandling (NLP) til at generere originale billeder fra tekstinput.

DALL-E-2 genererede dette originale billede på få sekunder fra den enkle almindelige sprogprompt "et 3D-rørnetværk i form af en robot."

Dette er kun begyndelsen. Selvom disse modeller kun er i stand til så meget kompleksitet i øjeblikket, vil fremtidige, mere kraftfulde, sofistikerede iterationer i sidste ende blive frigivet. GPT-3’s model er for eksempel baseret på 175 milliarder parametre, og selvom det ikke er klart på tidspunktet for offentliggørelsen, hvor mange parametre GPT-4 har, forudsiger nogle, at andre LLM’er kunne bruge op til en billioner af parametre. Så selvom disse sprogmodeller er magtfulde nu, vil de kun blive bedre, hvilket får en til at undre sig over, hvad de ellers kunne gøre?

Og derfor bør vandindustrien springe ind nu, fordi AI-værktøjer vil have forskellige virkninger afhængigt af det domæne, de er udviklet til, og de data, de er uddannet på. For at disse modeller kan have dyb, ægte anvendelse i vandindustrien, har de brug for branchespecifikke data og intelligens.

Vi er nødt til at begynde at se på, hvad vi kan kalde “den sidste kilometer data” i vandindustrien. Det er her, vi bliver meget specifikke omkring data og koncepter i vores branche, så vi kan begynde at træne disse modeller og de mennesker, der bruger dem, til at hjælpe med at løse vandsektorens unikke udfordringer. Store, forskelligartede, repræsentative data, der nøjagtigt afspejler vandindustrien, er nøglen til, at denne AI kan være nyttig for branchen. Vi er nødt til at lære disse modeller det specialiserede ordforråd, jargon, relevante data og begreber, der er unikke for vandsektoren.

Fordi som diskuteret
her
, er en af udfordringerne med nøjagtigheden af disse nyere LLM’er, at de påvirkes af deres data og træningsforstyrrelser. GPT-4-modellen lærer for eksempel af begge tekstdata og forstærkning fra mennesker ved hjælp af en teknik kaldet forstærkning, der lærer af menneskelig feedback

(FLHF). Teknikken finjusterer baselinemodellen ved at bruge menneskelig feedback til at guide AI’ens læringsproces. Dataene og de personer, der deltager i træningen af modellen, er dog muligvis ikke repræsentative for potentielle slutbrugere, og det kan påvirke den type resultater, disse modeller producerer.

Der er andre problemer med disse modeller. For eksempel kan ChatGPTs model hallucinere, hvilket giver dig forkerte svar, der virker logisk sunde. Det er det heller ikke forklarlig AI, hvilket gør det til noget af en sort boks, hvor vi ikke forstår, hvordan det kommer til dets svar. Vi har brug for folk med branchekendskab til at teste disse modeller for nøjagtighed og overvåge dem for at sikre, at modellerne er tilpasset vores sektor.

Forestil dig, hvad der kunne ske, hvis forsyningsselskaber over hele verden samlede deres anonymiserede timemålerdata for at hjælpe med at træne og udnytte disse nye AI-modeller til vores sektor. Med et enormt globalt målerdatasæt kan det for eksempel være muligt at levere konceptet for virtuelle målere til forsyningsselskaber, der måske ikke har ressourcerne til at installere og implementere AMI-målere. Virtuelle målere kan fungere som effektive datainput til alle typer driftsanalyser, herunder Digitale tvillinger. Ved at samarbejde om vandsektorens data om den sidste kilometer kan forsyningsselskaber bruge kraften i AI til at skabe en mere omfattende forståelse af vandforbrug og mønstre, hvilket kan informere mere effektive vandforvaltningsstrategier og føre til bedre resultater for kunder og miljøet.

Dette er en mulighed for alle i vandsektoren, fra innovative vandvirksomheder til forsyningsselskaber med årtiers stiltiende viden (herunder nogle, der er ved at gå på pension og tage den viden med sig), til at samarbejde globalt og introducere vandindustriens kontekst, tilsyn og data til disse modeller, så innovatører i vores sektor kan udvikle og kombinere AI-løsninger, der er tilpasset vandindustriens specifikke viden og mål til gavn for alle forsyningsselskaber, store og små.

Demokratisering af AI-muligheder for forsyningsselskaber i alle størrelser; ikke en erstatning af arbejde

For mindre forsyningsselskaber eller forsyningsselskaber med begrænsede ressourcer kan disse nye udviklinger inden for AI føles skræmmende eller uden for rækkevidde. Men faktisk demokratiserer disse nye sprogmodeller AI-teknologi, fordi folk ikke behøver at ændre deres vaner så markant eller træne på et helt nyt program for at se fordele. De giver folk adgang til kraften i AI uden behov for specialiseret viden og færdigheder – alt hvad du behøver er almindeligt sprog og lidt kreativitet for at få AI til at producere det, du har brug for (hurtig teknik kan være et interessant fokus for vandsektoren).

Opsummeringsmulighederne med disse værktøjer alene rummer nyttige applikationer i det daglige arbejde. Forestil dig, at du fodrer alle typer hjælpedata til en hjælpsom AI-assistent, som derefter kan give dig indsigt i dataene på få sekunder. Selv før du analyserer data, kan disse modeller hjælpe ikke-eksperter med at skrive en god kodeprøve for at udtrække relevante oplysninger, såsom gennemsnitligt vandforbrug, forskellige typer trykaflæsninger eller vandkvalitetsdata. Det kan muligvis hjælpe vores sektor med at forbehandle data, der endnu ikke er renset, eller endda fortælle os, hvad der skal ske for at forbehandle data.

 

Du kan være operatør i et meget lille forsyningsselskab, der har stor ekspertise, og du ved, at du har en lækage, fordi du hørte det, men du har brug for mere information om det. Disse nye sprogmodeller åbner døren for forsyningsoperatører, der bruger naturligt sprog til at kommunikere med AI-modellen og eksperimentere med den slags indsigt, den kan give dig. Måske kan det foreslå data, du har brug for for at forstå problemet bedre, næsten som at have en dataassistent. Og i den forstand er disse AI-modeller ikke en erstatning for arbejde, men et partnerskab med AI, fordi de simpelthen ikke har den virkelige verden erfaring og stiltiende ekspertise, som mennesker i vandsektoren har.

Mens der allerede er mange data til at komme i gang med at eksperimentere og træne disse modeller til vandsektoren, er der også “data as a service” (DAAS – se SWAN Forum

for mere om dette emne) modeller begynder at dukke op for at bygge bro over kløften for små forsyningsselskaber, der måske mangler data, ressourcer, kapacitet og ekspertise til at indsamle de data, de har brug for for at få kvalitetssvar fra AI. Disse nye forretningsmodeller påtager sig ansvaret for at anskaffe de rigtige sensorer til de rigtige problemer og placeringer samt oprette datakommunikation, datarensning og analyse, så forsyningen kan fokusere på at drage fordel af dataene. Denne kombination af software og tjenester kan bringe ethvert lille værktøj om bord med fordelene ved disse teknologier meget hurtigt.

Vandsektoren bør ikke være bange for at teste og lege og eksperimentere med disse nye AI-værktøjer for at se, hvordan de kan fungere for dem. Fra små byer til megabyer, fra feltpersonale til ledere, kan forsyningsselskaber hoppe ind og begynde at spille, innovere og lære, selv med minimale data, hvordan AI kan gøre deres job lettere.

Endelig er dette et opkald til alle kilder til dyb ekspertise og viden inden for vandindustrien – forsyningsoperatører og ledere, ingeniører, forskere, akademikere – om at bidrage med deres specialiserede viden til maskinindlæring for at udvikle sit intelligente resultat og undersøge, hvordan disse LLM’er kan gøre beslutningstagningen i vandsektoren bedre.

#QatiumExperts

Qatium er skabt i samarbejde med eksperter og meningsdannere fra vandindustrien. Vi skaber indhold for at hjælpe forsyningsselskaber i alle størrelser med at imødegå nuværende og fremtidige udfordringer.

Gigi Karmous-Edwards, Water Sector Digital Twin Expert & Consultant hos Karmous Edwards Consulting LLC, er medlem af Qatiums samfund.