Skip to main content

Den här artikeln är hämtad från tidningen ”AI & Water management – What utilities need to know now.” Du hittar hela artikeln här.

Det är dags att ringa i klockan och samla vattenindustrin kring omvälvande AI-modeller och verktyg, eller riskera att hamna på efterkälken. Den senaste iterationen av OpenAI:s Large Language Model (LLM) GPT-4 (Generative Pre-trained Transformer 4), som nyligen släpptes efter GPT-3, har inlett en generativ AI-revolution. GPT-4 är multimodal eftersom den kan ta emot både text- och bildmeddelanden som indata (endast begränsad utgåva). För bildinmatningar kommer GPT-4 att försöka förstå innehållet i bilden. Det är kusligt att se kraften i denna multimodala LLM. Antalet parametrar i en LLM är ofta ett mått på dess storlek och komplexitet. Denna LLM, och sådana som den, använder hundratals miljarder till biljoner parametrar. Den använder också en kombination av mänskligt övervakade och oövervakade träningstekniker för att ständigt bli bättre och mer exakt.

Dessa LLM skiljer sig från de vanliga språkförmågorna du är van vid att få från något som Alexa eller Siri. Deras avancerade förmåga att arbeta med naturligt språk och bilder gör dem extremt flexibla och anpassningsbara. De kan inte bara uppmanas på vanligt språk att producera människoliknande skriven text, dessa modeller kan också lära sig nya beteenden helt enkelt genom att mata dem med nya träningsdata och genom att bygga vidare på dem för nya applikationer. Detta kallas ibland för dataträning för sista milen för modellen för en specifik vertikal, följt av finjustering av typträning.

Medan ChatGPT, en chatbot, kan generera människoliknande text från naturliga språk och bildmeddelanden, använder DALL-E-2 samma GPT-4-språkmodell för att generera bilder från uppmaningar på naturligt språk. DALL-E-2 är en neural nätverksbaserad AI-modell utvecklad av OpenAI som kan generera högkvalitativa bilder från textbeskrivningar. Till skillnad från traditionella bildgenereringsmodeller som förlitar sig på en befintlig datauppsättning med bilder, använder DALL-E-2 en kombination av djupinlärningstekniker och naturlig språkbehandling (NLP) för att generera originalbilder från textindata.

DALL-E-2 genererade denna originalbild på några sekunder från den enkla klarspråksprompten "ett 3D-rörnätverk i form av en robot."

Det här är bara början. Även om dessa modeller bara kan så mycket komplexitet just nu, kommer framtida, kraftfullare, sofistikerade iterationer så småningom att släppas. GPT-3: s modell är till exempel baserad på 175 miljarder parametrar, och även om det inte är klart vid tidpunkten för publiceringen hur många parametrar GPT-4 har, förutspår vissa att andra LLM kan använda upp till en biljoner parametrar. Så även om dessa språkmodeller är kraftfulla nu, kommer de bara att bli bättre, vilket får en att undra, vad mer kan de göra?

Och det är därför vattenindustrin bör hoppa in nu, eftersom AI-verktyg kommer att ha olika effekter beroende på vilken domän de är utvecklade för och de data de tränas på. För att dessa modeller ska ha djup, sann tillämpning inom vattenindustrin behöver de branschspecifika data och intelligens.

Vi måste börja titta på vad vi kan kalla ”den sista milen av data” inom vattenindustrin. Det är där vi blir väldigt specifika om data och koncept i vår bransch, så att vi kan börja träna dessa modeller, och de människor som använder dem, för att hjälpa till att hantera vattensektorns unika utmaningar. Stora, mångsidiga, representativa data som korrekt återspeglar vattenindustrin är nyckeln för att denna AI ska vara användbar för branschen. Vi måste lära dessa modeller det specialiserade ordförrådet, jargongen, relevanta data och begrepp som är unika för vattensektorn.

För som diskuterats
här
, en av utmaningarna med noggrannheten hos dessa nyare LLM är att de påverkas av deras data och träningsfördomar. GPT-4-modellen lär sig till exempel från både textdata och förstärkning från människor, med hjälp av en teknik som kallas
förstärkningsinlärning från mänsklig feedback
(FLHF). Tekniken finjusterar baslinjemodellen genom att använda mänsklig feedback för att vägleda AI:ns inlärningsprocess. Data och de personer som deltar i träningen av modellen kanske dock inte är representativa för potentiella slutanvändare, och det kan påverka vilka typer av resultat dessa modeller ger.

Det finns andra problem med dessa modeller. Till exempel kan ChatGPT: s modell hallucinera, vilket ger dig felaktiga svar som verkar logiskt sunda. Det är inte heller förklarbar AI, vilket gör det till något av en svart låda där vi inte förstår hur det kommer till dess svar. Vi behöver människor med branschkunskap för att testa dessa modeller för noggrannhet och övervaka dem för att säkerställa att modellerna är anpassade till vår sektor.

Föreställ dig vad som skulle kunna hända om allmännyttiga företag runt om i världen samlade sina anonymiserade mätdata per timme för att hjälpa till att träna och utnyttja dessa nya AI-modeller för vår sektor. Med en enorm global mätardatamängd kan det till exempel vara möjligt att tillhandahålla konceptet för virtuella mätare till verktyg som kanske inte har resurser att installera och distribuera AMI-mätare. Virtuella mätare kan fungera som kraftfull datainmatning för alla typer av operativ analys, inklusive Digitala tvillingar. Genom att samarbeta om vattensektorns sista milen-data kan allmännyttiga företag använda kraften i AI för att skapa en mer omfattande förståelse för vattenanvändning och vattenmönster, vilket kan informera mer effektiva vattenförvaltningsstrategier och leda till bättre resultat för kunder och miljö.

Detta är en möjlighet för alla inom vattensektorn, från innovativa vattenföretag till allmännyttiga operatörer med årtionden av tyst kunskap (inklusive några som är på väg att gå i pension och ta med sig den kunskapen), att samarbeta globalt och introducera vattenindustrins sammanhang, tillsyn och data till dessa modeller, så att innovatörer i vår sektor kan utveckla och kombinera AI-lösningar anpassade till vattenindustrins specifika kunskap och mål till förmån för alla verktyg, stora som små.

Demokratisera AI-möjligheter för allmännyttiga företag av alla storlekar; inte en ersättning för arbete

För mindre verktyg, eller verktyg med begränsade resurser, kan denna nya utveckling inom AI kännas skrämmande eller utom räckhåll. Men faktiskt demokratiserar dessa nya språkmodeller AI-teknik eftersom människor inte behöver ändra sina vanor lika mycket eller träna på ett helt nytt program för att se fördelar. De ger människor tillgång till kraften i AI utan behov av specialiserad kunskap och färdigheter – allt du behöver är klarspråk och lite kreativitet för att få AI att producera det du behöver (snabb teknik kan vara ett intressant fokus för vattensektorn).

Sammanfattningsvismöjligheterna med dessa verktyg ensam innehåller användbara applikationer i det dagliga arbetet. Tänk dig att mata in alla typer av verktygsdata i en användbar AI-assistent som sedan kan ge dig klarspråkliga insikter om data på några sekunder. Redan innan du analyserar data kan dessa modeller hjälpa icke-experter att skriva ett bra kodexempel för att extrahera relevant information, som genomsnittlig vattenförbrukning, olika typer av tryckavläsningar eller vattenkvalitetsdata. Det kanske kan hjälpa vår sektor att förbehandla data som inte har rensats ännu, eller till och med berätta för oss vad som behöver hända för att förbehandla data.

 

Du kan vara en operatör i ett mycket litet verktyg som har mycket expertis och du vet att du har en läcka eftersom du hörde det men du behöver mer information om det. Dessa nya språkmodeller öppnar dörren för verktygsoperatörer som använder naturligt språk för att kommunicera med AI-modellen och experimentera med de typer av insikter den kan ge dig. Kanske kan det föreslå data du behöver för att förstå problemet bättre, nästan som att ha en dataassistent. Och i den meningen är dessa AI-modeller inte en ersättning för arbete utan ett partnerskap med AI eftersom de helt enkelt inte har den verkliga erfarenhet och tysta expertis som människor inom vattensektorn har.

Även om det redan finns mycket data för att komma igång med att experimentera och träna dessa modeller för vattensektorn, finns det också ”data som en tjänst” (DAAS – se
SWAN Forum
för mer om det ämnet) modeller börjar dyka upp för att överbrygga klyftan för små verktyg som kan sakna data, resurser, kapacitet och expertis för att samla in de data de behöver för att få kvalitetssvar från AI. Dessa nya affärsmodeller tar på sig ansvaret för att skaffa rätt sensorer för rätt problem och platser samt ställa in datakommunikation, datarensning och analys så att bolaget kan fokusera på att dra nytta av data. Denna kombination av programvara och tjänster kan ge alla små verktyg ombord med fördelarna med dessa tekniker mycket snabbt.

Vattensektorn bör inte vara rädd för att testa och leka och experimentera med dessa nya AI-verktyg för att se hur de kan fungera för dem. Från små städer till megastäder, från fältpersonal till chefer, verktyg kan hoppa in och börja spela, förnya och lära sig, även med minimal data, hur AI kan göra deras jobb enklare.

Slutligen är detta en uppmaning till alla källor till djup expertis och kunskap inom vattenindustrin – verktygsoperatörer och chefer, ingenjörer, forskare, akademiker – att bidra med sin specialiserade kunskap till maskininlärning för att utveckla sitt intelligenta resultat och utforska hur dessa LLM kan göra beslutsfattandet inom vattensektorn bättre.

#QatiumExperts

Qatium är samskapat med experter och tankeledare från vattenindustrin. Vi skapar innehåll för att hjälpa allmännyttiga företag i alla storlekar att möta nuvarande och framtida utmaningar.

Gigi Karmous-Edwards, Water Sector Digital Twin Expert & Consultant på Karmous Edwards Consulting LLC, är medlem i Qatiums community.