Ten artykuł pochodzi z artykułu „AI & Water management – What utilities need to know now”. Pełny artykuł znajdziesz tutaj.
Nadszedł czas, aby zadzwonić dzwonkiem i zjednoczyć przemysł wodny wokół zmieniających gry modeli i narzędzi sztucznej inteligencji, w przeciwnym razie ryzykuj pozostanie w tyle. Najnowsza iteracja OpenAI’s Large Language Model (LLM) GPT-4 (Generative Pre-trained Transformer 4), niedawno wydana po GPT-3, wprowadziła generatywna rewolucja AI. GPT-4 jest multimodalny, ponieważ może odbierać zarówno monity tekstowe, jak i graficzne jako dane wejściowe (tylko ograniczone wydanie). W przypadku danych wejściowych obrazu GPT-4 spróbuje zrozumieć zawartość obrazu. To niesamowite widzieć moc tego multimodalnego LLM. Liczba parametrów w LLM jest często miarą jego wielkości i złożoności. Ten LLM i podobne mu używają setek miliardów do bilionów parametrów. Wykorzystuje również kombinację technik szkoleniowych nadzorowanych przez człowieka i bez nadzoru, aby stale stawać się coraz lepszym i dokładniejszym.
Te LLM różnią się od standardowych umiejętności językowych, do których jesteś przyzwyczajony z czegoś takiego jak Alexa lub Siri. Ich zaawansowana zdolność do pracy z językiem naturalnym i obrazami sprawia, że są niezwykle elastyczne i elastyczne. Modele te mogą nie tylko zostać poproszone prostym językiem, aby stworzyć tekst pisany podobny do ludzkiego, ale modele te mogą również uczyć się nowych zachowań, po prostu dostarczając im nowe dane szkoleniowe i opierając się na nich w nowych zastosowaniach. Jest to czasami określane jako szkolenie danych ostatniej mili modelu dla określonej branży, a następnie szkolenie typu dostrajania.
Podczas gdy ChatGPT, chatbot, może generować tekst podobny do ludzkiego z podpowiedzi w języku naturalnym i obrazach, DALL-E-2 używa tego samego modelu języka GPT-4 do generowania obrazów z podpowiedzi w języku naturalnym. DALL-E-2 to model sztucznej inteligencji oparty na sieci neuronowej opracowany przez OpenAI, zdolny do generowania wysokiej jakości obrazów z opisów tekstowych. W przeciwieństwie do tradycyjnych modeli generowania obrazów, które opierają się na wcześniej istniejącym zestawie danych obrazów, DALL-E-2 wykorzystuje kombinację technik głębokiego uczenia i przetwarzania języka naturalnego (NLP) do generowania oryginalnych obrazów z danych wejściowych tekstu.
DALL-E-2 wygenerował ten oryginalny obraz w ciągu kilku sekund z prostego podpowiedzi w prostym języku "sieć rur 3D w kształcie robota".
To dopiero początek. Podczas gdy modele te są obecnie zdolne do tak dużej złożoności, przyszłe, potężniejsze, bardziej wyrafinowane iteracje zostaną ostatecznie wydane. Model GPT-3 opiera się na przykład na 175 miliardach parametrów i chociaż w momencie publikacji nie jest jasne, ile parametrów ma GPT-4, niektórzy przewidują, że inne LLM mogą wykorzystywać do bilion parametrów. Tak więc, chociaż te modele językowe są teraz potężne, będą tylko lepsze, co sprawia, że można się zastanawiać, co jeszcze mogłyby zrobić?
”I dlatego przemysł wodny powinien wkroczyć teraz, ponieważ narzędzia sztucznej inteligencji będą miały różny wpływ w zależności od dziedziny, dla której zostały opracowane i danych, na których są szkolone. Aby modele te miały głębokie, prawdziwe zastosowanie w przemyśle wodnym, potrzebują specyficznych dla branży danych i inteligencji.
Pokonanie ostatniej mili danych w sektorze wodnym
Musimy zacząć przyglądać się temu, co możemy nazwać „ostatnią milą danych” w przemyśle wodnym. To tutaj uzyskujemy bardzo szczegółowe informacje na temat danych i koncepcji w naszej branży, dzięki czemu możemy rozpocząć szkolenie tych modeli i osób z nich korzystających, aby pomóc w rozwiązaniu unikalnych wyzwań sektora wodnego. Duże, zróżnicowane, reprezentatywne dane, które dokładnie odzwierciedlają przemysł wodny, mają kluczowe znaczenie dla tego, aby sztuczna inteligencja była przydatna dla branży. Musimy nauczyć te modele specjalistycznego słownictwa, żargonu, odpowiednich danych i pojęć, które są unikalne dla sektora wodnego.
Ponieważ jak omówiono
tutaj
, jednym z wyzwań związanych z dokładnością tych nowszych LLM jest to, że wpływają na nie ich dane i uprzedzenia szkoleniowe. Na przykład model GPT-4 uczy się na podstawie obu danych tekstowych i wzmocnienie od ludzi, przy użyciu techniki zwanej
uczeniem się przez wzmacnianie z ludzkich informacji zwrotnych
(FLHF). Technika ta precyzyjnie dostraja model bazowy, wykorzystując ludzkie informacje zwrotne do kierowania procesem uczenia się sztucznej inteligencji. Jednak dane i osoby biorące udział w szkoleniu modelu mogą nie być reprezentatywne dla potencjalnych użytkowników końcowych, co może wpływać na rodzaje wyników uzyskiwanych przez te modele.
Istnieją inne problemy z tymi modelami. Na przykład model ChatGPT może halucynacje, dając błędne odpowiedzi, które wydają się logicznie uzasadnione. To też nie jest wytłumaczalna sztuczna inteligencja, czyniąc go czymś w rodzaju czarnej skrzynki, w której nie rozumiemy, w jaki sposób dochodzi do odpowiedzi. Potrzebujemy ludzi posiadających wiedzę branżową, aby przetestować te modele pod kątem dokładności i nadzorować je, aby upewnić się, że modele są dostosowane do naszego sektora.
Wyobraź sobie, co mogłoby się stać, gdyby przedsiębiorstwa użyteczności publicznej na całym świecie połączyły swoje anonimowe dane z liczników godzinowych, aby pomóc w szkoleniu i wykorzystaniu tych nowych modeli sztucznej inteligencji w naszym sektorze. Na przykład przy ogromnym globalnym zbiorze danych liczników możliwe jest dostarczenie koncepcji wirtualnych liczników przedsiębiorstwom użyteczności publicznej, które mogą nie mieć zasobów do zainstalowania i wdrożenia liczników AMI. Wirtualne liczniki mogą służyć jako potężne dane wejściowe dla wszystkich rodzajów analityki operacyjnej, w tym Cyfrowe bliźniaki. Współpracując nad danymi ostatniej mili sektora wodnego, przedsiębiorstwa użyteczności publicznej mogłyby wykorzystać moc sztucznej inteligencji do stworzenia bardziej kompleksowego zrozumienia zużycia wody i wzorców, co mogłoby informować o skuteczniejszych strategiach gospodarki wodnej i prowadzić do lepszych wyników dla klientów i środowiska.
”Jest to okazja dla wszystkich w sektorze wodnym, od innowacyjnych przedsiębiorstw wodnych po operatorów mediów z dziesięcioleciami ukrytej wiedzy (w tym niektórych, którzy wkrótce przejdą na emeryturę i zabiorą tę wiedzę ze sobą), do współpracy na całym świecie i wprowadzenia kontekstu przemysłu wodnego, nadzoru i danych do tych modeli, aby innowatorzy w naszym sektorze mogli opracowywać i łączyć rozwiązania AI dostosowane do konkretnej wiedzy i celów branży wodnej z korzyścią dla wszystkich mediów, duże i małe.
Demokratyzacja możliwości sztucznej inteligencji dla przedsiębiorstw użyteczności publicznej każdej wielkości; nie zastępuje pracy
W przypadku mniejszych przedsiębiorstw użyteczności publicznej lub przedsiębiorstw użyteczności publicznej o ograniczonych zasobach te nowe osiągnięcia w dziedzinie sztucznej inteligencji mogą wydawać się zniechęcające lub poza zasięgiem. Ale w rzeczywistości te nowe modele językowe demokratyzują technologię sztucznej inteligencji, ponieważ ludzie nie muszą zmieniać swoich nawyków tak znacząco ani trenować w zupełnie nowym programie, aby zobaczyć korzyści. Umożliwiają ludziom dostęp do mocy sztucznej inteligencji bez potrzeby posiadania specjalistycznej wiedzy i umiejętności – wystarczy prosty język i odrobina kreatywności, aby sztuczna inteligencja wyprodukowała to, czego potrzebujesz (szybka inżynieria może być interesującym celem dla sektora wodnego).
Możliwości podsumowania za pomocą tych narzędzi mają pomocne zastosowania w codziennej pracy. Wyobraź sobie, że wprowadzasz wszystkie typy danych użytkowych do pomocnego asystenta AI, który może następnie przekazać Ci prosty wgląd w dane w ciągu kilku sekund. Nawet przed analizą danych modele te mogą pomóc osobom niebędącym ekspertami napisać dobrą próbkę kodu w celu wyodrębnienia istotnych informacji, takich jak średnie zużycie wody, różne rodzaje odczytów ciśnienia lub dane dotyczące jakości wody. Może być w stanie pomóc naszemu sektorowi we wstępnym przetwarzaniu danych, które nie zostały jeszcze oczyszczone, a nawet powiedzieć nam, co musi się stać, aby wstępnie przetworzyć dane.
Możesz być operatorem w bardzo małym przedsiębiorstwie użyteczności publicznej, które ma dużą wiedzę i wiesz, że masz wyciek, ponieważ go słyszałeś, ale potrzebujesz więcej informacji na ten temat. Te nowe modele językowe otwierają drzwi operatorom mediów używającym języka naturalnego do komunikowania się z modelem sztucznej inteligencji i eksperymentowania z rodzajami spostrzeżeń, które może ci dać. Może to sugerować dane, których potrzebujesz, aby lepiej zrozumieć problem, prawie jak posiadanie asystenta danych. W tym sensie te modele sztucznej inteligencji nie zastępują pracy, ale partnerstwo ze sztuczną inteligencją, ponieważ po prostu nie mają rzeczywistego doświadczenia i ukrytej wiedzy, jaką mają ludzie w sektorze wodnym.
Chociaż istnieje już wiele danych, aby rozpocząć eksperymentowanie i szkolenie tych modeli dla sektora wodnego, istnieje również „data as a service” (DAAS – patrz
SWAN Forum
więcej na ten temat) zaczynają pojawiać się modele wypełniające lukę dla małych przedsiębiorstw użyteczności publicznej, którym może brakować danych, zasobów, zdolności i wiedzy specjalistycznej, aby zebrać dane potrzebne do uzyskania wysokiej jakości odpowiedzi od sztucznej inteligencji. Te nowe modele biznesowe biorą na siebie odpowiedzialność za pozyskanie odpowiednich czujników dla właściwych problemów i lokalizacji, a także za skonfigurowanie transmisji danych, czyszczenia danych i analizy, aby przedsiębiorstwo mogło skupić się na czerpaniu korzyści z danych. Ta kombinacja oprogramowania i usług może bardzo szybko wprowadzić na pokład każde małe przedsiębiorstwo użyteczności publicznej z zaletami tych technologii.
”Sektor wodny nie powinien bać się testować, bawić się i eksperymentować z tymi nowymi narzędziami sztucznej inteligencji, aby zobaczyć, jak mogą dla nich działać. Od małych miast po megamiasta, od pracowników terenowych po kadrę kierowniczą, przedsiębiorstwa użyteczności publicznej mogą wskoczyć i zacząć grać, wprowadzać innowacje i uczyć się, nawet przy minimalnej ilości danych, w jaki sposób sztuczna inteligencja może ułatwić im pracę.
Wreszcie, jest to wezwanie do wszystkich źródeł głębokiej wiedzy i wiedzy w branży wodnej – operatorów i menedżerów mediów, inżynierów, naukowców, naukowców – do wniesienia swojej specjalistycznej wiedzy do uczenia maszynowego w celu ewolucji jego inteligentnego wyniku i zbadania, w jaki sposób te LLM mogą lepiej podejmować decyzje w sektorze wodnym.
#QatiumExperts
Qatium jest współtworzony z ekspertami i liderami myśli z branży wodnej. Tworzymy treści, aby pomóc przedsiębiorstwom użyteczności publicznej każdej wielkości stawić czoła obecnym i przyszłym wyzwaniom.
Gigi Karmous-Edwards, Water Sector Digital Twin Expert & Consultant w Karmous Edwards Consulting LLC, jest członkiem społeczności Qatium.