Este artigo foi retirado do artigo “AI & Gestão da água — O que as concessionárias precisam saber agora”. Você encontrará o artigo completo aqui.

É hora de tocar o sino e reunir a indústria da água em torno de modelos e ferramentas de IA que mudam o jogo, ou correm o risco de serem deixados para trás. A mais nova iteração do Large Language Model (LLM) GPT-4 (Generative Pre-trained Transformer 4) da OpenAI, lançada recentemente após o GPT-3, inaugurou uma revolução generativa de IA. O GPT-4 é multimodal porque pode receber prompts de texto e imagem como entrada (somente versão limitada). Para entradas de imagem, o GPT-4 tentará entender o conteúdo da imagem. É estranho ver o poder deste LLM multimodal. O número de parâmetros em um LLM é muitas vezes uma medida de seu tamanho e complexidade. Este LLM, e outros como ele, usam centenas de bilhões a trilhões de parâmetros. Ele também usa uma combinação de técnicas de treinamento supervisionadas por humanos e não supervisionadas para obter continuamente melhores e mais precisas.

Esses LLMs são diferentes das habilidades de linguagem padrão que você está acostumado a obter de algo como Alexa ou Siri. Sua capacidade avançada de trabalhar com linguagem natural e imagens os torna extremamente flexíveis e adaptáveis. Não só eles podem ser solicitados em linguagem simples a produzir texto escrito semelhante ao humano, esses modelos também podem aprender novos comportamentos simplesmente alimentando-os com novos dados de treinamento e construindo sobre eles para novas aplicações. Isso às vezes é chamado de treinamento de dados de última milha do modelo para uma vertical específica, seguido de treinamento de tipo de ajuste fino.

Enquanto o ChatGPT, um chatbot, pode gerar texto semelhante ao humano a partir de prompts de linguagem natural e imagem, o DALL-E-2 usa o mesmo modelo de linguagem GPT-4 para gerar imagens a partir de prompts de linguagem natural. DALL-E-2 é um modelo de IA baseado em rede neural desenvolvido pela OpenAI capaz de gerar imagens de alta qualidade a partir de descrições textuais. Ao contrário dos modelos tradicionais de geração de imagens que dependem de um conjunto de dados pré-existente de imagens, o DALL-E-2 usa uma combinação de técnicas de aprendizado profundo e processamento de linguagem natural (NLP) para gerar imagens originais a partir de entradas textuais.

O DALL-E-2 gerou esta imagem original em poucos segundos a partir do simples prompt de linguagem simples “uma rede de tubos 3D na forma de um robô”.

Este é apenas o começo. Embora esses modelos sejam capazes de apenas uma certa complexidade no momento, iterações futuras, mais poderosas e sofisticadas acabarão sendo lançadas. O modelo do GPT-3 é baseado em 175 bilhões de parâmetros, por exemplo, e embora não esteja claro no momento da publicação quantos parâmetros o GPT-4 tem, alguns preveem que outros LLMs poderiam usar até um trilhão de parâmetros. Então, embora esses modelos de linguagem sejam poderosos agora, eles só vão melhorar, o que faz com que se pergunte: o que mais eles poderiam fazer?

E é por isso que a indústria da água deve entrar agora, porque as ferramentas de IA terão impactos diferentes, dependendo do domínio para o qual são desenvolvidas e dos dados em que são treinadas. Para que esses modelos tenham uma aplicação profunda e verdadeira no setor de água, eles precisam de dados e inteligência específicos do setor.

Conduzindo a última milha de dados no setor de água

Precisamos começar a olhar para o que podemos chamar de “a última milha de dados” na indústria da água. É onde nos tornamos muito específicos sobre dados e conceitos em nossa indústria, para que possamos começar a treinar esses modelos e as pessoas que os usam para ajudar a enfrentar os desafios exclusivos do setor de água. Dados grandes, diversificados e representativos que reflitam com precisão a indústria da água são fundamentais para que essas IAs sejam úteis para a indústria. Precisamos ensinar a esses modelos o vocabulário especializado, jargão, dados relevantes e conceitos que são exclusivos do setor de água.

Porque, como discutido aqui, um dos desafios com a precisão desses LLMs mais recentes é que eles são influenciados por seus vieses de dados e treinamento. O modelo GPT-4, por exemplo, aprende com dados de texto e reforço de humanos, usando uma técnica chamada aprendizagem por reforço a partir do feedback humano (FLHF). A técnica ajusta o modelo de linha de base usando feedback humano para orientar o processo de aprendizagem da IA. No entanto, os dados e as pessoas que participam do treinamento do modelo podem não ser representativos de potenciais usuários finais, e isso pode afetar os tipos de resultados que esses modelos produzem.

Há outros problemas com esses modelos. Por exemplo, o modelo do ChatGPT pode alucinar, dando respostas erradas que parecem logicamente corretas. Também não é uma IA explicável, tornando-a uma espécie de caixa preta onde não entendemos como ela chega às suas respostas. Precisamos de pessoas com conhecimento da indústria para testar a precisão desses modelos e supervisioná-los para garantir que os modelos estejam sintonizados com o nosso setor.

Imagine o que poderia acontecer se as concessionárias de todo o mundo reunissem seus dados anônimos de medidores por hora para ajudar a treinar e alavancar esses novos modelos de IA para o nosso setor. Com um enorme conjunto de dados de medidores globais, por exemplo, pode ser possível fornecer o conceito de medidores virtuais para utilitários que podem não ter os recursos para instalar e implantar medidores AMI. Os medidores virtuais podem servir como entrada de dados poderosa para todos os tipos de análise operacional, incluindo gêmeos digitais. Ao colaborar nos dados de última milha do setor de água, as concessionárias poderiam usar o poder da IA para criar uma compreensão mais abrangente do uso e dos padrões da água, o que poderia informar estratégias de gerenciamento de água mais eficazes e levar a melhores resultados para os clientes e o meio ambiente.

Esta é uma oportunidade para todos no setor de água, desde empresas inovadoras de água até operadores de serviços públicos com décadas de conhecimento tácito (incluindo alguns que estão prestes a se aposentar e levar esse conhecimento com eles), para colaborar juntos globalmente e introduzir o contexto, a supervisão e os dados da indústria da água nesses modelos, para que os inovadores em nosso setor possam desenvolver e combinar soluções de IA personalizadas para o conhecimento e os objetivos específicos do setor de água para o benefício de todas as concessionárias, grandes e pequenos.

Democratizar as oportunidades de IA para utilitários de todos os tamanhos; não é uma substituição de trabalho

Para utilitários menores, ou utilitários com recursos limitados, esses novos desenvolvimentos em IA podem parecer assustadores ou fora de alcance. Mas, na verdade, esses novos modelos de linguagem democratizam a tecnologia de IA porque as pessoas não precisam mudar seus hábitos de forma tão significativa ou treinar em um programa totalmente novo para ver benefícios. Eles permitem que as pessoas acessem o poder da IA sem a necessidade de conhecimentos e habilidades especializadas – tudo o que você precisa é de linguagem simples e um pouco de criatividade para fazer com que a IA produza o que você precisa (a engenharia imediata pode ser um foco interessante para o setor de água).

As oportunidades de sumarização com essas ferramentas por si só possuem aplicações úteis no trabalho do dia-a-dia. Imagine alimentar todos os tipos de dados de utilidade em um assistente de IA útil que poderia fornecer insights em linguagem simples sobre os dados em segundos. Mesmo antes de analisar dados, esses modelos podem ajudar os não especialistas a escrever uma boa amostra de código para extrair informações relevantes, como consumo médio de água, diferentes tipos de leituras de pressão ou dados de qualidade da água. Ele pode ser capaz de ajudar nosso setor a pré-processar dados que ainda não foram limpos, ou até mesmo nos dizer o que precisa acontecer para pré-processar dados.

Você pode ser um operador em uma concessionária muito pequena que tem muita experiência e sabe que tem um vazamento porque o ouviu, mas precisa de mais informações sobre ele. Esses novos modelos de linguagem abrem as portas para que os operadores de serviços públicos usem linguagem natural se comuniquem com o modelo de IA e experimentem os tipos de insights que ele pode lhe dar. Talvez possa sugerir dados que você precisa para entender melhor o problema, quase como ter um assistente de dados. E, nesse sentido, esses modelos de IA não são uma substituição do trabalho, mas uma parceria com a IA, porque eles simplesmente não têm a experiência do mundo real e o conhecimento tácito que os seres humanos no setor de água têm.

Embora já haja muitos dados para começar a experimentar e treinar esses modelos para o setor de água, também há “dados como serviço” (DAAS – veja Fórum SWAN para mais sobre esse tópico) modelos que começam a surgir para preencher a lacuna para pequenas concessionárias que podem não ter dados, recursos, capacidade e experiência para coletar os dados de que precisam para obter respostas de qualidade da IA. Esses novos modelos de negócios assumem a responsabilidade de adquirir os sensores certos para os problemas e locais certos, bem como configurar comunicações de dados, limpeza de dados e análises para que a concessionária possa se concentrar em se beneficiar dos dados. Essa combinação de software e serviços pode trazer qualquer pequeno utilitário a bordo com os benefícios dessas tecnologias muito rapidamente.

O setor de água não deve ter medo de testar, brincar e experimentar essas novas ferramentas de IA para ver como elas podem trabalhar para elas. De pequenas cidades a megacidades, de funcionários de campo a executivos, as concessionárias podem entrar e começar a jogar, inovar e aprender, mesmo com o mínimo de dados, como a IA pode facilitar seus trabalhos.

Finalmente, este é um chamado a todas as fontes de profunda experiência e conhecimento na indústria da água – operadores e gerentes de serviços públicos, engenheiros, cientistas, acadêmicos – para contribuir com seu conhecimento especializado para o aprendizado de máquina, a fim de evoluir seu resultado inteligente e explorar como esses LLMs podem melhorar a tomada de decisões no setor de água.

#QatiumExperts

A Qatium é co-criada com especialistas e líderes de pensamento da indústria da água. Criamos conteúdo para ajudar utilitários de todos os tamanhos a enfrentar os desafios atuais e futuros.

Gigi Karmous-Edwards, especialista em gêmeos digitais do setor de água e consultora da Karmous Edwards Consulting LLC, é membro da comunidade da Qatium.

You might also like...