Este artículo se ha extraído del documento «AI & Water management – What utilities need to know now». Encontrarás el documento completo aquí.

Ha llegado el momento de hacer un llamado de atención para el sector del agua en torno a modelos y herramientas de IA revolucionarios, o corremos el riesgo de quedarnos atrás. La última versión del Large Language Model (LLM) de OpenAI, GPT-4 (Generative Pre-trained Transformer 4), lanzada recientemente después de GPT-3, ha marcado el comienzo de una revolución de la IA generativa. El GPT-4 es multimodal porque puede recibir tanto texto como imágenes (sólo en versión limitada). En el caso de las imágenes, GPT-4 intenta comprender su contenido. Es asombroso ver la potencia de este LLM multimodal. El número de parámetros de un LLM suele ser un indicador de su tamaño y complejidad. Este LLM y otros similares utilizan entre cientos de miles y billones de parámetros. También utiliza una combinación de técnicas de entrenamiento supervisadas por humanos y no supervisadas para mejorar y aumentar continuamente su precisión.

Estos LLM son diferentes de las capacidades lingüísticas estándar que estás acostumbrado a obtener de algo como Alexa o Siri. Su avanzada capacidad para trabajar con lenguaje natural e imágenes los hace extremadamente flexibles y adaptables. No sólo se les puede pedir en lenguaje sencillo que produzcan texto escrito similar al humano, sino que estos modelos también pueden aprender nuevos comportamientos simplemente alimentándolos con nuevos datos de entrenamiento y basándose en ellos para nuevas aplicaciones. Esto se conoce a veces como entrenamiento del modelo con datos de última milla para una verticalidad específica, seguido de un entrenamiento de «ajuste fino».

Mientras que ChatGPT, un chatbot, puede generar texto similar al humano a partir de mensajes en lenguaje natural e imágenes, DALL-E-2 utiliza el mismo modelo de lenguaje GPT-4 para generar imágenes a partir de mensajes en lenguaje natural. DALL-E-2 es un modelo de IA basado en redes neuronales desarrollado por OpenAI capaz de generar imágenes de alta calidad a partir de descripciones textuales. A diferencia de los modelos tradicionales de generación de imágenes que se basan en un conjunto de datos preexistente de imágenes, DALL-E-2 utiliza una combinación de técnicas de aprendizaje profundo y procesamiento de lenguaje natural (NLP) para generar imágenes originales a partir de entradas textuales.

DALL-E-2 generó esta imagen original en unos segundos a partir de la simple indicación en lenguaje llano «una red de tuberías en 3D con forma de robot».

Esto es sólo el principio. Aunque de momento estos modelos sólo son capaces de un cierto grado de complejidad, en el futuro aparecerán versiones más potentes y sofisticadas. El modelo GPT-3 se basa en 175.000 millones de parámetros, por ejemplo, y aunque en el momento de la publicación no está claro cuántos parámetros tiene GPT-4, hay quien predice que otros LLM podrían utilizar hasta un billón de parámetros. Así que, aunque estos modelos lingüísticos son potentes ahora, no harán más que mejorar, lo que nos lleva a preguntarnos: ¿qué más podrían hacer?

Y por eso el sector del agua debería comenzar ahora, porque las herramientas de IA tendrán efectos diferentes según el ámbito para el que se desarrollen y los datos con los que se entrenen. Para que estos modelos tengan una aplicación profunda y real en el sector del agua, necesitan datos e inteligencia específicos del sector.

Impulsar la última milla de datos en el sector del agua

Tenemos que empezar a considerar lo que podríamos llamar «la última milla de los datos» en el sector del agua. Es donde nos volvemos muy específicos sobre los datos y conceptos de nuestra industria, para que podamos empezar a entrenar estos modelos, y a las personas que los utilizan, para ayudar a abordar los desafíos únicos del sector del agua. Para que estas IA sean útiles para el sector, es fundamental disponer de datos amplios, diversos y representativos que reflejen con exactitud el sector del agua. Tenemos que enseñar a estos modelos el vocabulario especializado, la jerga, los datos relevantes y los conceptos propios del sector del agua.

Y es que, como ya se ha comentado aquí, uno de los problemas que plantea la precisión de estos nuevos LLM es que se ven influidos por sus datos y sus sesgos de entrenamiento. El modelo GPT-4, por ejemplo, aprende tanto de los datos de texto como del refuerzo humano, utilizando una técnica denominada aprendizaje por refuerzo a partir de la retroalimentación humana (FLHF, por sus siglas en inglés). Esta técnica afina el modelo de referencia utilizando los comentarios humanos para guiar el proceso de aprendizaje de la IA. Sin embargo, los datos y las personas que participan en el entrenamiento del modelo pueden no ser representativos de los usuarios finales potenciales, y eso puede afectar al tipo de resultados que producen estos modelos.

Hay otros problemas con estos modelos. Por ejemplo, el modelo de ChatGPT puede alucinar, dando respuestas erróneas que parecen lógicas. Tampoco es una IA explicable, lo que la convierte en una especie de caja negra en la que no entendemos cómo llega a sus respuestas. Necesitamos personas con conocimientos del sector que comprueben la precisión de estos modelos y los supervisen para asegurarse de que están en sintonía con nuestro sector.

Imaginemos lo que podría ocurrir si las empresas de servicios de todo el mundo pusieran en común sus datos anónimos de contadores horarios para ayudar a entrenar y aprovechar estos nuevos modelos de IA para nuestro sector. Con un enorme conjunto de datos de contadores a nivel mundial, por ejemplo, podría ser posible ofrecer el concepto de contadores virtuales a las empresas de servicios que no dispongan de los recursos necesarios para instalar y desplegar contadores AMI. Los contadores virtuales podrían servir de potente entrada de datos para todo tipo de análisis operativos, incluidos los gemelos digitales. Al colaborar con los datos de última milla del sector del agua, las empresas de servicios podrían utilizar el poder de la IA para crear una comprensión más completa del uso y los patrones del agua, lo que podría informar estrategias de gestión del agua más eficaces y conducir a mejores resultados para los clientes y el medio ambiente.

Esta es una oportunidad para que todos en el sector del agua, desde las empresas innovadoras de agua hasta los operadores de servicios  con décadas de conocimiento tácito (incluidos algunos que están a punto de jubilarse y llevarse ese conocimiento con ellos), colaboren juntos a nivel mundial e introduzcan el contexto, la supervisión y los datos de la industria del agua en estos modelos, para que los innovadores de nuestro sector puedan desarrollar y combinar soluciones de IA personalizadas para los conocimientos y objetivos específicos de la industria del agua en beneficio de todas las empresas de servicios, grandes y pequeñas.

Democratizar las oportunidades de la IA para empresas de servicio de todos los tamaños; no sustituir el trabajo

Para las empresas de servicios más pequeñas o con recursos limitados, estos nuevos avances en IA pueden parecer desalentadores o fuera de su alcance. Pero, en realidad, estos nuevos modelos lingüísticos democratizan la tecnología de la IA porque las personas no tienen que cambiar sus hábitos de forma tan significativa ni formarse en un programa completamente nuevo para obtener beneficios. Permiten a la gente acceder al poder de la IA sin necesidad de conocimientos y habilidades especializadas: todo lo que se necesita es un lenguaje sencillo y un poco de creatividad para conseguir que la IA produzca lo que se necesita (la ingeniería rápida podría ser un enfoque interesante para el sector del agua).

Las posibilidades de síntesis que ofrecen estas herramientas tienen por sí solas aplicaciones útiles en el trabajo cotidiano. Imagínate alimentar con todo tipo de datos de empresas de servicios  a un asistente de IA que, en cuestión de segundos, podría ofrecerte información en lenguaje sencillo sobre los datos. Incluso antes de analizar los datos, estos modelos pueden ayudar a los no expertos a escribir una buena muestra de código para extraer información relevante, como el consumo medio de agua, diferentes tipos de lecturas de presión o datos sobre la calidad del agua. Puede ser capaz de ayudar a nuestro sector a pre procesar datos que aún no se han limpiado, o incluso decirnos qué debe ocurrir para pre procesar los datos.

Podrías ser un operador de una empresa de servicios muy pequeña que tiene mucha experiencia y sabe que tiene una fuga porque la has oído, pero necesitas más información al respecto. Estos nuevos modelos lingüísticos abren la puerta a que los operadores de empresas de servicios utilicen el lenguaje natural para comunicarse con el modelo de IA y experimenten con el tipo de información que puede ofrecerles. Quizá pueda sugerirte datos que necesitas para entender mejor el problema, casi como tener un asistente de datos. Y en ese sentido, estos modelos de IA no son una sustitución del trabajo, sino una asociación con la IA, porque sencillamente no tienen la experiencia del mundo real ni los conocimientos tácitos que tienen los seres humanos del sector del agua.

Aunque ya hay muchos datos para empezar a experimentar y entrenar estos modelos para el sector del agua, también están empezando a surgir modelos de «datos como servicio» (DAAS – véase el Foro SWAN para más información sobre este tema) para salvar la brecha de las pequeñas empresas de servicios  que pueden carecer de datos, recursos, capacidad y experiencia para recopilar los datos que necesitan para obtener respuestas de calidad de la IA. Estos nuevos modelos de negocio asumen la responsabilidad de adquirir los sensores adecuados para los problemas y lugares adecuados, así como de establecer comunicaciones de datos, limpieza de datos y análisis para que la empresa de servicios pueda centrarse en beneficiarse de los datos. Esta combinación de software y servicios puede hacer que cualquier empresa pequeña se beneficie rápidamente de las ventajas de estas tecnologías.

El sector del agua no debe tener miedo de probar, jugar y experimentar con estas nuevas herramientas de IA para ver cómo pueden funcionar para ellos. Desde las ciudades pequeñas a las mega ciudades, desde el personal de campo a los ejecutivos, las empresas de servicios pueden lanzarse y empezar a jugar, innovar y aprender, incluso con datos mínimos, cómo la IA puede facilitar su trabajo

Por último, este es un llamado de atención a todas las fuentes de experiencia y conocimientos profundos del sector del agua -operadores y gestores de servicios públicos, ingenieros, científicos, académicos- para que contribuyan con sus conocimientos especializados al aprendizaje automático con el fin de hacer evolucionar su resultado inteligente y explorar cómo estos LLM pueden mejorar la toma de decisiones en el sector del agua.

#ExpertosEnQatium

Qatium se crea conjuntamente con expertos y líderes de opinión del sector del agua. Creamos contenidos para ayudar a empresas de servicios de todos los tamaños a afrontar los retos actuales y futuros.

Gigi Karmous-Edwards, experta y consultora de gemelos digitales del sector del agua en Karmous Edwards Consulting LLC, es miembro de la comunidad de Qatium.

Quizás te interese...