本文摘自论文“人工智能与水管理——公用事业公司现在需要知道什么”。 你可以 在这里找到完整的论文

现在是时候敲响钟声,围绕改变游戏规则的人工智能模型和工具团结水务行业,否则就有被抛在后面的风险。 继 GPT-3 之后最近发布的 OpenAI 大型语言模型 (LLM) GPT-4(Generative Pre-trained Transformer 4)的最新版本,迎来 了一场生成式 AI 革命。 GPT-4 是多模式的,因为它可以接收文本和图像提示作为输入(仅限有限发布)。 对于图像输入,GPT-4 将尝试理解图像的内容。 看到这种多模式LLM的力量是不可思议的。 LLM中的参数数量通常是其大小和复杂性的度量。 这个LLM和类似的LLM使用数千亿到数万亿个参数。 它还使用人工监督和无监督训练技术的组合,以不断变得更好、更准确。

这些LLM与您习惯于从Alexa或Siri等产品中获得的标准语言能力不同。 它们处理自然语言和图像的高级能力使它们非常灵活和适应性强。 这些模型不仅可以用简单的语言提示它们生成类似人类的书面文本,还可以通过向它们提供新的训练数据并基于它们构建新的应用程序来学习新的行为。 这有时称为特定垂直领域的模型的最后一英里数据训练,然后是微调类型训练。

虽然聊天机器人ChatGPT可以从自然语言和图像提示生成类似人类的文本,但DALL-E-2使用相同的GPT-4语言模型从自然语言提示生成图像。 DALL-E-2是由OpenAI开发的基于神经网络的AI模型,能够从文本描述中生成高质量的图像。 与依赖于预先存在的图像数据集的传统图像生成模型不同,DALL-E-2 结合使用深度学习技术和自然语言处理 (NLP) 从文本输入生成原始图像。

DALL-E-2在几秒钟内从简单的通俗语言提示“机器人形状的3D管网”生成了这张原始图像。

这仅仅是个开始。 虽然这些模型目前只能处理这么多的复杂性,但未来更强大、更复杂的迭代最终将发布。 例如,GPT-3 的模型基于 1750 亿个参数,虽然在发布时尚不清楚 GPT-4 有多少个参数,但有人预测其他 LLM 可以使用多达一 万亿个参数。 因此,虽然这些语言模型现在很强大,但它们只会变得更好,这让人想知道,它们还能做什么?

这就是为什么水行业现在应该加入进来,因为人工智能工具将根据它们开发的领域和训练的数据产生不同的影响。 为了使这些模型在水行业具有深入、真实的应用,它们需要特定于行业的数据和情报。

推动水务行业数据的最后一英里

我们需要开始研究水行业所谓的“数据的最后一英里”。 这是我们非常具体地了解我们行业中的数据和概念的地方,因此我们可以开始训练这些模型以及使用它们的人,以帮助解决水务部门的独特挑战。 准确反映水行业的大、多样、有代表性的数据是这些人工智能对行业有用的关键。 我们需要向这些模型传授水务部门特有的专业词汇、行话、相关数据和概念。

因为 正如这里所讨论的,这些较新的 LLM 准确性的挑战之一是它们受到数据和训练偏差的影响。 例如,GPT-4 模型使用一种称为 人类反馈强化学习 (FLHF) 的技术,从文本数据和人类的强化中学习。 该技术通过使用人类反馈来指导AI的学习过程来微调基线模型。 但是,参与模型训练的数据和人员可能无法代表潜在的最终用户,这可能会影响这些模型产生的结果类型。

这些模型还有其他问题。 例如,ChatGPT 的模型可能会 产生幻觉,给你错误答案,但看起来逻辑合理。 它也不是 可解释的人工智能,使它成为一个黑匣子,我们不知道它是如何得到答案的。 我们需要具有行业知识的人来测试这些模型的准确性并监督他们,以确保模型与我们的行业相协调。

想象一下,如果世界各地的公用事业公司汇集其匿名的每小时电表数据,以帮助训练和利用我们行业的这些新的人工智能模型,会发生什么。 例如,借助庞大的全球计量数据集,可以向可能没有资源来安装和部署 AMI 电表的公用事业公司提供虚拟电表的概念。 虚拟仪表可以作为所有类型的运营分析(包括 数字孪生)的强大数据输入。 通过合作处理水务部门的最后一英里数据,公用事业公司可以利用人工智能的力量更全面地了解用水和模式,从而为更有效的水管理策略提供信息,并为客户和环境带来更好的结果。

对于水务行业的每个人来说,这是一个机会,从创新的水务企业到拥有数十年隐性知识的公用事业运营商(包括一些即将退休并随身携带这些知识的人),在全球范围内合作并将水行业背景、监督和数据引入这些模型,因此我们行业的创新者可以开发和结合针对水行业特定知识和目标定制的人工智能解决方案,以造福所有公用事业, 大大小小的。

为各种规模的公用事业公司提供民主化的人工智能机会;不是工作的替代品

对于较小的公用事业公司或资源有限的公用事业公司来说,人工智能的这些新发展可能会令人生畏或遥不可及。 但实际上,这些新的语言模型使人工智能技术民主化,因为人们不必显着改变他们的习惯或训练一个全新的程序来看到好处。 它们使人们无需专业知识和技能即可获得人工智能的力量——你所需要的只是简单的语言和一点创造力,让人工智能产生你需要的东西(快速工程可能是水务部门一个有趣的焦点)。

仅这些工具的总结机会就在日常工作中提供了有用的应用程序。 想象一下,将所有类型的公用事业数据输入一个有用的人工智能助手,然后该助手可以在几秒钟内为您提供有关数据的简单语言见解。 甚至在分析数据之前,这些模型也可以帮助非专家编写一个很好的代码样本来提取相关信息,例如平均用水量、不同类型的压力读数或水质数据。 它也许能够帮助我们的行业预处理尚未清理的数据,甚至告诉我们需要发生什么才能预处理数据。

您可能是一个非常小的公用事业公司的操作员,该实用程序拥有很多专业知识,并且您知道自己有泄漏,因为您听到了泄漏,但您需要有关它的更多信息。 这些新的语言模型为公用事业运营商打开了大门,使用自然语言与 AI 模型进行通信,并尝试它可以为您提供的各种见解。 也许它可以建议您需要的数据,以便更好地理解问题,几乎就像拥有数据助手一样。 从这个意义上说,这些人工智能模型不是工作的替代品,而是与人工智能的合作,因为它们根本没有水务部门人类所拥有的现实世界经验和隐性专业知识。

虽然已经有大量数据可以开始为水务部门试验和训练这些模型,但也有“数据即服务”(DAAS – 见 SWAN论坛 有关该主题的更多信息)模型开始出现,以弥合小型公用事业公司的差距,这些公用事业公司可能缺乏数据、资源、能力和专业知识来收集从人工智能获得高质量答案所需的数据。 这些新的商业模式负责为正确的问题和位置获取正确的传感器,以及设置数据通信、数据清理和分析,以便公用事业公司可以专注于从数据中受益。 软件和服务的这种组合可以非常快速地为任何小型实用程序带来这些技术的好处。

水务部门不应该害怕测试、玩耍和试验这些新的人工智能工具,看看它们如何为他们工作。 从小城镇到特大城市,从现场工作人员到高管,公用事业公司可以跳进去,开始玩、创新和学习,即使数据很少,人工智能如何让他们的工作更轻松。

最后,这是对水务行业所有深厚专业知识和知识来源的呼吁——公用事业运营商和管理人员、工程师、科学家、学者——将他们的专业知识贡献给机器学习,以发展其智能成果,并探索这些 LLM 如何更好地在水务部门做出决策。

#QatiumExperts

Qatium是与水行业的专家和思想领袖共同创建的。 我们创建内容以帮助各种规模的公用事业公司面对当前和未来的挑战。

Gigi Karmous-Edwards,Karmous Edwards Consulting LLC的水务部门数字孪生专家和顾问,是Qatium社区的成员。

You might also like...