导航：首页> 医学或兽医学；卫生学>一种大语言模型驱动的人在回路电网调度系统及方法

一种大语言模型驱动的人在回路电网调度系统及方法

文献发布时间：2024-04-18 20:01:55

技术领域

本发明涉及电网调度领域，特别涉及一种大语言模型驱动的人在回路电网调度系统及方法。

背景技术

电力系统是现代社会的基础设施之一，其稳定、高效的运行关乎社会的正常运转。随着电力系统的复杂性增加，以及可再生能源的大规模并网，电网调度的任务变得越来越复杂和困难。此外，随着大数据和人工智能技术的发展，如何利用这些技术提高电网调度的效率和准确性，已成为了业界的重要研究课题。

目前大部分采用基于预设规则和策略的电网调度系统，这些系统通常包括数据处理模块，用于收集和处理电网实时数据，以及一个规则引擎，用于根据预设的规则和策略生成电网调度决策。现有的基于预设规则和策略的电网调度系统，虽然可以实现一定程度的自动化，并能处理部分结构化的电网数据，但在处理复杂和动态的电网环境，以及非结构化数据(如天气预报，设备状态等)方面的能力有限。此外，这些系统的决策过程往往缺乏透明性，对于复杂和异常状况的处理能力有限。同时，这些系统通常缺乏有效的人机交互能力，使得人工操作员难以有效监控和干预系统的运行。这些问题与不足明显地限制了现有电网调度系统的性能和效率。

发明内容

为解决上述技术问题，本发明提供了一种大语言模型驱动的人在回路电网调度系统及方法，以达到实现更精确、高效的电网调度决策，提高电网的稳定性和可靠性，保证操作员有效地监控和干预系统运行的目的。

为达到上述目的，本发明的技术方案如下：

一种大语言模型驱动的人在回路电网调度系统，包括数据处理模块、大语言模型模块、交互调控模块和人机交互模块；

所述数据处理模块用于处理多种类型的数据，包括人为操作数据、系统反馈数据以及模型建议数据；

所述大语言模型模块采用基于人工智能的大语言模型在系统中起核心作用，其作用在于理解和处理大量的电网数据，以及生成精确的电网调度决策；

所述交互调控模块负责将大语言模型模块的决策转化为具体的操作命令，然后通过电力系统调度自动化系统API控制DAS或其他系统将这些命令发送到电网设备中去；

所述人机交互模块体现人在回路的原则，用于接收操作员向系统提供高级指令，同时也便于操作员监督系统的运行并在必要时进行干预。

上述方案中，所述大语言模型模块包括调度决策生成构件、决策生成流程管理链和智能体；

所述调度决策生成构件：这些构件是一个个执行特定任务的单元，每个构件都有其独特的功能，旨在处理电网数据并产生部分决策信息；这些构件利用大语言模型技术，涉及复杂的计算和推理过程，所有构件的共同目标是生成决策，满足电网的运行需求，同时保障电网的运行安全和经济性；

所述决策生成流程管理链：这是一个管理和组织各个构件的系统，决策生成流程管理链按照预设的顺序，调度各个构件的运行；具体来说，它将各个独立的构件联接成一个完整的流程，使得不同的构件可以协同工作，共同完成电网调度决策的生成；每个构件的输出可以作为下一个构件的输入，从而形成一个连贯、高效的决策生成流程；

所述智能体：智能体扮演着决策和管理角色，根据电网的运行状态和输入数据的复杂度，动态地选择和组织适当的调度决策生成构件以及管理它们在决策生成流程管理链中的运行。

进一步的技术方案中，所述调度决策生成构件包括提示模板一、示例选择器和输出解析器一；

所述提示模板作为输入模板生成器，其职责是产生定向的查询模板，辅助大语言模型准确解读用户输入并产生适宜的响应；

所述示例选择器旨在从预设的示例库中筛选出最符合当前任务需求的示例，供大语言模型学习使用；

所述输出解析器主要任务是解析大语言模型的输出，转化为适宜进行下一步处理的格式，或者易于用户理解的形式。

进一步的技术方案中，所述决策生成流程管理链包括提示模板二、大语言模型、自我一致性组件和输出解析器二；

所述提示模板二用于将用户的输入转化为大语言模型可以理解的格式；

所述大语言模型是一个用于处理自然语言的工具，它接收提示模板的输出，并生成对应的响应；

所述自我一致性组件接收大语言模型的输出，生成多个不同的推理过程和答案，并通过投票的方式选出最佳答案；

所述输出解析器二用于将大语言模型的输出转化为用户可以理解的格式。

进一步的技术方案中，所述智能体包括行为学习空间、行为技能库和提示迭代机制；

所述行为学习空间用于培养智能体学习和学习的能力，并寻求灵活的多重解决方案；

所述行为技能库作为学习和演化基础的行为技能库，用可执行代码表示每个技能；

所述提示迭代机制通过向大语言模型提供智能体当前状态和任务，要求它扮演评估者并告诉程序是否完成了任务。

上述方案中，所述交互调控模块包括命令规划模块、代码映射库模块、电力系统调度自动化系统API接口模块；

所述命令规划模块用于将大语言模型生成的调度决策分解转换为具体的、可执行的步骤规划；

所述代码映射库模块根据命令规划模块规划出的目标设备、操作流程和操作参数，查询匹配代码映射库中的映射关系；

所述电力系统调度自动化系统API接口模块用于提交匹配后的指令，控制电网设备执行相应的操作。

上述方案中，所述人机交互模块包括接收指令模块、解析指令模块、执行指令模块、监控状态与反馈模块、实时干预模块，以及学习与优化模块；

所述接收指令模块：这是整个流程的起点，操作员通过这个模块提供高级指令，包括电网调度策略和目标；

所述解析指令模块：这一模块接收到操作员的高级指令后，通过大语言模型将这些指令解析转化为系统可以理解和执行的命令；

所述执行指令模块：此模块接收到解析和转化后的命令，并开始执行；

所述监控状态与反馈模块：在执行过程中，此模块持续监控系统的运行状态，并通过人机交互模块将这些信息实时反馈给操作员；

所述实时干预模块：如果系统运行不正常或遇到复杂场景，操作员可以通过这个模块介入，修改指令或直接控制设备；

所述学习与优化模块：操作员的反馈信息会被收集起来供大语言模型进行学习和优化；通过对操作员的指令和评估的分析，大语言模型持续调整其策略和参数，以提升决策质量。

一种采用上述大语言模型驱动的人在回路电网调度系统的调度方法，包括如下步骤：

步骤一，数据处理：数据处理模块收集并处理多种类型的数据，包括人为操作数据、系统反馈数据以及模型建议数据，这些数据被清洗和整理，使其可以被大语言模型模块接受和理解；

步骤二，生成调度决策：在收集到清洗整理后的数据后，大语言模型模块开始工作，该模块利用人工智能技术来处理和理解电网数据，并基于这些数据生成精确的电网调度决策；

步骤三，决策执行：交互调控模块将大语言模型模块生成的决策转化为具体的操作命令，通过电力系统调度自动化系统API控制DAS或其他系统，这些命令被发送到电网设备中，实现对电网的实时调度和控制；

步骤四，人机交互：在系统运行过程中，人机交互模块接收操作员向系统提供的指令，监督系统的运行；在必要时，操作员可以对系统进行干预，以确保电网的正常运行；最后，系统根据电网设备的实时反馈和操作员的输入指令，对大语言模型进行优化和调整，以提高未来决策的精准性和电网的运行效率。

进一步的，步骤二生成调度决策的步骤如下：

(1)输入电网数据：首先，将电网的运行数据和状态信息输入到系统中；

(2)智能体选择和组织构件：智能体根据电网的运行状态和输入数据的复杂度，动态地选择和组织适当的调度决策生成构件，每个构件都包含一个或多个提示，这些提示用于让大语言模型执行特定任务的指示；

(3)调度构件：智能体通过决策生成流程管理链管理和组织各个构件的运行，决策生成流程管理链按照智能体设置的顺序，调度各个构件的运行，每个构件的输出作为下一个构件的输入，从而形成一个连贯、高效的决策生成流程；

(4)执行构件并生成决策：在决策生成流程管理链的调度下，大语言模型按照智能体指定的流程，依次执行每个构件的提示，处理输入数据，并生成部分决策信息；这个过程持续进行，直到所有的构件都执行完毕，最终生成电网调度决策；

(5)输出决策：最后，系统将智能体和决策生成流程管理链协同生成的电网调度决策输出，以供调度中心使用。

进一步的，步骤三决策执行的步骤如下：

(1)命令规划模块将大型大语言模型生成的决策分解转换为具体的、可执行的步骤规划，包括目标设备、操作流程和操作参数；

(2)根据命令规划模块规划出的具体步骤，匹配代码映射库模块中的映射关系，生成可以被电力系统调度自动化系统API接口理解的指令；

(3)最后，通过电力系统调度自动化系统API接口，提交生成的指令，控制电网设备执行相应的操作。

通过上述技术方案，本发明提供的一种大语言模型驱动的人在回路电网调度系统及方法具有如下有益效果：

1、本发明解决了现有的电网调度系统对非结构化数据的处理能力有限，无法充分利用这些信息来进行电网调度决策的问题，本发明通过数据处理模块可以实现对非结构化数据的有效高速处理。

2、本发明解决了现有的调度决策主要依赖于预设的规则和策略，缺乏对复杂和动态电网环境的理解和适应，无法生成精确的电网调度决策的问题，本发明通过大语言模型接收并处理人类操作员给出的高级指令，模型能理解这些指令的含义，并将其转化为具体的电网设备操作命令。这大简化了操作员的工作，提高了工作效率。

3、本发明解决了现有的人工智能模型存在的黑箱决策和人机交互问题，本发明采用人在回路的设计，通过人机交互模块允许人类操作员向系统提供高级指令，同时也能监督系统的运行并在必要时进行干预。这增强了系统的透明度和可控性，同时也使得系统能够更好地适应复杂和动态的电网环境。

4、本发明的交互调控模块通过D5000系统API控制DAS或其他系统将大语言模型的决策转化为具体的操作命令，并发送到电网设备中去。这一步骤确保了决策的及时且正确执行，提高了电网的响应速度和可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例所公开的一种大语言模型驱动的人在回路电网调度系统示意图。

图2为大语言模型模块组成示意图。

图3为交互调控模块组成示意图。

图4为人机交互模块组成示意图。

图5为本发明所公开的一种大语言模型驱动的人在回路电网调度方法流程示意图。

图6为大语言模型生成决策的流程图。

图7为交互调控模块决策执行的流程图。

图8为人机交互模块的运行流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明提供了一种大语言模型驱动的人在回路电网调度系统，如图1所示，包括数据处理模块、大语言模型模块、交互调控模块和人机交互模块。

一、数据处理模块

数据处理模块用于处理多种类型的数据，包括人为操作数据、系统反馈数据以及模型建议数据。

人为操作数据处理：数据处理模块接收来自操作员的输入，这可能包括文本指令、调度方案选择、系统调整等。这些数据被解析，进行格式化和标准化操作，以便进一步处理。

系统反馈数据处理：数据处理模块收集D5000系统的反馈数据，包括系统状态、告警信息、设备状态等。这些数据被清洗和验证，以确保数据的准确性和完整性。

模型建议数据处理：数据处理模块处理来自大语言模型的建议数据，这可能包括优化策略、预测结果、可能的故障预警等。这些数据被转化为可以被操作员理解和使用的格式。

数据处理模块通过这些步骤，使得各类数据能够以正确的格式和结构被传递到大语言模型和操作员。

二、大语言模型模块

大语言模型模块采用基于人工智能的大语言模型在系统中起核心作用，其作用在于理解和处理大量的电网数据，以及生成精确的电网调度决策。

大语言模型(LLM)在系统中起到核心作用，其主要任务是处理和理解电网数据，并基于这些数据生成精确的电网调度决策。模型决策生成是它的重要职责之一，它利用人工智能技术对收集到的、清洗整理后的数据进行分析，从而做出有效决策。大语言模型模块依赖LLM通用框架，如LangChain等，这大简化了创建由大型大语言模型(LLM)和聊天模型提供支持的应用程序的过程。如图2所示，其核心组成部分包括：Component(构件)、Chain(链)和智能体(Agent)。这些模块的关系如下：

1、调度决策生成构件(Component)

这些构件是一个个执行特定任务的单元，每个构件都有其独特的功能，旨在处理电网数据并产生部分决策信息。这些构件利用大语言模型(LLM)技术，可能涉及复杂的计算和推理过程。所有构件的共同目标是生成决策，满足电网的运行需求，同时保障电网的运行安全和经济性。

在LLM(Large Language Model)通用框架中，Component构件充当模块化的构建单元。组件的设计目标为实现特定功能，以及与其他组件进行集成，从而创造出更强大的应用程序。

提示模板一(Prompt Template1)：此模块作为输入模板生成器，其职责是产生定向的查询模板，辅助大语言模型准确解读用户输入并产生适宜的响应。在实现中，采用自然语言处理(NLP)技术，如词法分析和语法分析，将用户输入转化为适配大语言模型理解的格式，以此优化模型响应的精度。

示例选择器(Example Selector)：这一模块为示例选择器，旨在从预设的示例库中筛选出最符合当前任务需求的示例，供大语言模型学习使用。在实现过程中，运用机器学习算法，如分类器或聚类算法，根据任务特征及需求，从示例库中挑选最具代表性的示例，进而提升模型学习的效率和输出的精确度。

输出解析器一(Output Parser1)：作为输出解析模块，主要任务是解析大语言模型的输出，转化为适宜进行下一步处理的格式，或者易于用户理解的形式。在实现上，采用自然语言处理(NLP)技术，如语义分析和实体识别，将大语言模型的输出转化为具有明确含义和结构的数据，以便进行后续处理或展示。

在实际运行流程中，各组件工作序列如下：

首先，Prompt Template1根据用户输入生成模板；

然后，Example Selector根据生成的模板从示例库中筛选出合适的示例；

接着，大语言模型根据选择的示例生成响应；

最后，Output Parser1对生成的响应进行解析和格式转换。在整个流程中，各组件协同工作，实现了精准、高效的处理流程。

2、决策生成流程管理链(Chain)

这是一个管理和组织各个构件的系统。决策生成流程管理链按照预设的顺序，调度各个构件的运行。具体来说，它将各个独立的构件联接成一个完整的流程，使得不同的构件可以协同工作，共同完成电网调度决策的生成。每个构件的输出可以作为下一个构件的输入，从而形成一个连贯、高效的决策生成流程。

Chain被定义为一系列组件(Component构件)或其他链的集合，它们按照特定的顺序组合在一起以完成指定的任务。例如，可能存在一种链，它包含了提示模板二(PromptTemplate2)、大语言模型(Language Model)、自我一致性(Self-Consistency)组件和输出解析器二(Output Parser2)。这些组件协同工作，处理用户输入，生成反馈，并进行输出处理。

提示模板二(Prompt Template2)：提示模板是一个工具，用于将用户的输入转化为大语言模型可以理解的格式。它的目的是为了将用户的问题或指令格式化为一种大语言模型可以处理的格式，以便后续的处理过程。

大语言模型(Language Model)：大语言模型是一个用于处理自然语言的工具，通常基于深度学习技术。它接收提示模板的输出，并生成对应的响应。例如，OpenAI的GPT-3就是一种高级的大语言模型。

自我一致性(Self-Consistency)组件：自我一致性组件是根据“Self-Consistency Improves Chain of Thought Reasoning in Language Models”理论提出的一个新组件。它接收大语言模型的输出，生成多个不同的推理过程和答案，并通过投票的方式选出最佳答案。这种方法可以提高模型的推理准确性和一致性。

输出解析器二(Output Parser2)：输出解析器二是一个工具，用于将大语言模型的输出转化为用户可以理解的格式。它的目的是为了将模型的响应格式化为一种用户可以理解的回答或指令。

链的必要性：链的设计旨在实现多个LangChain组件的整合，以构建单一、连贯的应用程序。典型的应用场景包括创建一个链条，接受用户输入，利用提示模板进行格式化，然后将格式化后的响应传递给大语言模型。通过将多个链或与其他组件结合，可以构建更为复杂的链。从实际应用角度看，链实质上是对常用应用场景进行AI任务的封装，简化代码编写，同时提供了任务框架，有利于扩展和调试。

链的技术实现方案：链的实现依赖于设计模式中的管道(Pipeline)和组合(Composite)模式。管道模式允许数据在被处理的过程中通过一系列的处理单位，每个处理单位负责完成特定的处理任务，处理结果再作为下一个处理单位的输入。组合模式则允许将多个对象组合成树形结构以表示"部分-整体"的层次结构，使得客户端对单个对象和组合对象的使用具有一致性。

链的运行流程：

(1)在运行过程中，链首先将用户的输入传递给提示模板，提示模板完成其职责后，将结果传递给下一个组件，即大语言模型。

(2)大语言模型接收到提示模板的输出后，开始生成对应的响应。

(3)随后，这个响应被传递给自我一致性组件，该组件生成多个不同的推理过程和答案，并通过投票的方式选出最佳答案。

(4)最后，最佳答案被传递给输出解析器进行解析和格式化。

3、智能体(Agent)：

智能体扮演着决策和管理角色，根据电网的运行状态和输入数据的复杂度，动态地选择和组织适当的调度决策生成构件(Component)以及管理它们在决策生成流程管理链(Chain)中的运行。

例如，当电网运行稳定，输入数据相对简单时，智能体会选择简单的构件，并设置流程链来执行较为简单的决策生成流程。在这种情况下，可能只需要少量的数据处理和模式识别构件。而在电网运行不稳定，输入数据复杂的情况下，智能体会选择更复杂的构件，并设置流程链来执行复杂的决策生成流程。在这种情况下，可能需要更多的构件，比如特征提取、预测以及复杂的决策生成构件。

智能体在LLM通用框架中，是推动决策制定的实体。它可以访问一套工具，并可以根据用户输入决定调用哪个工具。例如，一个智能体可以根据用户输入的问题类型，选择不同的Chain来回答。在人机交互中，智能体是执行"人在回路"机制的关键部分，可以灵活地根据实时情况选择最合适的工具和策略。

智能体主要有三个关键组件：

①行为学习空间

在大电网仿真/平行系统中，智能体会面临复杂多目标任务。行为学习空间可以培养智能体学习和学习的能力，并寻求灵活的多重解决方案。学习以自下而上的方式展开，允许高度的适应性和响应性。学习基于LLM的transformer技术与注意力机制，数据库由向量数据库表示，其中key键是程序描述的嵌入向量(由LLM生成)，value值则是程序本身。当处理新任务时，首先利用LLM生成解决任务的一般性prompt提示，该提示与环境反馈结合作为查询上下文，查询库中确定5个以上相关动作。随着智能体进展到更难的自驱目标，它自然地学习了各种技能，如“断面分析等”。

输入给LLM的prompt提示包含几个部分：

鼓励多样化行为和施加约束的指示，例如“目标是发现尽可能多的调度方案”；

智能体的当前状态，包括时间，潮流和稳态等；

之前完成和失败的任务，反映智能体的能力阈值；

附加上下文，利用LLM基于智能体的当前状态和学习进程自我提问，并使用调度知识库自我回答问题，为LLM提供额外的上下文。

②行为技能库

作为学习和演化基础的行为技能库，用可执行代码表示每个技能。输入给LLM的prompt提示包含：

代码生成的指南，例如：“你的函数将被重用用于构建更复杂的函数等”；

控制原始API，以及从行为技能库中检索的相关技能；

上一轮生成的代码，环境反馈，执行错误和评估，基于此LLM可以自我改进；

智能体的当前状态，包括当前电网状态、潮流等；

链式思考提示，在生成代码之前进行推理。

③prompt迭代机制

通过向LLM提供智能体当前状态和任务，要求它扮演评估者并告诉程序是否完成了任务。

在每一轮的代码生成中，执行一个程序以获取来自代码解释器的环境反馈和执行错误，这些都被纳入到LLM的下一轮代码细化提示中。这个迭代过程重复进行，直到自我验证确认任务的完成，此时将这个新技能添加到行为技能库，并向行为学习空间求取一个新的目标。如果智能体在进行了大于4轮后仍未能解决问题，那么就需要开启一个新任务。这种prompt提示迭代方法使智能体能够在无需人类干预的情况下持续获取各种行为技能。

智能体的运行流程：

(1)在运行过程中，智能体首先接收到用户的输入，然后根据输入的类型选择最合适的工具或Chain进行处理。

(2)处理过程可能包括调用提示模板进行格式化，使用大语言模型生成响应，通过自我一致性组件进行校验和选择，以及通过输出解析器进行结果的解析和格式化。

(3)最后，智能体将处理结果返回给用户。

三、交互调控模块

交互调控模块负责将大语言模型模块的决策转化为具体的操作命令，然后通过电力系统调度自动化系统API控制DAS或其他系统将这些命令发送到电网设备中去。

交互调控模块的必要性：交互调控模块的设计是为了实现智能电网的自动化和智能化，使得大语言模型的决策能够被电网设备理解和执行。

如图3所示，交互调控模块的技术实现方案：交互调控模块的实现主要涉及三个部分，命令规划模块、代码映射库模块、电力系统调度自动化系统(D5000)API接口模块。

1、命令规划模块：

首先，通过命令规划模块，将大语言模型生成的调度决策分解转换为具体的、可执行的步骤规划。

为了实现这一目标，需要利用调参知识库训练一个transformer模型，这个模型被设计来理解LLM生成的决策。调参知识库提供了丰富的信息，包括各种调参参数、它们的可接受范围，以及它们对整体系统性能的影响。

调参知识库是一个包含大量信息的数据库，包括各种系统调参参数、它们的可接受范围和变化，以及这些变化如何影响整体系统性能的数据。这个知识库可以是手动创建的，也可以是从历史性能数据中自动提取的。

这个模型被训练来识别决策中的目标设备、操作流程和操作参数。“目标设备”指的是决策所涉及的特定硬件或软件组件。'操作流程'指的是需要在目标设备上执行的动作或任务序列。'操作参数'是在操作过程中需要应用的特定设置或值。

例如，如果LLM生成了一个像"增加数据库的内存分配以提高性能"的决策，那么模型将识别目标设备为数据库系统，操作流程为调整内存分配，操作参数为增加的内存量。

在识别这些元素之后，模型然后制定一个详细的步骤规划来实施决策。这个计划是可执行的，可以直接应用于目标设备，从而有效地将LLM的高级决策转化为现实世界的行动。

2、代码映射库模块：

根据命令规划模块规划出的目标设备、操作流程和操作参数，查询匹配代码映射库中的映射关系。

具体实现步骤是：高级代码生成，使用LLM如Chatgpt-4自动生成一系列的高级代码。确保生成的代码覆盖了需求范围，包括各种常见和不常见的编程任务。高级代码检测和验证，在自动生成代码之后，将代码提交给人/机审查者如训练一个机器学习模型进行检查和验证。审查者检查代码的质量，包括其可读性、性能、以及是否满足预定的功能需求。这一步可以利用例如GitHub的pull request审查机制或者其他代码审查工具来进行。

词法分析和语法分析，使用如ANTLR工具对生成的高级代码进行词法分析和语法分析，得到抽象语法树(AST)。ANTLR等是一类强解析器生成器，能自动完成词法和语法分析的任务。语义分析，利用如Abstract Interpretation或Symbolic Execution等技术对AST进行部分自动化的语义分析。这一步通常需要人在回路参与，因为它涉及到源语言的语义理解。代码生成，利用如LLVM工具链将抽象语法树转换为LLVM IR(IntermediateRepresentation)，然后再将LLVM IR编译成目标架构的机器指令。LLVM提供了一系列模块化的编译器组件和工具链，能自动完成这个过程。映射关系记录，使用一个数据库管理系统(如PostgreSQL)来存储高级代码和底层控制指令的映射关系。设计一个数据库模式，定义数据结构和关联关系，并使用SQL接口来自动化数据插入和查询的过程。

数据库扩展，在自动化存储映射关系之后，可能会有新的高级代码或底层指令需要添加到数据库中。此时，进行手动/自动扩展，通过人工/机器学习将新的映射关系添加到数据库中。此外，根据需要对数据库模型进行修改和扩展，以适应新的需求。

3、D5000 API接口模块：

调用电力系统调度自动化系统D5000的API接口，提交匹配后的指令，控制电网设备执行相应的操作。

电力系统调度自动化系统D5000

D5000作为调度自动化系统的基础平台，该平台是一个由服务器、存储设备、网络设备、操作系统、数据库、中间件、应用软件等软硬件组成的复杂系统。D5000承载的电网调度核心业务包括：数据采集与监控(DAS)、能量管理(EMS)、调度计划(OPS)、安全校核(SCS)、调度管理(OMS)、调度仿真培训(DTS)等。

具体通过API控制调度自动化系统(DAS)、远程控制系统(RCS)来管理发电机、变电站等设备。采用如Modbus、IEC 61850或DNP3等协议与底层设备进行通信。

具体步骤：

(1)命令规划模块将大型大语言模型生成的决策分解转换为具体的、可执行的步骤规划，包括目标设备、操作流程和操作参数。

(2)然后，根据命令规划模块规划出的具体步骤，匹配代码映射库模块中的映射关系，生成可以被D5000 API接口理解的指令。

(3)最后，通过D5000 API接口，提交生成的指令，控制电网设备执行相应的操作。

四、人机交互模块

人机交互模块体现人在回路的原则，用于接收操作员向系统提供高级指令，同时也便于操作员监督系统的运行并在必要时进行干预。

人机交互模块是一个关键的组件，通过引入大语言模型(LLM)和人在回路的设计理念，实现了人类与智能系统的高级交互，强化电网调度系统的灵活性和应对未知情况的能力。在人机交互模块的实现上，可以使用两种不同的模式，即"以大语言模型(LLM)为主，人为辅"和"以人为主，LLM为辅"。

1)以大语言模型(LLM)为主，人为辅

在这种模式下，大语言模型在系统的运行过程中起主导作用，而人类操作员主要扮演辅助角色。LLM会根据收到的数据和反馈，自主做出决策，包括解析和执行指令、监控系统运行状态、调整策略和参数等。与此同时，操作员主要负责监控LLM的行为，验证其决策的正确性，并在必要时进行实时干预。这种模式的优势在于能够充分利用LLM的强大计算和分析能力，大提高了系统的自动化程度和运行效率。然而，这也需要操作员对LLM的性能和行为有深入的理解，以便在需要时进行有效的干预。

2)以人为主，大语言模型(LLM)为辅

与上述模式相反，在这种模式下，是人类操作员在系统运行过程中起主导作用，而LLM主要扮演辅助角色。操作员会负责制定和执行大部分的决策，包括选择调度策略、监控系统运行状态、调整设备状态等。与此同时，LLM主要负责提供支持，包括解析操作员的指令、提供决策建议、生成易于理解的反馈信息等。这种模式的优势在于能够充分利用人类的专业知识和经验，对复杂情况和未知问题有更好的处理能力。然而，这也需要操作员具备足够的专业知识和技能，并能够有效地使用LLM提供的支持。

总的来说，这两种模式各有优劣，适用于不同的情况和需求。在实际应用中，可能会根据实际情况和需求，灵活选择或结合这两种模式，以最大限度地提高系统的性能和效率。

人机交互模块的功能具体包括：

(1)高级指令的解析与执行：人机交互模块接收来自操作员的高级指令，这些指令可能涉及复杂的电网调度策略或目标。大语言模型在这个过程中起着关键的角色，解析操作员的指令，将其转化为可由系统理解和执行的命令。这一步骤的核心在于，大语言模型的语义理解能力，使得智能系统能够理解并响应复杂的人类语言输入。

(2)系统运行状态的监控与反馈：人机交互模块也负责提供系统运行状态的实时反馈给操作员。操作员可以利用此反馈信息，评估系统的调度决策和执行情况，从而对系统的行为进行精细控制。这种反馈机制，建立在大语言模型的生成能力之上，可以将系统内部的复杂状态，以易于理解的方式呈现给操作员。

(3)人在回路的实时干预：在这个模块中，人在回路的设计理念被执行。即使在系统的自动化运行中，操作员仍保有实时干预的能力。一旦系统出现预期外的行为，或者遇到无法处理的复杂场景，操作员可以立即介入，修改指令或直接控制设备，以确保电网的稳定运行。这一环节与前述的监控与反馈密切相关，操作员的干预行为通常建立在对系统状态的持续监控之上。

(4)基于反馈的学习与优化：人机交互模块还负责收集操作员的反馈，以供大语言模型学习与优化。通过对操作员指令和评估的分析，大语言模型能够持续调整其策略和参数，以提升其决策质量。这一过程的实现，强化了系统的自我优化能力，并深化了大语言模型与操作员之间的交互。

如图4所示，人机交互模块包括接收指令模块、解析指令模块、执行指令模块、监控状态与反馈模块、实时干预模块，以及学习与优化模块。各个模块的功能如下：

接收指令模块：这是整个流程的起点，操作员通过这个模块提供高级指令，包括电网调度策略和目标；

解析指令模块：这一模块接收到操作员的高级指令后，通过大语言模型将这些指令解析转化为系统可以理解和执行的命令；

执行指令模块：此模块接收到解析和转化后的命令，并开始执行；

监控状态与反馈模块：在执行过程中，此模块持续监控系统的运行状态，并通过人机交互模块将这些信息实时反馈给操作员；

实时干预模块：如果系统运行不正常或遇到复杂场景，操作员可以通过这个模块介入，修改指令或直接控制设备；

学习与优化模块：操作员的反馈信息会被收集起来供大语言模型进行学习和优化；通过对操作员的指令和评估的分析，大语言模型持续调整其策略和参数，以提升决策质量。

一种采用上述大语言模型驱动的人在回路电网调度系统的调度方法，如图5所示，包括如下步骤：

步骤一，数据处理：数据处理模块收集并处理多种类型的数据，包括人为操作数据、系统反馈数据以及模型建议数据，这些数据被清洗和整理，使其可以被大语言模型模块接受和理解。

步骤二，生成调度决策：在收集到清洗整理后的数据后，大语言模型模块开始工作，该模块利用人工智能技术来处理和理解电网数据，并基于这些数据生成精确的电网调度决策。

如图6所示，生成调度决策的具体步骤如下：

(1)输入电网数据：首先，将电网的运行数据和状态信息输入到系统中。

(2)智能体选择和组织构件：智能体根据电网的运行状态和输入数据的复杂度，动态地选择和组织适当的调度决策生成构件，每个构件都包含一个或多个提示，这些提示用于让大语言模型执行特定任务的指示。

(5)输出决策：最后，系统将智能体和决策生成流程管理链协同生成的电网调度决策输出，以调度中心使用。

步骤三，决策执行：交互调控模块将大语言模型模块生成的决策转化为具体的操作命令，通过电力系统调度自动化系统API控制DAS或其他系统，这些命令被发送到电网设备中，实现对电网的实时调度和控制。

如图7所示，决策执行的具体步骤如下：

(1)命令规划模块将大型大语言模型生成的决策分解转换为具体的、可执行的步骤规划，包括目标设备、操作流程和操作参数；

(2)根据命令规划模块规划出的具体步骤，匹配代码映射库模块中的映射关系，生成可以被电力系统调度自动化系统API接口理解的指令；

(3)最后，通过电力系统调度自动化系统API接口，提交生成的指令，控制电网设备执行相应的操作。

如图8所示，人机交互的具体步骤如下：

(1)接收指令：操作员给出高级指令。这些指令可能包括各种复杂的电网调度策略和目标。

(2)解析指令：大语言模型(LLM)接收到指令后，会解析这些指令并将其转化为系统能理解和执行的命令。这一步骤主要依赖于大语言模型的语义理解能力。

(3)执行指令：系统接收到大语言模型解析并转化的命令后，开始执行这些命令。

(4)监控状态与反馈：系统在执行命令的过程中，会持续监控整个系统的运行状态，并通过人机交互模块，将这些信息实时反馈给操作员。操作员可以利用这些反馈信息，对系统的运行状态有一个实时的了解。

(5)实时干预：如果系统在运行过程中出现了预期外的行为，或者遇到了无法处理的复杂场景，操作员可以利用人在回路的机制，立即介入，修改指令或直接控制设备。

(6)学习与优化：操作员的反馈信息会被人机交互模块收集起来，供大语言模型学习和优化。通过对操作员的指令和评估的分析，大语言模型可以持续调整其策略和参数，以提升其决策质量。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：青岛智能产业技术研究院;国网浙江省电力有限公司;