欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 基于大数据和边缘计算的数据处理方法及人工智能服务器独创技术45648字

基于大数据和边缘计算的数据处理方法及人工智能服务器

2021-02-12 14:20:41

基于大数据和边缘计算的数据处理方法及人工智能服务器

  技术领域

  本申请涉及边缘计算数据处理技术领域,尤其涉及基于大数据和边缘计算的数据处理方法及人工智能服务器。

  背景技术

  随着科学技术的快速发展,工业互联网技术已逐步应用到各类自动化工业场景中。工业互联网能够为传统的工业厂商提供灵活、快捷的业务功能,显著提高工业制造质量和效率。

  然而,鉴于工业互联网的特点,它的各个节点(组成部分)之间需要实现信息的互联互通,信息技术的高度渗透融合,尤其是工业生产过程和控制网络、互联网的紧密结合,使得工业生产在提高效率的同时,也面临着较为严重的信息安全风险隐患。其中较为严重的信息安全风险隐患为:黑客通过盗取工业设备的生产信息从而实现对工业设备的运行参数的恶意篡改,这会导致整个工业互联网生产系统出现严重的生产安全事故。

  发明内容

  本申请提供基于大数据和边缘计算的数据处理方法及人工智能服务器,以改善现有技术存在的上述技术问题。

  第一方面,提供一种大数据和边缘计算的数据处理方法,应用于人工智能服务器,所述人工智能服务器与互相之间通信连接的工业生产控制服务器以及多个工业设备通信,所述方法至少包括如下步骤:

  检测并获取工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识,在所述第一业务生产标识和所述第二业务生产标识相同的情况下,获取所述工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据;

  按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,并根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级;

  基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据;

  在检测出所述第一业务生产标识和所述第二业务生产标识在当前时段的下一时段内仍然相同的情况下,若所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据不一致,则根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备。

  第二方面,提供一种人工智能服务器,所述人工智能服务器与互相之间通信连接的工业生产控制服务器以及多个工业设备通信,所述人工智能服务器具体用于:

  检测并获取工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识,在所述第一业务生产标识和所述第二业务生产标识相同的情况下,获取所述工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据;

  按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,并根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级;

  基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据;

  在检测出所述第一业务生产标识和所述第二业务生产标识在当前时段的下一时段内仍然相同的情况下,若所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据不一致,则根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备。

  第三方面,提供一种人工智能服务器,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与所述人工智能服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述的方法。

  第四方面,提供一种计算机可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在人工智能服务器的内存中运行时实现上述的方法。

  本申请实施例所提供的基于大数据和边缘计算的数据处理方法及人工智能服务器,首先在工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识相同时获取工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据,其次确定第一工作状态数据的状态传递数据进而确定每个第二工作状态数据的状态优先级,然后基于状态优先级构建生产状态拓扑并提取生产状态拓扑的特征数据,最后在相邻两个时段内的特征数据不一致时根据相邻两个时段内的特征数据的差异数据确定存在入侵行为的目标工业设备。如此,能够及时地判断出出现异常的工业设备,这样可以为后续的异常修复提供准确的目标,从而及时执行相应的安防措施,避免工业互联网生产系统因工业设备被黑客入侵而出现安全隐患导致重大的生产事故的发生,进而确保工业互联网生产系统的安全可靠运行。

  附图说明

  此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

  图1是本申请根据一示例性实施例示出的一种大数据和边缘计算的数据处理系统的通信架构示意图。

  图2是本申请根据一示例性实施例示出的一种大数据和边缘计算的数据处理方法的流程图。

  图3为本申请根据一示例性实施例示出的一种人工智能服务器的硬件框图。

  具体实施方式

  以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

  发明人在对各类工业互联网生产系统进行分析之后发现,依托于边缘计算技术,现有的工业互联网生产系统大多将生产控制权限进行边缘化和分布化,也就是说,边缘端的工业设备能够自主地修改和调整自身的运行参数,并且由于工业互联网生产系统下的工业设备之间会进行频繁的信息互联互通,如果其中一个工业设备被黑客入侵,很容易导致其他工业设备被黑客入侵。而现如今的工业互联网生产系统大多涉及水利、能源、交通等事关国民安全和社会稳定的工业行业,如果工业互联网生产系统出现安全隐患,会造成巨大的损失。

  因此,为改善上述问题,需要在不影响工业设备正常运行的前提下对工业设备的工作状态进行监测,并对监测到的状态数据进行分析,从而及时地判断出出现异常的工业设备,从而为后续的异常修复提供准确的目标,进而避免工业互联网生产系统因工业设备被黑客入侵而出现信息安全隐患以及导致重大的生产事故的发生。

  为实现上述目的,请首先参阅图1,提供了一种大数据和边缘计算的数据处理系统100的通信架构示意图,所述数据处理系统100可以包括人工智能服务器200、工业生产控制服务器300以及多个工业设备400。其中,工业生产控制服务器300和多个工业设备400互相之间通信以形成工业互联网生产系统。在本实施例中,工业互联网生产系统可以应用于多个领域例如新基建、智能制造和智慧城市等,在此不作限定。

  进一步地,人工智能服务器200分别与工业生产控制服务器300以及每个工业设备400通信,用于在不影响工业生产控制服务器300以及每个工业设备400的正常生产运行的前提下实现对工业生产控制服务器300以及每个工业设备400的工作状态的监测以判断工业生产控制服务器300以及每个工业设备400是否因黑客入侵而存在状态异常,这样能够为后续的异常修复提供准确的目标,确保工业互联网生产系统的安全可靠运行。

  在上述基础上,请结合参阅图2,为本发明实施例所提供的大数据和边缘计算的数据处理方法的流程示意图,所述方法可以应用于图1中的人工智能服务器200,具体可以包括以下步骤S21-步骤S24所描述的内容。

  步骤S21,检测并获取工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识,在所述第一业务生产标识和所述第二业务生产标识相同的情况下,获取所述工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据。

  在本实施例中,业务生产标识用于表征工业生产控制服务器和工业设备所处的产线类型,不同的业务生产标识对应不同的产线类型,工作状态数据用于表征工业生产控制服务器和工业设备的运行状态,例如用电状态、损耗状态、传动状态和信号传输状态等,在此不作限定。

  步骤S22,按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,并根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级。

  在实际应用中,设定时间步长可以根据工业设备的数量进行调整,状态传递数据可以表征工业生产控制服务器对每个工业设备进行控制的权限信息,状态优先级是指每个工业设备相对于工业生产控制服务器的受控权重等级。

  步骤S23,基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据。

  在具体实施时,生产状态拓扑中包括与工业设备对应的拓扑节点,特征数据用于表征生产状态拓扑的状态稳定性和数据防入侵系数。

  步骤S24,在检测出所述第一业务生产标识和所述第二业务生产标识在当前时段的下一时段内仍然相同的情况下,若所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据不一致,则根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备。

  在本实施例中,目标工业设备可以理解为被黑客或者恶意软件入侵的工业设备,目标工业设备会与其他工业设备进行通信,黑客或者恶意软件可能通过目标工业设备与其他工业设备的通信链路继续入侵其他工业设备。因此,通过上述步骤准确确定目标工业设备,能够及时执行相应的安防措施,从而确保工业互联网生产系统的安全可靠运行。

  可以理解,通过上述步骤S21-步骤S24所描述的内容,首先在工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识相同时获取工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据,其次确定第一工作状态数据的状态传递数据进而确定每个第二工作状态数据的状态优先级,然后基于状态优先级构建生产状态拓扑并提取生产状态拓扑的特征数据,最后在相邻两个时段内的特征数据不一致时根据相邻两个时段内的特征数据的差异数据确定存在入侵行为的目标工业设备。如此,能够及时地判断出出现异常的工业设备,这样可以为后续的异常修复提供准确的目标,从而及时执行相应的安防措施,避免工业互联网生产系统因工业设备被黑客入侵而出现安全隐患导致重大的生产事故的发生,进而确保工业互联网生产系统的安全可靠运行。

  在上述步骤S21-步骤S24的基础上,为了确保工业互联网生产系统中的其他工业设备不被黑客入侵,在确定出目标工业设备之后,所述方法还可以包括以下步骤S25-步骤S27所描述的内容。

  步骤S25,提取所述目标工业设备的通信协议文本。

  步骤S26,对所述通信协议文本进行通信路径识别得到所述通信协议文本中包括的多条通信路径信息。

  步骤S27,确定每条通信路径信息对应的通信频段基于所述通信频段在所述目标工业设备的通信范围内广播与所述通信频段对应的干扰频段以实现对所述目标工业设备的通信屏蔽。

  在应用上述步骤S25-步骤S27所描述的内容时,能够在确定出目标工业设备后为目标工业设备广播干扰频段以实现对目标工业设备的通信屏蔽,同时还不会影响到工业生产控制服务器与其它设备的正常交互,这样能够切断目标工业设备与工业生产控制服务器以及其它设备的数据信息交互,从而确保工业互联网生产系统中的其他工业设备不被黑客入侵。

  在具体实施时,目标工业设备的准确可靠确定非常关键,否则会导致工业互联网生产系统出现大规模的生产事故和数据安全隐患。然而发明人在具体实施过程中发现,确定出的不同时段的差异数据可能会存在缺失,这样难以准确确定目标工业设备。究其原因,是没有考虑不同时段下每个工业设备的间接相关性,为改善上述问题,在步骤S24中,根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备,具体可以包括以下步骤S241-步骤S245所描述的内容。

  步骤S241,基于所述生产状态拓扑在下一时段内的特征数据的第一时序数据流提取所述生产状态拓扑在下一时段内的特征数据的第一字典数据集,基于所述生产状态拓扑在当前时段内的特征数据的第二时序数据流提取所述生产状态拓扑在当前时段内的特征数据的第二字典数据集;其中,所述第一字典数据集和所述第二字典数据集中均包括多个具有不同特征权重的数据段,且所述第一字典数据集和所述第二字典数据集中的数据段不存在数据类别。

  步骤S242,获取所述生产状态拓扑在下一时段内的特征数据在所述第一字典数据集中的其中一个数据段的第一序列信息,查找出所述第二字典数据集中具有最大特征权重的数据段并将该数据段确定为模板数据段。

  步骤S243,基于计算得到的所述生产状态拓扑在当前时段和下一时段之间的节点集中度的变化率,在所述模板数据段中确定出与所述第一序列信息中的每个第一序列值相对应的第二序列值并将确定出的第二序列值按照其对应的第一序列值在所述第一序列信息中的排序的倒序进行排列得到第二序列信息;确定所述第一序列信息和所述第二序列信息之间的关联系数并基于所述关联系数计算每个工业设备在当前时段内的状态相关性系数;其中,所述状态相关性系数通过采用每个工业设备与所述工业生产控制服务器之间在当前时段内的交互频率对应的活跃度对所述关联系数进行加权得到。

  步骤S244,根据所述状态相关性系数计算每个工业设备在当前时段内和下一时段之间的间接相关性系数。

  其中,步骤S244具体可以通过以下步骤S2441-步骤S2443得到。

  步骤S2441,依据计算得到的每个状态相关性系数对应的第一设备关联路径信息和第二设备关联路径信息,确定待映射的用于确定每个状态相关性系数对应工业设备在当前时段内和下一时段之间的状态相关性变化率的多个路径资源信息的信息签名以及不同路径资源信息之间的重叠率。

  步骤S2442,基于所述信息签名以及所述重叠率将每个状态相关性变化率分别映射到所述生产状态拓扑在当前时段和在下一时段对应的设备状态列表中得到第一状态相关性基值以及第二状态相关性基值。

  步骤S2443,根据所述第一状态相关性基值以及所述第二状态相关性基值计算每个工业设备在当前时段内和下一时段之间的间接相关性系数。

  步骤S245,采用所述间接相关性系数分别对所述生产状态拓扑在下一时段内的特征数据以及在当前时段内的特征数据进行加权得到第一加权数组和第二加权数组;通过计算得到的所述第一加权数组和所述第二加权数组之间的数组相似度确定所述差异数据,并根据所述差异数据确定存在入侵行为的目标工业设备。

  基于上述步骤S241-步骤S245所描述的内容,能够在确定不同时段的差异数据的时候将每个工业设备在不同时段下的间接相关性考虑在内,从而确保确定出的差异数据不会出现缺失,这样能够基于完整且准确的差异数据准确确定出目标工业设备。

  在上述步骤S241-步骤S245的基础上,为了准确可靠地确定出目标工业设备,步骤S245中所描述的通过计算得到的所述第一加权数组和所述第二加权数组之间的数组相似度确定所述差异数据,并根据所述差异数据确定存在入侵行为的目标工业设备,可以示例性地包括以下步骤(1)-(4)所描述的内容。

  (1)获取基于数组相似度所提取到的所述生产状态拓扑在下一时段内的特征数据的第一数据分布图以及在当前时段内的特征数据的第二数据分布图,将所述第一数据分布图和所述第二数据分布图按照相同的划分密度进行划分,得到所述第一数据分布图对应的多个第一子图以及所述第二数据分布图对应的多个第二子图。

  (2)确定相同位置上的第一子图和第二子图之间的欧式距离,针对所述欧式距离中的当前欧式距离,基于当前欧式距离在当前时段内的第一置信度以及当前欧式距离在所述下一时段内的第二置信度,确定当前欧式距离在所述当前时段和所述下一时段之间的置信度差值。

  (3)将置信度差值小于设定值对应的第一子图的第一目标数据以及第二子图的第二目标数据确定为差异数据。

  (4)基于小于设定值的第一子图在所述第一数据分布图的图像位置从所述生产状态拓扑中确定出对应的目标节点,并将所述目标节点对应的工业设备确定为目标工业设备。

  在执行上述步骤(1)-(4)所描述的方法时,能够基于特征数据对应的数据分布图的欧式距离的置信度准确、可靠地确定出目标工业设备。

  在具体实施过程中,为了确保生产状态拓扑的特征识别度,从而减少特征数据提取的耗时,步骤S23所描述的基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据的步骤,示例性地可以通过以下步骤S231-步骤S234实现。

  步骤S231,确定每个状态优先级对应的工业设备的待识别的设备标签信息,对所述设备标签信息进行标签维度信息提取,获得包括标签维度分布及所述标签维度分布对应的分布配置信息的第一信息集合。

  步骤S232,基于所述第一信息集合进行所述工业设备的设备标签信息的相关性分析,对满足设定相关性条件的目标设备标签信息进行增益权重计算,以获取所述目标设备标签信息对应的工业设备的状态增益权重及标签聚类权重。

  步骤S233,在所述状态增益权重处于预设权重区间内的情况下,确定处于所述预设权重区间内的状态增益权重对应的工业设备为局部中心节点,并基于所述局部中心节点对应的目标设备标签信息确定所述局部中心节点的节点连线列表;根据确定出的多个局部中心节点以及多个局部中心节点的节点连线列表构建所述生产状态拓扑。

  步骤S234,根据每个局部中心节点对应的节点连线列表从每个局部中心节点对应的状态记录清单中提取所述生产状态拓扑在当前时段内的特征数据。

  可以理解,通过步骤S231-步骤S234,能够基于每个状态优先级对应的工业设备的设备标签信息以及状态增益权重确定出多个局部中心节点以及节点连线列表,从而确保构建的生产状态拓扑的特征识别度。进一步地,在提取特征数据时,可以仅通过对每个局部中心节点对应的状态记录清单进行处理实现,这样能够避免对生产状态拓扑中的每个节点进行分析,从而减少特征数据提取的耗时。

  可选地,步骤S22所描述的按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,具体可以包括以下步骤S2211-步骤S2213所描述的内容。

  步骤S2211,按照所述设定步长将所述第一工作状态数据划分为多个数据区间,确定相邻两个数据区间之间的数据关联度和数据缺损系数;基于确定出的所述数据关联度和所述数据缺损系数判断所述第一工作状态数据是否存在权限类别标识和系统类别标识。

  步骤S2212,若确定出所述第一工作状态数据存在所述权限类别标识和所述系统类别标识,则依据所述第一工作状态数据在所述权限类别标识下的数据区间,以及所述数值区间的区间描述信息,计算所述第一工作状态数据在所述系统类别标识下的各数据区间与所述第一工作状态数据在所属权限类别标识下的各数据区间之间的区间传递系数。

  步骤S2213,将所述第一工作状态数据在所述系统类别标识下的与在所述权限类别标识下的数据区间之间的区间传递系数大于设定系数的数据区间划分到所述权限类别标识下,基于所述权限类别标识下的数据区间对应的权限数据字段确定所述第一工作状态数据在当前时段内的状态传递数据。

  应用于上述步骤S2211-步骤S2213所描述的内容,能够对第一工作状态数据进行数据区间划分,从而根据数据区间对应的权限数据字段准确确定第一工作状态数据在当前时段内的状态传递数据。

  在上述步骤S2211-步骤S2213的基础上,在步骤S22中,根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级,示例性地可以基于以下步骤S2221-步骤S2223所描述的方法实现。

  步骤S2221,获取根据所述状态传递数据对应的权限数据字段集所确定出的第二工作状态数据的受控指标信息。

  步骤S2222,对于所述第二工作状态数据的受控指标信息中的当前第二工作状态数据的受控指标信息,根据当前第二工作状态数据的受控指标信息在当前时段内的第一控制响应信息,以及各所述第二工作状态数据的受控指标信息在所述当前时段内的第二控制响应信息,计算当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数。

  步骤S2223,基于当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数以及当前第二工作状态数据与所述权限数据字段集之间的匹配度确定当前第二工作状态数据在当前时段内的状态优先级。

  可以理解,通过上述步骤S2221-步骤S2223所描述的上述步骤,能够基于权限数据字段集确定出的第二工作状态数据的受控指标信息准确可靠地确定第二工作状态数据在当前时段内的状态优先级。

  基于上述同样的发明构思,还提供了大数据和边缘计算的数据处理装置,关于所述装置的具体描述如下。

  A1.一种大数据和边缘计算的数据处理装置,应用于人工智能服务器,所述人工智能服务器与互相之间通信连接的工业生产控制服务器以及多个工业设备通信,所述装置至少包括如下功能模块:

  状态数据获取模块,用于检测并获取工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识,在所述第一业务生产标识和所述第二业务生产标识相同的情况下,获取所述工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据;

  优先级确定模块,用于按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,并根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级;

  状态拓扑构建模块,用于基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据;

  入侵行为判定模块,用于在检测出所述第一业务生产标识和所述第二业务生产标识在当前时段的下一时段内仍然相同的情况下,若所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据不一致,则根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备。

  A2.根据A1所述的数据处理装置,所述装置至少还包括入侵行为处理模块,用于:提取所述目标工业设备的通信协议文本;对所述通信协议文本进行通信路径识别得到所述通信协议文本中包括的多条通信路径信息;确定每条通信路径信息对应的通信频段基于所述通信频段在所述目标工业设备的通信范围内广播与所述通信频段对应的干扰频段以实现对所述目标工业设备的通信屏蔽。

  A3.根据A1或A2所述的数据处理装置,入侵行为判定模块,用于:

  基于所述生产状态拓扑在下一时段内的特征数据的第一时序数据流提取所述生产状态拓扑在下一时段内的特征数据的第一字典数据集,基于所述生产状态拓扑在当前时段内的特征数据的第二时序数据流提取所述生产状态拓扑在当前时段内的特征数据的第二字典数据集;其中,所述第一字典数据集和所述第二字典数据集中均包括多个具有不同特征权重的数据段,且所述第一字典数据集和所述第二字典数据集中的数据段不存在数据类别;

  获取所述生产状态拓扑在下一时段内的特征数据在所述第一字典数据集中的其中一个数据段的第一序列信息,查找出所述第二字典数据集中具有最大特征权重的数据段并将该数据段确定为模板数据段;

  基于计算得到的所述生产状态拓扑在当前时段和下一时段之间的节点集中度的变化率,在所述模板数据段中确定出与所述第一序列信息中的每个第一序列值相对应的第二序列值并将确定出的第二序列值按照其对应的第一序列值在所述第一序列信息中的排序的倒序进行排列得到第二序列信息;确定所述第一序列信息和所述第二序列信息之间的关联系数并基于所述关联系数计算每个工业设备在当前时段内的状态相关性系数;其中,所述状态相关性系数通过采用每个工业设备与所述工业生产控制服务器之间在当前时段内的交互频率对应的活跃度对所述关联系数进行加权得到;

  根据所述状态相关性系数计算每个工业设备在当前时段内和下一时段之间的间接相关性系数;

  采用所述间接相关性系数分别对所述生产状态拓扑在下一时段内的特征数据以及在当前时段内的特征数据进行加权得到第一加权数组和第二加权数组;通过计算得到的所述第一加权数组和所述第二加权数组之间的数组相似度确定所述差异数据,并根据所述差异数据确定存在入侵行为的目标工业设备。

  A4.根据A3所述的数据处理装置,入侵行为判定模块,进一步用于:

  依据计算得到的每个状态相关性系数对应的第一设备关联路径信息和第二设备关联路径信息,确定待映射的用于确定每个状态相关性系数对应工业设备在当前时段内和下一时段之间的状态相关性变化率的多个路径资源信息的信息签名以及不同路径资源信息之间的重叠率;

  基于所述信息签名以及所述重叠率将每个状态相关性变化率分别映射到所述生产状态拓扑在当前时段和在下一时段对应的设备状态列表中得到第一状态相关性基值以及第二状态相关性基值;

  根据所述第一状态相关性基值以及所述第二状态相关性基值计算每个工业设备在当前时段内和下一时段之间的间接相关性系数。

  A5.根据A3所述的数据处理装置,入侵行为判定模块,进一步用于:

  获取基于数组相似度所提取到的所述生产状态拓扑在下一时段内的特征数据的第一数据分布图以及在当前时段内的特征数据的第二数据分布图,将所述第一数据分布图和所述第二数据分布图按照相同的划分密度进行划分,得到所述第一数据分布图对应的多个第一子图以及所述第二数据分布图对应的多个第二子图;

  确定相同位置上的第一子图和第二子图之间的欧式距离,针对所述欧式距离中的当前欧式距离,基于当前欧式距离在当前时段内的第一置信度以及当前欧式距离在所述下一时段内的第二置信度,确定当前欧式距离在所述当前时段和所述下一时段之间的置信度差值;

  将置信度差值小于设定值对应的第一子图的第一目标数据以及第二子图的第二目标数据确定为差异数据;

  基于小于设定值的第一子图在所述第一数据分布图的图像位置从所述生产状态拓扑中确定出对应的目标节点,并将所述目标节点对应的工业设备确定为目标工业设备。

  A6.根据A1所述的数据处理装置,状态拓扑构建模块,用于:

  确定每个状态优先级对应的工业设备的待识别的设备标签信息,对所述设备标签信息进行标签维度信息提取,获得包括标签维度分布及所述标签维度分布对应的分布配置信息的第一信息集合;

  基于所述第一信息集合进行所述工业设备的设备标签信息的相关性分析,对满足设定相关性条件的目标设备标签信息进行增益权重计算,以获取所述目标设备标签信息对应的工业设备的状态增益权重及标签聚类权重;

  在所述状态增益权重处于预设权重区间内的情况下,确定处于所述预设权重区间内的状态增益权重对应的工业设备为局部中心节点,并基于所述局部中心节点对应的目标设备标签信息确定所述局部中心节点的节点连线列表;根据确定出的多个局部中心节点以及多个局部中心节点的节点连线列表构建所述生产状态拓扑;

  根据每个局部中心节点对应的节点连线列表从每个局部中心节点对应的状态记录清单中提取所述生产状态拓扑在当前时段内的特征数据。

  A7.根据A1所述的数据处理装置,优先级确定模块,用于:

  按照所述设定步长将所述第一工作状态数据划分为多个数据区间,确定相邻两个数据区间之间的数据关联度和数据缺损系数;基于确定出的所述数据关联度和所述数据缺损系数判断所述第一工作状态数据是否存在权限类别标识和系统类别标识;

  若确定出所述第一工作状态数据存在所述权限类别标识和所述系统类别标识,则依据所述第一工作状态数据在所述权限类别标识下的数据区间,以及所述数值区间的区间描述信息,计算所述第一工作状态数据在所述系统类别标识下的各数据区间与所述第一工作状态数据在所属权限类别标识下的各数据区间之间的区间传递系数;

  将所述第一工作状态数据在所述系统类别标识下的与在所述权限类别标识下的数据区间之间的区间传递系数大于设定系数的数据区间划分到所述权限类别标识下,基于所述权限类别标识下的数据区间对应的权限数据字段确定所述第一工作状态数据在当前时段内的状态传递数据。

  A8.根据A7所述的数据处理装置,优先级确定模块,用于:

  获取根据所述状态传递数据对应的权限数据字段集所确定出的第二工作状态数据的受控指标信息;

  对于所述第二工作状态数据的受控指标信息中的当前第二工作状态数据的受控指标信息,根据当前第二工作状态数据的受控指标信息在当前时段内的第一控制响应信息,以及各所述第二工作状态数据的受控指标信息在所述当前时段内的第二控制响应信息,计算当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数;

  基于当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数以及当前第二工作状态数据与所述权限数据字段集之间的匹配度确定当前第二工作状态数据在当前时段内的状态优先级。

  关于上述功能模块的描述请参阅对应的方法步骤的说明,在此不作更多说明。

  基于上述相同的发明构思,还提供了一种大数据和边缘计算的数据处理系统,具体描述如下。

  B1.一种大数据和边缘计算的数据处理系统,包括人工智能服务器、工业生产控制服务器以及多个工业设备,所述人工智能服务器与互相之间通信连接的工业生产控制服务器以及多个工业设备通信;

  所述人工智能服务器,用于:

  检测并获取工业生产控制服务器的第一业务生产标识和每个工业设备的第二业务生产标识,在所述第一业务生产标识和所述第二业务生产标识相同的情况下,获取所述工业生产控制服务器的第一工作状态数据以及每个工业设备的第二工作状态数据;

  按照设定时间步长确定所述第一工作状态数据在当前时段内的状态传递数据,并根据所述状态传递数据确定每个第二工作状态数据在当前时段内的状态优先级;

  基于所述状态优先级构建所述工业设备的生产状态拓扑,并提取所述生产状态拓扑在当前时段内的特征数据;

  在检测出所述第一业务生产标识和所述第二业务生产标识在当前时段的下一时段内仍然相同的情况下,若所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据不一致,则根据所述生产状态拓扑在下一时段内的特征数据与所述生产状态拓扑在当前时段内的特征数据之间的差异数据确定存在入侵行为的目标工业设备。

  B2.根据B1所述的数据处理系统,所述人工智能服务器,还用于:提取所述目标工业设备的通信协议文本;对所述通信协议文本进行通信路径识别得到所述通信协议文本中包括的多条通信路径信息;确定每条通信路径信息对应的通信频段基于所述通信频段在所述目标工业设备的通信范围内广播与所述通信频段对应的干扰频段以实现对所述目标工业设备的通信屏蔽。

  B3.根据B1或B2所述的数据处理系统,所述人工智能服务器,用于:

  基于所述生产状态拓扑在下一时段内的特征数据的第一时序数据流提取所述生产状态拓扑在下一时段内的特征数据的第一字典数据集,基于所述生产状态拓扑在当前时段内的特征数据的第二时序数据流提取所述生产状态拓扑在当前时段内的特征数据的第二字典数据集;其中,所述第一字典数据集和所述第二字典数据集中均包括多个具有不同特征权重的数据段,且所述第一字典数据集和所述第二字典数据集中的数据段不存在数据类别;

  获取所述生产状态拓扑在下一时段内的特征数据在所述第一字典数据集中的其中一个数据段的第一序列信息,查找出所述第二字典数据集中具有最大特征权重的数据段并将该数据段确定为模板数据段;

  基于计算得到的所述生产状态拓扑在当前时段和下一时段之间的节点集中度的变化率,在所述模板数据段中确定出与所述第一序列信息中的每个第一序列值相对应的第二序列值并将确定出的第二序列值按照其对应的第一序列值在所述第一序列信息中的排序的倒序进行排列得到第二序列信息;确定所述第一序列信息和所述第二序列信息之间的关联系数并基于所述关联系数计算每个工业设备在当前时段内的状态相关性系数;其中,所述状态相关性系数通过采用每个工业设备与所述工业生产控制服务器之间在当前时段内的交互频率对应的活跃度对所述关联系数进行加权得到;

  根据所述状态相关性系数计算每个工业设备在当前时段内和下一时段之间的间接相关性系数;

  采用所述间接相关性系数分别对所述生产状态拓扑在下一时段内的特征数据以及在当前时段内的特征数据进行加权得到第一加权数组和第二加权数组;通过计算得到的所述第一加权数组和所述第二加权数组之间的数组相似度确定所述差异数据,并根据所述差异数据确定存在入侵行为的目标工业设备。

  B4.根据B3所述的数据处理系统,所述人工智能服务器,用于:

  依据计算得到的每个状态相关性系数对应的第一设备关联路径信息和第二设备关联路径信息,确定待映射的用于确定每个状态相关性系数对应工业设备在当前时段内和下一时段之间的状态相关性变化率的多个路径资源信息的信息签名以及不同路径资源信息之间的重叠率;

  基于所述信息签名以及所述重叠率将每个状态相关性变化率分别映射到所述生产状态拓扑在当前时段和在下一时段对应的设备状态列表中得到第一状态相关性基值以及第二状态相关性基值;

  根据所述第一状态相关性基值以及所述第二状态相关性基值计算每个工业设备在当前时段内和下一时段之间的间接相关性系数。

  B5.根据B3所述的数据处理系统,所述人工智能服务器,用于:

  获取基于数组相似度所提取到的所述生产状态拓扑在下一时段内的特征数据的第一数据分布图以及在当前时段内的特征数据的第二数据分布图,将所述第一数据分布图和所述第二数据分布图按照相同的划分密度进行划分,得到所述第一数据分布图对应的多个第一子图以及所述第二数据分布图对应的多个第二子图;

  确定相同位置上的第一子图和第二子图之间的欧式距离,针对所述欧式距离中的当前欧式距离,基于当前欧式距离在当前时段内的第一置信度以及当前欧式距离在所述下一时段内的第二置信度,确定当前欧式距离在所述当前时段和所述下一时段之间的置信度差值;

  将置信度差值小于设定值对应的第一子图的第一目标数据以及第二子图的第二目标数据确定为差异数据;

  基于小于设定值的第一子图在所述第一数据分布图的图像位置从所述生产状态拓扑中确定出对应的目标节点,并将所述目标节点对应的工业设备确定为目标工业设备。

  B6.根据B1所述的数据处理系统,所述人工智能服务器,用于:

  确定每个状态优先级对应的工业设备的待识别的设备标签信息,对所述设备标签信息进行标签维度信息提取,获得包括标签维度分布及所述标签维度分布对应的分布配置信息的第一信息集合;

  基于所述第一信息集合进行所述工业设备的设备标签信息的相关性分析,对满足设定相关性条件的目标设备标签信息进行增益权重计算,以获取所述目标设备标签信息对应的工业设备的状态增益权重及标签聚类权重;

  在所述状态增益权重处于预设权重区间内的情况下,确定处于所述预设权重区间内的状态增益权重对应的工业设备为局部中心节点,并基于所述局部中心节点对应的目标设备标签信息确定所述局部中心节点的节点连线列表;根据确定出的多个局部中心节点以及多个局部中心节点的节点连线列表构建所述生产状态拓扑;

  根据每个局部中心节点对应的节点连线列表从每个局部中心节点对应的状态记录清单中提取所述生产状态拓扑在当前时段内的特征数据。

  B7.根据B1所述的数据处理系统,所述人工智能服务器,用于:

  按照所述设定步长将所述第一工作状态数据划分为多个数据区间,确定相邻两个数据区间之间的数据关联度和数据缺损系数;基于确定出的所述数据关联度和所述数据缺损系数判断所述第一工作状态数据是否存在权限类别标识和系统类别标识;

  若确定出所述第一工作状态数据存在所述权限类别标识和所述系统类别标识,则依据所述第一工作状态数据在所述权限类别标识下的数据区间,以及所述数值区间的区间描述信息,计算所述第一工作状态数据在所述系统类别标识下的各数据区间与所述第一工作状态数据在所属权限类别标识下的各数据区间之间的区间传递系数;

  将所述第一工作状态数据在所述系统类别标识下的与在所述权限类别标识下的数据区间之间的区间传递系数大于设定系数的数据区间划分到所述权限类别标识下,基于所述权限类别标识下的数据区间对应的权限数据字段确定所述第一工作状态数据在当前时段内的状态传递数据。

  B8.根据B7所述的数据处理系统,所述人工智能服务器,用于:

  获取根据所述状态传递数据对应的权限数据字段集所确定出的第二工作状态数据的受控指标信息;

  对于所述第二工作状态数据的受控指标信息中的当前第二工作状态数据的受控指标信息,根据当前第二工作状态数据的受控指标信息在当前时段内的第一控制响应信息,以及各所述第二工作状态数据的受控指标信息在所述当前时段内的第二控制响应信息,计算当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数;

  基于当前第二工作状态数据的受控指标信息在所述当前时段内的受控系数以及当前第二工作状态数据与所述权限数据字段集之间的匹配度确定当前第二工作状态数据在当前时段内的状态优先级。

  在上述基础上,请结合参阅图3,还提供了一种人工智能服务器200,包括:处理器210,以及与处理器210连接的内存220和网络接口230。所述网络接口220与所述人工智能服务器200中的非易失性存储器240连接。所述处理器210在运行时通过所述网络接口230从所述非易失性存储器240中调取计算机程序,并通过所述内存220运行所述计算机程序,以执行上述的方法。

  同样地,还提供一种计算机可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在人工智能服务器200的内存220中运行时实现上述的方法。

《基于大数据和边缘计算的数据处理方法及人工智能服务器.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)