欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 数据处理方法、装置及计算机可读存储介质独创技术43172字

数据处理方法、装置及计算机可读存储介质

2021-04-24 03:37:17

数据处理方法、装置及计算机可读存储介质

  技术领域

  本发明涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及计算机可读存储介质。

  背景技术

  随着社会的快速发展,终端电子设备规模越来越大,终端电子设备的特征识别也越来越受到各个领域的重视。终端电子设备有各种唯一标识,如基于蓝牙以及WiFi的媒体接入控制的MAC地址等。MAC地址等唯一标识在满足自身功能需求的同时,还能够通过对唯一标识的所蕴含的各种信息来进行数据分析判决。例如,MAC地址的编码信息中包含设备厂家信息等,在不涉及到侵犯用户隐私的情况下,通过对这些信息的分析,可以给大数据分析中提供多维数据分析,如智慧城市、公共安全等领域的人口密集度分析、人口流动性的分析,公共卫生事件发生时的信息碰撞等。

  由于MAC地址易采集,许多电子设备为避免使用采集到的MAC地址而导致用户的个人信息被滥用,在设备工作时,采用随机MAC地址进行接入交互,随机MAC地址通过在隔次建立连接以及一定时间段进行随机变化,以有效的保证个人信息的安全。但是,采用随机MAC地址的设备使得非涉及到个人信息的数据(例如设备的厂家信息)等也无法获取。

  上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。

  发明内容

  本发明的主要目的在于提供一种数据处理方法、装置及计算机可读存储介质,旨在解决无法获取采用随机MAC地址的终端设备的厂家信息的技术问题。

  为实现上述目的,本发明提供一种数据处理方法,所述数据处理方法包括以下步骤:

  获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;

  基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;

  基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;

  基于所述预测结果确定所述预测MAC数据对应的厂家信息。

  进一步地,所述获取所述MAC数据中终端发送的目标MAC数据的步骤包括:

  确定各组MAC数据对应的源MAC地址以及目的MAC地址;

  基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据。

  进一步地,所述基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据的步骤包括:

  绘制由MAC数据对应的源MAC地址指向以及对应的目的MAC地址有向图,其中,所述有向图的节点包括源MAC地址以及目的MAC地址;

  基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点;

  将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据。

  进一步地,所述基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点的步骤包括:

  确定所述有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数;

  确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点。

  进一步地,所述确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点的步骤包括:

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并获取各个第二节点作为终点的第二次数;

  确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,其中,所述第二预设次数小于第一预设次数。

  进一步地,所述基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据的步骤包括:

  分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据;

  将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据。

  进一步地,所述训练MAC数据包括特征数据以及真实数据,所述真实数据包括源MAC地址,所述特征数据包括数据获取标准时间、传输通道、带宽传输速率、接收信号功率强度、信号模式以及数据传输方向中的至少两种;所述基于所述训练MAC数据确定目标训练模型的步骤包括:

  将所述训练MAC数据输入预设训练模型进行模型训练,以获得训练结果;

  基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型。

  进一步地,所述基于所述预测结果确定所述预测MAC数据对应的厂家信息的步骤包括:

  统计预测MAC地址中的各个MAC地址的数量,并基于各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,并将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,其中,所述预测结果包括所述预测MAC数据对应的预测MAC地址;或者,

  确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,其中,所述预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,所述预设MAC地址包括多个。

  此外,为实现上述目的,本发明还提供一种数据处理装置,所述数据处理装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现前述的数据处理方法的步骤。

  此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现前述的数据处理方法的步骤。

  本发明通过获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;接着基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;而后基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;然后基于所述预测结果确定所述预测MAC数据对应的厂家信息,通过根据MAC数据中真实厂家信息的训练MAC数据对随机MAC地址(预测MAC数据)进行预测,进而准确预测采用随机MAC地址的终端设备的厂家信息。

  附图说明

  图1是本发明实施例方案涉及的硬件运行环境中数据处理装置的结构示意图;

  图2为本发明数据处理方法第一实施例的流程示意图;

  图3为本发明数据处理方法一实施例中的有向图示意图。

  本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

  具体实施方式

  应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

  如图1所示,图1是本发明实施例方案涉及的硬件运行环境中数据处理装置的结构示意图。

  本发明实施例数据处理装置可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。

  如图1所示,该数据处理装置可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

  可选地,数据处理装置还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,数据处理装置还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

  本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

  如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序。

  在图1所示的数据处理装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行MAC数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行MAC数据通信;而处理器1001可以用于调用存储器1005中存储的数据处理程序。

  在本实施例中,数据处理装置包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的数据处理程序,其中,处理器1001调用存储器1005中存储的数据处理程序时,并执行以下操作:

  获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;

  基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;

  基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;

  基于所述预测结果确定所述预测MAC数据对应的厂家信息。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  确定各组MAC数据对应的源MAC地址以及目的MAC地址;

  基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  绘制由MAC数据对应的源MAC地址指向以及对应的目的MAC地址有向图,其中,所述有向图的节点包括源MAC地址以及目的MAC地址;

  基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点;

  将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  确定所述有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数;

  确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并获取各个第二节点作为终点的第二次数;

  确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,其中,所述第二预设次数小于第一预设次数。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据;

  将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  将所述训练MAC数据输入预设训练模型进行模型训练,以获得训练结果;

  基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型。

  进一步地,处理器1001可以调用存储器1005中存储的数据处理程序,还执行以下操作:

  统计预测MAC地址中的各个MAC地址的数量,并基于各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,并将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,其中,所述预测结果包括所述预测MAC数据对应的预测MAC地址;或者,

  确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,其中,所述预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,所述预设MAC地址包括多个。

  本发明还提供一种数据处理方法,参照图2,图2为本发明数据处理方法第一实施例的流程示意图。

  本实施例的数据处理方法旨在获取MAC数据中蕴含的厂家信息。

  通过硬件采集到的MAC数据主要包括基于现有无线局域网标准IEEE802.11的系列帧格式的数据,具体包括数据获取标准时间、源地址、目标地址、传输通道、带宽传输速率、接收信号功率强度、信号模式、数据传输方向等信息。MAC数据在时间维度上、空间维度会形成特定的特征,例如交互间隔时间在短时间内产生的频率特性(毫秒级)可以表征设备自身的特征,长时间内的频率特性(秒级)可以表征设备使用人员的操作特性。一般情况下,这些特性可以采用大数据分析的方法,以一种监督学习的办法进行识别,用于提取厂家信息。鉴于在实际过程中的以IEEE802.11协议为基础的交互信息(MAC数据)是由无线接入点AP设备以及终端设备共同产生的,两者都会影响各种交互特征,因此,需要剔除MAC数据中AP发送的数据。

  本实施例中,该数据处理方法包括以下步骤:

  步骤S101,获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;

  本实施例中,可以利用专用硬件设备获取预设空间中IEEE802.11的系列帧格式的数据,该预设空间为该专用硬件设备当前所处的空间(专用硬件设备所在位置对应的空间,该空间指无线信号到达专用硬件设备处最小功率大于专用硬件设备的接收灵敏度),使用被动式无干扰获取IEEE802.11信号的各种信息,进而通过专用硬件设备获取预设空间中传输的无线局域网标准对应的多组MAC数据。MAC数据包括源地址(源MAC地址)、目标地址(目的MAC地址)以及其他数据,其他数据包括数据获取标准时间、传输通道、带宽传输速率、接收信号功率强度、信号模式、数据传输方向中的至少两种。

  接着,获取MAC数据中终端发送的目标MAC数据,由于MAC数据包括无线接入点发送的数据以及终端发送的数据,而本实施例中用于确定MAC数据所对应的终端的厂家信息,因此,剔除MAC数据中无线接入点发送的数据,而获得MAC数据中终端发送的目标MAC数据。具体地,根据各组MAC数据中的源地址以及目标地址从MAC数据中获取终端发送的目标MAC数据。

  步骤S102,基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;

  本实施例中,在获取到目标MAC数据时,获取预设真实厂家信息,例如获取厂家信息对照表,通过厂家信息对照表获得预设真实厂家信息,并基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据,具体地,依次将各组目标MAC数据与预设真实厂家信息进行匹配,若当前匹配的目标MAC数据与预设真实厂家信息匹配成功,则将当前匹配的目标MAC数据添加至训练MAC数据,否则将当前匹配的目标MAC数据添加至预测MAC数据,其中,若能够在预设真实厂家信息查询到当前匹配的目标MAC数据对应的厂家信息,则确定当前匹配的目标MAC数据与预设真实厂家信息匹配成功。

  步骤S103,基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;

  在本实施例中,在获取到训练MAC数据以及预测MAC数据之后,先基于训练MAC数据确定目标训练模型,具体地,先获取预设训练模型,并将训练MAC数据输入预设训练模型进行模型训练,根据训练结果,确定目标训练模型。

  而后,将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测MAC数据对应的预测结果。

  步骤S104,基于所述预测结果确定所述预测MAC数据对应的厂家信息。

  在本实施例中,在获取到预测MAC数据对应的预测结果时,基于所述预测结果确定所述预测MAC数据对应的厂家信息。

  例如,预测结果为各组预测MAC数据对应的预测MAC地址,则统计各个预测MAC地址的数量(出现次数),并根据各个预测MAC地址的数量确定预测MAC地址中数量最大的MAC地址,根据该数量最大的MAC地址确定预测MAC数据对应的厂家信息;或者,预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,确定各个概率中大于预设概率的目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息。

  本实施例,通过采用大数据分析中分类的算法对采集到的MAC以及相关信息进行关联分析进而以MAC为输出目标进行分类。首先,利用可以识别到厂家信息的MAC以及相关信息(训练MAC数据)进行训练,训练出有效的分类模型(目标训练模型)。再将那些不可以直接获取的厂家信息的MAC地址(预测MAC数据),使用训练好的模型进行学习分类得出其属于某个MAC所代表的类,即认为该MAC的厂家信息与已有MAC的厂家信息一致。

  本实施例提出的数据处理方法,通过获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;接着基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;而后基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;然后基于所述预测结果确定所述预测MAC数据对应的厂家信息,通过根据MAC数据中真实厂家信息的训练MAC数据对随机MAC地址(预测MAC数据)进行预测,进而准确预测采用随机MAC地址的终端设备的厂家信息。

  基于第一实施例,提出本发明数据处理方法的第二实施例,在本实施例中,步骤S101包括:

  步骤S201,确定各组MAC数据对应的源MAC地址以及目的MAC地址;

  步骤S202,基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据。

  本实施例中,在获取到各组MAC数据时,确定各组MAC数据对应的源MAC地址以及目的MAC地址,具体地,获取各组MAC数据中的源地址(源MAC地址)以及目标地址(目的MAC地址)。

  接着,基于源MAC地址以及目的MAC地址,确定目标MAC数据,由于MAC数据包括无线接入点发送的数据以及终端发送的数据,而本实施例中用于确定MAC数据所对应的终端的厂家信息,因此,剔除MAC数据中无线接入点发送的数据,而获得MAC数据中终端发送的目标MAC数据。

  本实施例提出的数据处理方法,通过确定各组MAC数据对应的源MAC地址以及目的MAC地址;接着基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据,能够根据源MAC地址以及目的MAC地址准确得到MAC数据中的目标MAC数据,进而提高预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于第二实施例,提出本发明数据处理方法的第三实施例,在本实施例中,步骤S101包括:

  步骤S301,绘制由MAC数据对应的源MAC地址指向以及对应的目的MAC地址有向图,其中,所述有向图的节点包括源MAC地址以及目的MAC地址;

  步骤S302,基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;

  步骤S303,确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点;

  步骤S304,将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据。

  需要说明的是,由于无线接入点可以同时发送多个MAC数据至不同的终端,或者接收多个不同的终端发送的MAC数据,MAC数据中较多同一目的MAC地址的数据大概率为无线接入点所需要接收的数据,因此,本实施例可通过有向图统计各个MAC地址作为终点(接收端)的数量,确定无线接入点。

  本实施例中,在获取到MAC数据对应的源MAC地址以及目的MAC地址时,绘制由MAC数据对应的源MAC地址指向以及对应的目的MAC地址有向图,其中,有向图的节点包括源MAC地址以及目的MAC地址。

  具体地,由于源MAC地址以及目的MAC地址的数据长度较长,采用MAC地址绘图时导致有向图中各个节点较大而不方便查看,因此,可将各个MAC数据对应的源MAC地址以及目的MAC地址进行编号,进而在绘制有向图时,有向图中的各个节点均显示为源MAC地址的编号以及目的MAC地址的编号,参照图3,图3中的LR1、LR2……LR504均为源MAC地址的编号或者目的MAC地址的编号,节点之间由源MAC地址对应的节点指向目的MAC地址对应的节点,节点之间的数字为节点之间传输的MAC数据的数量。

  接着,基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;具体地,可先统计第一节点作为终点的第一次数,其中,第一次数为有向图的各个节点中作为起点与第一节点连接的节点的个数,例如,对于第一节点中的某一目标节点,作为起点与该目标节点连接的节点的个数即为该目标节点对应的第一次数,而后根据第一次数确定无线接入点。

  而后,确定所述有向图中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点,并将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据。

  本实施例提出的数据处理方法,通过绘制由MAC数据对应的源MAC地址指向对应的目的MAC地址有向图,其中,所述有向图的节点包括源MAC地址以及目的MAC地址;接着基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;而后确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点;最后将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据,能够根据有向图准确得到MAC数据中的目标MAC数据,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于第三实施例,提出本发明数据处理方法的第四实施例,在本实施例中,步骤S302包括:

  步骤S401,确定所述有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数;

  步骤S402,确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点。

  本实施例中,在完成有向图的绘制后,确定有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数,其中,第一次数为有向图的各个节点中作为起点与第一节点连接的节点的个数,例如,对于第一节点中的某一目标节点,作为起点与该目标节点连接的节点的个数即为该目标节点对应的第一次数,而后根据第一次数确定无线接入点。

  接着,确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点,具体地,将各个第一次数与第一预设次数进行对比,确定第一次数中大于第一预设次数的第一目标次数,将第一节点中该第一目标次数对应的节点作为第一目标节点。

  其中,第一预设次数可进行合理设置,例如,将该第一预设次设置为5、6、8等。

  本实施例提出的数据处理方法,通过确定所述有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数;接着确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点,实现了根据各个第一节点的第一次数以及第一预设次数准确得到无线接入点,进而便于后续准确根据无线接入点确定有向图中的终端节点,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于第三实施例,提出本发明数据处理方法的第五实施例,在本实施例中,步骤S303包括:

  步骤S501,确定所述有向图中各个节点中作为起点与所述无线接入点连接的第二节点,并获取各个第二节点作为终点的第二次数;

  步骤S503,确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,其中,所述第二预设次数小于第一预设次数。

  本实施例中,确定确定所述有向图中各个节点中作为起点与所述无线接入点连接的第二节点,而后获取各个第二节点作为终点的第二次数,其中,第二次数为有向图的各个节点中作为起点与第二节点连接的节点的个数,例如,对于第二节点中的某一特定节点,作为起点与该特定节点连接的节点的个数即为该特定节点对应的第一次数。

  接着,确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,具体地,将各个第二次数与第二预设次数进行对比,确定第二次数中小于第二预设次数的第二目标次数,将第二节点中该第二目标次数对应的节点作为第二目标节点。

  其中,第二预设次数小于第一预设次数,第二预设次数可根据第一预设次数进行合理设置,例如,第二预设次数可以为第一预设次数减2、3等,在第一预设次设置为5、6、8等,该第二预设次数可以为2、3、4、5等。

  本实施例提出的数据处理方法,通过确定所述有向图中各个节点中作为起点与所述无线接入点连接的第二节点,并获取各个第二节点作为终点的第二次数;接着确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,能够根据第二节点的第二次数以及第二预设次数准确得到终端节点,进而准确得到目标MAC数据,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于第一实施例,提出本发明数据处理方法的第六实施例,在本实施例中,步骤S102包括:

  步骤S601,分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据;

  步骤S602,将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据。

  本实施例中,在获取到目标MAC数据时,获取预设真实厂家信息,例如获取厂家信息对照表,通过厂家信息对照表获得预设真实厂家信息,而后分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据,具体地,依次将各组目标MAC数据与预设真实厂家信息进行匹配,若当前匹配的目标MAC数据与预设真实厂家信息匹配成功,则将当前匹配的目标MAC数据添加至训练MAC数据,其中,若能够在预设真实厂家信息查询到当前匹配的目标MAC数据对应的厂家信息,则确定当前匹配的目标MAC数据与预设真实厂家信息匹配成功。

  接着,将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据。

  本实施例提出的数据处理方法,通过分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据;通过将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据,能够根据预设真实厂家信息准确得到训练MAC数据以及预测MAC数据,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于第一实施例,提出本发明数据处理方法的第七实施例,在本实施例中,训练MAC数据包括特征数据以及真实数据,所述真实数据包括源MAC地址,所述特征数据包括数据获取标准时间、传输通道、带宽传输速率、接收信号功率强度、信号模式以及数据传输方向中的至少两种,步骤S103包括:

  步骤S701,将所述训练MAC数据输入预设训练模型进行模型训练,以获得训练结果;

  步骤S702,基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型。

  本实施例中,在获取到训练MAC数据后,将训练MAC数据输入预设训练模型进行模型训练,以获得各组训练MAC数据对应的训练结果;具体地,先确定各组训练MAC数据的特征数据以及真实数据,而后将训练MAC数据输入预设训练模型进行模型训练,具体地,为了保证训练数据的平衡性,可将训练MAC数据进行分组,得到数量相同的训练数据集,每个训练数据集中MAC数据的数量大于预设数量,该预设数量可以为100等,分别将各个训练数据集输入预设训练模型进行模型训练,得到各个训练数据集中各组MAC数据对应的预测结果,将各个训练数据集对应的预测结果作为该训练结果。其中,训练结果为各组MAC数据对应的预测源MAC地址。

  接着,基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型,例如,统计各组训练MAC数据的训练结果与对应的真实数据一致的第一数量,并将该第一数量除以训练MAC数据的数量得到损失值,若该损失值大于第一预设损失值,则将训练后的预设训练模型作为目标训练模型,或者,统计各组训练MAC数据的训练结果与对应的真实数据不一致的第二数量,并将该第二数量除以训练MAC数据的数量得到损失值,若该损失值小于第二预设损失值,则将训练后的预设训练模型作为目标训练模型。其中,第一预设损失值以及第二预设损失值,可进行合理设置,例如,第一预设损失值为60%、70%、80%等,第一预设损失值为20%、30%、40%等。

  需要说明的是,该预设训练模型可以为决策树模型、随机森林模型、朴素bayes模型、KNN模型等。

  本实施例提出的数据处理方法,通过将所述训练MAC数据输入预设训练模型进行模型训练,以获得训练结果;接着基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型,实现了根据训练MAC数据准确得到目标训练模型,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  基于上述各个实施例,提出本发明数据处理方法的第八实施例,在本实施例中,步骤S104包括:

  步骤S801,统计预测MAC地址中的各个MAC地址的数量,并基于各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,并将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,其中,所述预测结果包括所述预测MAC数据对应的预测MAC地址;或者,

  步骤S802,确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,其中,所述预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,所述预设MAC地址包括多个。

  本实施例中,在获取到预测结果时,统计所述预测MAC地址中的各个MAC地址的数量,而后根据各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,而后将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,以实现对预测MAC数据的厂家信息进行预测。其中,预测结果包括所述预测MAC数据对应的预测MAC地址。

  或者,将各组预测MAC数据对应的各个概率与预设概率进行比较,确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,即预测MAC数据对应的各个概率中包括目标概率的的预测MAC数据为目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,其中,预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,预设MAC地址包括多个MAC地址,该预设MAC地址可以为预设真实厂家信息所对应的MAC地址,预设概率可以进行合理设置,例如预设概率可设置为50%、60%等。

  本实施例提出的数据处理方法,通过统计预测MAC地址中的各个MAC地址的数量,并基于各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,并将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,或者,确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,能够准确得到预测MAC数据对应的厂家信息,进一步提高了预测采用随机MAC地址的终端设备的厂家信息的准确性。

  此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如下操作:

  获取预设空间中传输的无线局域网标准对应的多组MAC数据,并获取所述MAC数据中终端发送的目标MAC数据;

  基于预设真实厂家信息,获取目标MAC数据中的训练MAC数据以及预测MAC数据;

  基于所述训练MAC数据确定目标训练模型,并将所述预测MAC数据输入预设训练模型进行模型训练,以获得预测结果;

  基于所述预测结果确定所述预测MAC数据对应的厂家信息。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  确定各组MAC数据对应的源MAC地址以及目的MAC地址;

  基于所述源MAC地址以及目的MAC地址,确定所述目标MAC数据。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  绘制由MAC数据对应的源MAC地址指向以及对应的目的MAC地址有向图,其中,所述有向图的节点包括源MAC地址以及目的MAC地址;

  基于所述有向图的各个节点中作为终点的第一节点,确定无线接入点;

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并在所述第二节点中确定终端节点;

  将所述MAC数据中的源MAC地址为所述终端节点的数据作为所述目标MAC数据。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  确定所述有向图的各个节点中作为终点的第一节点,并获取各个第一节点作为终点的第一次数;

  确定各个第一节点中第一次数大于第一预设次数的第一目标节点,并将所述第一目标节点作为所述无线接入点。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  确定所述有向图中各个节点中与所述无线接入点连接的第二节点,并获取各个第二节点作为终点的第二次数;

  确定各个第二节点中第二次数小于第二预设次数的第二目标节点,并将所述第二目标节点作为所述终端节点,其中,所述第二预设次数小于第一预设次数。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  分别将各组目标MAC数据的源MAC地址与预设真实厂家信息进行匹配,将各组目标MAC数据中源MAC地址与预设真实厂家信息匹配的数据作为所述训练MAC数据;

  将目标MAC数据除所述训练MAC数据之外的其他数据作为所述预测MAC数据。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  将所述训练MAC数据输入预设训练模型进行模型训练,以获得训练结果;

  基于各组训练MAC数据对应的训练结果以及真实数据,确定损失值,并基于所述损失值以及所述预设训练模型,确定所述目标训练模型。

  进一步地,所述数据处理程序被处理器执行时还实现如下操作:

  统计预测MAC地址中的各个MAC地址的数量,并基于各个MAC地址的数量,确定预测MAC地址中数量最大的MAC地址对应的目标厂家信息,并将所述目标厂家信息作为所述预测MAC数据对应的厂家信息,其中,所述预测结果包括所述预测MAC数据对应的预测MAC地址;或者,

  确定各个概率中大于预设概率的目标概率,获取各个目标概率对应的目标预设MAC地址以及目标预测MAC数据,并将目标预设MAC地址对应的厂家信息作为对应的目标预测MAC数据的厂家信息,其中,所述预测结果包括各组预测MAC数据的真实MAC地址为预设MAC地址的概率,所述预设MAC地址包括多个。

  需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

  上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

  通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

  以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

《数据处理方法、装置及计算机可读存储介质.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)