欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 音频传输方法和装置独创技术25671字

音频传输方法和装置

2021-02-12 16:18:06

音频传输方法和装置

  技术领域

  本发明涉及数据传输领域,具体而言,涉及一种音频传输方法和装置。

  背景技术

  在现有技术中,在录音之后,通常需要对录音文件进行传输。为了保证文件的传输安全性,现有技术中可以对录音文件进行加密,加密后进行传输。

  而现有技术中,在对文件进行加密传输的过程中,需要在录音结束之后,才能够对录音文件进行加密,然后传输加密后的录音文件,造成文件传输的效率低。

  针对上述的问题,目前尚未提出有效的解决方案。

  发明内容

  本发明实施例提供了一种音频传输方法和装置,以至少解决音频传输效率低的技术问题。

  根据本发明实施例的一个方面,提供了一种音频传输方法,包括:在开启录音设备之后,在所述录音设备录制音频的过程中,实时获取所述录音设备录制的所述音频;在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;将所述第一音频文件发送给接收方。

  根据本发明实施例的另一方面,还提供了一种音频传输装置,包括:获取单元,用于在开启录音设备之后,在所述录音设备录制音频的过程中,实时获取所述录音设备录制的所述音频;第一确定单元,用于在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;处理单元,用于在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;发送单元,用于将所述第一音频文件发送给接收方。

  作为一种可选的实施方式,所述处理单元包括:第一获取模块,用于获取所述原始音频文件的波形图;检测模块,用于检测所述波形图中每一帧音频文件的振幅的最高点;第二确定模块,用于在连续预定数量个音频文件帧中,每一个所述音频文件帧的所述振幅的最高点均小于预定阈值的情况下,将所述预定数量个所述音频文件帧确定为所述噪声数据;删除模块,用于删除所述噪声数据;加密模块,用于对删除所述噪声数据后的所述原始音频文件执行加密操作,得到所述第一音频文件。

  作为一种可选的实施方式,所述处理单元还包括:第二获取模块,用于在对删除所述噪声数据后的所述原始音频文件执行所述加密操作,得到所述第一音频文件之前,获取删除所述噪声数据后的所述原始音频文件的第一时长;第三获取模块,用于在所述第一时长小于目标时长的情况下,获取所述第一时长与所述目标时长的差值;第四获取模块,用于获取文件时长与所述差值相同的填充文件,其中,所述填充文件的文件数据为预设数据;拼接单元,用于将所述填充文件拼接到删除所述噪声数据后的所述原始音频文件的末尾。

  作为一种可选的实施方式,所述加密模块包括:获取子模块,用于获取删除所述噪声数据后的所述原始音频文件的可执行文件;第一处理子模块,用于对所述可执行文件中的每一位数据执行按位取反操作,得到所述第一音频文件;或者第二处理子模块,用于在所述可执行文件中确定出多个目标位,对每一个所述目标位的数值执行取反操作,得到所述第一音频文件。

  在本发明实施例中,采用了在开启录音设备之后,在所述录音设备录制音频的过程中,实时获取所述录音设备录制的所述音频;在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;将所述第一音频文件发送给接收方的方法,由于在上述方法中,在进行音频的传输过程中,可以在录制音频的过程中,获取录制的预定时长的音频,并对音频进行处理后传输,从而实现了一边录制音频一边传输音频的效率,提高了音频传输的效率,进而解决了音频传输效率低的技术问题。

  附图说明

  此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

  图1是根据本发明实施例的一种可选的音频传输方法的流程示意图;

  图2是根据本发明实施例的一种可选的音频传输方法的示意图;

  图3是根据本发明实施例的一种可选的音频传输装置的结构示意图。

  具体实施方式

  为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

  需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

  根据本发明实施例的一个方面,提供了一种音频传输方法,可选地,作为一种可选的实施方式,如图1所示,上述音频传输方法包括:

  S102,在开启录音设备之后,在所述录音设备录制音频的过程中,实时获取所述录音设备录制的所述音频;

  S104,在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;

  S106,在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;

  S108,将所述第一音频文件发送给接收方。

  可选地,上述音频传输方法可以但不限于应用于可以计算数据的终端上,例如手机、平板电脑、笔记本电脑、PC机等终端上,或者应用在智能设备上,如智能工牌,智能录音设备等设备上。终端或者智能设备可以通过网络与服务器进行交互,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。

  可选地,上述音频传输方法可以但不限于应用于音频加密传输的领域。以音频加密传输为例,本方案在开启录音设备之后,录音设备开始录制音频,在录制音频的过程中,实时获取录音设备录制的音频。在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;将所述第一音频文件发送给接收方。

  通过上述方法,实现了在传输音频的过程中,可以边录制边传输,在保证了音频传输的安全性的同时,实现了提高音频传输效率的效果。

  可选地,本方案中的录音设备可以为位于固定位置的录音设备,或者为工作人员佩戴的录音设备。录音设备可以自动或者手动开启与关闭,开启录音设备后,录音设备开始录音,关闭录音设备后,录音设备结束录音。

  可选地,本方案中在录制音频的过程中,可以在录音设备每录制预定时长的情况下,将预定时长的音频确定为一个原始音频文件。例如,录音设备每录制10分钟的音频,将该10分钟之内录制的音频保存为一个原始音频文件。在此情况下,可以实现边录制音频,边保存原始音频文件。

  可选地,在录制音频的过程中,若是在所述录音设备录制的所述音频未达到所述预定时长的情况下,就接收到了停止指令,则将未达到所述预定时长的所述音频确定为所述原始音频文件,其中,所述停止指令用于关闭所述录音设备。也就是说,如果录制的音频还没有达到预定时长,录音设备就被关闭,则将还没有达到预定时长的音频确定为一个原始音频文件。

  可选地,音频时长未达到预定时长的情况可能会是开启录音设备之后,还未达到预定时长的情况下关闭录音设备,或者是在录制了多个原始音频文件之后(每预定时长的音频保存为一个原始音频文件),继续录制的音频未达到预定时长时,关闭录音设备,则继续录制的音频保存为一个原始音频文件。例如,预定时长为10分钟,则未达到10分钟时,录音设备被关闭,将未达到10分钟的音频确定为一个原始音频文件。若是录音设备录制了25分钟音频,则得到两个10分钟的原始音频文件与一个5分钟的原始音频文件。

  可选地,在获取到原始音频文件之后,可以去除原始音频文件中的噪声数据。可选地,本方案中的噪声数据包括了原始音频文件中的静音片段。也就是说,在录音设备录制过程中,可能会存在长时间没有声音产生的情况。如没有人说话。此时,会产生较长的静音片段。需要将静音片段删除。

  具体手段可以为获取所述原始音频文件的波形图;检测所述波形图中每一帧音频文件的振幅的最高点;在连续预定数量个音频文件帧中,每一个所述音频文件帧的所述振幅的最高点均小于预定阈值的情况下,将所述预定数量个所述音频文件帧确定为所述噪声数据;删除所述噪声数据;对删除所述噪声数据后的所述原始音频文件执行加密操作,得到所述第一音频文件。

  可选地,可以将录音设备录制的音频转换为数值,将数值转换为波形图。

  例如如图2所示,图2为一种可选的原始音频文件的波形图,其中包含了5帧的音频。前三帧的音频的振幅的最高点都小于了预定阈值202,第4帧开始,音频的振幅最高点超过了预定阈值202。例如预定数量为3,则将前三个音频真确定为噪声数据。若是预定数量为4,则前三个音频真不会被作为噪声数据,因为虽然振幅最高点都小于预定阈值202,但是仅有三个帧相连,没有达到预定数量。

  可选地,在删除原始音频文件的噪声数据之后,每一个删除了噪声数据的原始音频文件的文件时长可能不同。此时,可以将每一个删除了噪声数据的原始音频文件的文件时长调整到相同的时长。

  如,删除了噪声数据的原始音频文件的文件时长为三分钟,可以调整到十分钟,调整的手段可以为在删除了噪声数据的原始音频文件的文件末尾拼接填充文件,填充文件中的数据为预设数据,长度可以随意调整。填充文件在加密过程中的加密效率比噪声数据的加密效率高。

  在得到填充后的原始音频文件之后,对填充后的原始音频文件进行加密。加密过程中,可以获取填充后的原始音频文件的可执行文件,可执行文件中存储的每一位数据为0或者1,在加密时,将可执行文件中的每一位数据执行取反操作,即0换为1,1换为0,或者,对可执行文件中的多个目标位的数据执行取反操作,目标为可以随机确定或者每隔多个数据位取一次。在加密得到第一音频文件后,传输第一音频文件。在传输第一音频文件时,若是录音设备未被关闭,则录音设备一直处于录制音频的状态,本方案实现了音频边录制边传输的效果。

  以下结合一个具体示例进行说明。

  在线下门店中,工作人员佩戴有智能工牌,智能工牌带有录音设备,工作人员开启录音设备后,录音设备开始录制音频。录音设备录制的音频达到10分钟时,将该10分钟的音频保存为一个原始音频文件,此时,录音设备一边继续录音,一边处理10分钟的原始音频文件。首先,获取原始音频文件的波形图。可以将原始音频文件的音频数据转换为数值,并将该数值转换为波形图,波形图的横坐标为时间,纵坐标为声音强度。若是连续多个如连续10个以上的音频帧的声音强度都低于了预定阈值,则说明此时间段,可能并没有人说话,因此没有声音,需要将该时间段的数据作为噪声数据进行删除。在删除后,剩余的音频帧为工作人员或者顾客说话时的音频帧。在执行上述删除动作后,原始音频文件的时长可能发生变化,如10分钟的音频被删除到8分钟。此时,为了后续加密过程操作不复杂,可以对8分钟的原始音频文件进行补充,在后面拼接2分钟的填充文件,填充文件中的数据可以为预设的,填充文件加密效率高。在拼接填充文件得到10分钟的原始音频文件之后,将10分钟的原始音频文件的可执行文件的每一位按位取反,如0换为1,1换为0,取反后,得到加密的第一音频文件。传输第一音频文件到服务器进行保存。

  需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

  根据本发明实施例的另一个方面,还提供了一种用于实施上述音频传输方法的音频传输装置。如图3所示,该装置包括:

  (1)获取单元302,用于在开启录音设备之后,在所述录音设备录制音频的过程中,实时获取所述录音设备录制的所述音频;

  (2)第一确定单元304,用于在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;

  (3)处理单元306,用于在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;

  (4)发送单元308,用于将所述第一音频文件发送给接收方。

  可选地,上述音频传输装置可以但不限于应用于音频加密传输的领域。以音频加密传输为例,本方案在开启录音设备之后,录音设备开始录制音频,在录制音频的过程中,实时获取录音设备录制的音频。在获取到的所述音频的时长达到预定时长的情况下,将所述预定时长的所述音频确定为原始音频文件;在获取到所述原始音频文件之后,删除所述原始音频文件中的噪声数据,并对所述原始音频文件执行加密操作,得到第一音频文件;将所述第一音频文件发送给接收方。

  通过上述装置,实现了在传输音频的过程中,可以边录制边传输,在保证了音频传输的安全性的同时,实现了提高音频传输效率的效果。

  可选地,本方案中的录音设备可以为位于固定位置的录音设备,或者为工作人员佩戴的录音设备。录音设备可以自动或者手动开启与关闭,开启录音设备后,录音设备开始录音,关闭录音设备后,录音设备结束录音。

  可选地,本方案中在录制音频的过程中,可以在录音设备每录制预定时长的情况下,将预定时长的音频确定为一个原始音频文件。例如,录音设备每录制10分钟的音频,将该10分钟之内录制的音频保存为一个原始音频文件。在此情况下,可以实现边录制音频,边保存原始音频文件。

  可选地,在录制音频的过程中,若是在所述录音设备录制的所述音频未达到所述预定时长的情况下,就接收到了停止指令,则将未达到所述预定时长的所述音频确定为所述原始音频文件,其中,所述停止指令用于关闭所述录音设备。也就是说,如果录制的音频还没有达到预定时长,录音设备就被关闭,则将还没有达到预定时长的音频确定为一个原始音频文件。

  可选地,音频时长未达到预定时长的情况可能会是开启录音设备之后,还未达到预定时长的情况下关闭录音设备,或者是在录制了多个原始音频文件之后(每预定时长的音频保存为一个原始音频文件),继续录制的音频未达到预定时长时,关闭录音设备,则继续录制的音频保存为一个原始音频文件。例如,预定时长为10分钟,则未达到10分钟时,录音设备被关闭,将未达到10分钟的音频确定为一个原始音频文件。若是录音设备录制了25分钟音频,则得到两个10分钟的原始音频文件与一个5分钟的原始音频文件。

  可选地,在获取到原始音频文件之后,可以去除原始音频文件中的噪声数据。可选地,本方案中的噪声数据包括了原始音频文件中的静音片段。也就是说,在录音设备录制过程中,可能会存在长时间没有声音产生的情况。如没有人说话。此时,会产生较长的静音片段。需要将静音片段删除。

  具体手段可以为获取所述原始音频文件的波形图;检测所述波形图中每一帧音频文件的振幅的最高点;在连续预定数量个音频文件帧中,每一个所述音频文件帧的所述振幅的最高点均小于预定阈值的情况下,将所述预定数量个所述音频文件帧确定为所述噪声数据;删除所述噪声数据;对删除所述噪声数据后的所述原始音频文件执行加密操作,得到所述第一音频文件。

  可选地,可以将录音设备录制的音频转换为数值,将数值转换为波形图。

  例如如图2所示,图2为一种可选的原始音频文件的波形图,其中包含了5帧的音频。前三帧的音频的振幅的最高点都小于了预定阈值202,第4帧开始,音频的振幅最高点超过了预定阈值202。例如预定数量为3,则将前三个音频真确定为噪声数据。若是预定数量为4,则前三个音频真不会被作为噪声数据,因为虽然振幅最高点都小于预定阈值202,但是仅有三个帧相连,没有达到预定数量。

  可选地,在删除原始音频文件的噪声数据之后,每一个删除了噪声数据的原始音频文件的文件时长可能不同。此时,可以将每一个删除了噪声数据的原始音频文件的文件时长调整到相同的时长。

  如,删除了噪声数据的原始音频文件的文件时长为三分钟,可以调整到十分钟,调整的手段可以为在删除了噪声数据的原始音频文件的文件末尾拼接填充文件,填充文件中的数据为预设数据,长度可以随意调整。填充文件在加密过程中的加密效率比噪声数据的加密效率高。

  在得到填充后的原始音频文件之后,对填充后的原始音频文件进行加密。加密过程中,可以获取填充后的原始音频文件的可执行文件,可执行文件中存储的每一位数据为0或者1,在加密时,将可执行文件中的每一位数据执行取反操作,即0换为1,1换为0,或者,对可执行文件中的多个目标位的数据执行取反操作,目标为可以随机确定或者每隔多个数据位取一次。在加密得到第一音频文件后,传输第一音频文件。在传输第一音频文件时,若是录音设备未被关闭,则录音设备一直处于录制音频的状态,本方案实现了音频边录制边传输的效果。

  以下结合一个具体示例进行说明。

  在线下门店中,工作人员佩戴有智能工牌,智能工牌带有录音设备,工作人员开启录音设备后,录音设备开始录制音频。录音设备录制的音频达到10分钟时,将该10分钟的音频保存为一个原始音频文件,此时,录音设备一边继续录音,一边处理10分钟的原始音频文件。首先,获取原始音频文件的波形图。可以将原始音频文件的音频数据转换为数值,并将该数值转换为波形图,波形图的横坐标为时间,纵坐标为声音强度。若是连续多个如连续10个以上的音频帧的声音强度都低于了预定阈值,则说明此时间段,可能并没有人说话,因此没有声音,需要将该时间段的数据作为噪声数据进行删除。在删除后,剩余的音频帧为工作人员或者顾客说话时的音频帧。在执行上述删除动作后,原始音频文件的时长可能发生变化,如10分钟的音频被删除到8分钟。此时,为了后续加密过程操作不复杂,可以对8分钟的原始音频文件进行补充,在后面拼接2分钟的填充文件,填充文件中的数据可以为预设的,填充文件加密效率高。在拼接填充文件得到10分钟的原始音频文件之后,将10分钟的原始音频文件的可执行文件的每一位按位取反,如0换为1,1换为0,取反后,得到加密的第一音频文件。传输第一音频文件到服务器进行保存。

  上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

  在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

  在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

  所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

  另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

  以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

《音频传输方法和装置.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)