欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 一种音频编解码兼容性自动测试方法及系统独创技术24573字

一种音频编解码兼容性自动测试方法及系统

2021-03-14 12:00:35

一种音频编解码兼容性自动测试方法及系统

  技术领域

  本发明涉及音频编解码技术领域,特别是涉及一种音频编解码兼容性自动测试方法及系统。

  背景技术

  在当音视频会议系统中,终端可以通过不同的Audio Codec(音频编解码器,Codec就是编解码器)进入会议。目前Codec广泛应用的有:G.711,G.723,G.726,G.729,而每一种又有很多分支,如G.729就包括G.729A,G.729B和G.729AB,这就造成在会议系统中,音频存在各种各样的编解码,不同的终端包括与其他终端进行P2P通话以及进入会议两种应用场景,针对不同的应用场景,均需要对不同Codec之间的兼容协商测试,以及验证终端设备和会议系统Codec之间的声音是否正常。

  对于两种不同的应用场景,如果是两种终端设备的P2P(point to poin点对点)呼叫,两个终端设备需要选择协商出一个最优的Codec,进行语音通信,协商的规则根据设定的优先级,如图1所示,两个终端设备分别有M种类型Codec和N种类型Codec,全路径覆盖测试需要m*n次,最小路径测试需要m∩n,既m和n的交集个数。如果是终端设备进入会议系统,会议系统一般由IVR(Interactive Voice Response,交互式语音应答或者称为语音大厅)和Conference(会议服务)组成,如图2所示,终端设备进入会议,一般首先会呼叫到IVR,和IVR进行一次Codec协商,根据语音提示,再输入相应的会议号码和会议密码,然后和会议服务再进行一次Codec协商,最终进入会议成功。如果终端设备所支持的Codec类型有M种,服务器的IVR所支持的Codec类型有N种,以及会议服务所支持的Codec有K种,那么该应用场景下全路径覆盖测试需要m*n*k次,最小路径测试需要m∩n∩k,既m、n、k三者的交集个数。

  然而,现有对音视频编解码的兼容性测试均采用人工测试,无论对于哪种应用场景,人工测试的工作量都特别大,而且在实际的测试过程中,不仅为了同种Codec兼容性,而且还需保障在系统有多种的Codec类型的情况下各方能协商上最优的Codec类型,以及在不断测试过程中保证会议系统的稳定性。因此,如果采用全路径覆盖测试方式,手工测试的工作量很大,测试次数成倍增加,效率很低,而且人工测试对测试结果难以判断,准确度低。

  因此,现有技术还有待进一步改进和提升。

  发明内容

  针对上述技术问题,本发明提供了一种音频编解码兼容性自动测试方法及系统,以解决现有采用人工测试音视频兼容性所存在的效率低下、无法保证测试准确性和系统稳定性的技术问题。

  为了解决上述技术问题,本发明第一方面提供了一种音频编解码兼容性自动测试系统,应用于音视频会议系统,所述测试系统包括:语音播放模块和自动控制模块,其中,

  所述语音播放模块用于语音播放文本数据,所述文本数据包括第一原始文本和第二原始文本;

  所述自动控制模块包括控制器、AI语音转写模块和文本比较器,所述控制器用于自动对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行循环遍历修改;

  所述AI语音转写模块用于根据所述控制器对所述终端设备、音视频会议系统的IVR语音大厅和会议服务器所循环遍历修改的音频编解码器类型,获取所述终端设备从所述IVR语音大厅收听的第一语音数据,并将所述第一语音数据转换为第一测试文本;以及获取所述会议服务器从所述终端设备收听的第二语音数据,并将所述第二语音数据转换为第二测试文本;所述第一语音数据为所述第一原始文本对应的语音数据,所述第二语音数据为所述第二原始文本对应的语音数据;

  所述文本比较器用于依次将第一测试文本与第一原始文本进行比较,得出第一比较结果;以及将第二测试文本与第二原始文本进行比较,得出第二比较结果。

  进一步地,所述测试系统还包括判断模块,所述判断模块用于根据所述第一比较结果判断终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器是否兼容,以及根据所述第二比较结果判断所述音视频会议系统是否稳定。

  进一步地,所述第一比较结果和第二比较结果均为0%~100%。

  进一步地,所述测试系统还包括文本输入模块,用于向所述语音播放模块输入文本数据。

  本发明第二方面提供了一种音频编解码兼容性自动测试方法,包括步骤:

  控制器自动对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行修改;

  响应于终端设备向音视频会议系统发起呼叫操作,AI语音转写模块获取所述终端设备从IVR语音大厅收听的第一语音数据,并将所述第一语音数据转换为第一测试文本;所述第一语音数据为第一原始文本对应的语音数据;

  文本比较器将所述第一测试文本与所述第一原始文本进行比较,得出第一比较结果;

  响应于所述终端设备进入所述音视频会议系统,所述AI语音转写模块获取所述会议服务器从所述终端设备收听的第二语音数据,并将所述第二语音数据转换为第二测试文本;所述第二语音数据为第二原始文本对应的语音数据;

  文本比较器将所述第二测试文本与所述第二原始文本进行比较,得出第二比较结果。

  控制器对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行遍历修改,重复AI语音转写模块的语音识别和文本比较器的文本比较操作步骤,完成对终端设备、音视频会议系统的IVR语音大厅和会议服务器的所有音频编解码器类型的测试。

  进一步地,所述文本比较器将所述第一测试文本与所述第一原始文本进行比较,得出第一比较结果的步骤之后,包括步骤:若所述第一比较结果达到第一预定值,则判定所测试的所述终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器之间相互兼容。

  进一步地,若所述第一比较结果为0%,则判定所测试的所述终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器不兼容。

  进一步地,所述文本比较器将所述第二测试文本与所述第二原始文本进行比较,得出第二比较结果的步骤之后还包括:若所述第二比较结果达到第二预定值,则判定在所测试的终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器下音视频会议系统稳定。

  进一步地,若所述第二比较结果小于所述第二预定值,则判定在所测试的终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器下音视频会议系统不稳定。

  进一步地,所述控制器对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行遍历修改的步骤包括:所述控制器依次固定终端设备的音频解码器类型,并对IVR语音大厅和会议服务器的音频编解码器进行遍历修改,直至将终端设备的所有音频解码器类型测试完成。

  本发明实施例一种音频编解码兼容性自动测试方法及系统,利用AI语音转写服务,将语音转为文本,进行比较,得出不同音频Codec和会议系统的是否兼容性,通过自动控制模块自动修改终端设备、IVR、Conference的音频Codec的配置,实现自动循环测试。大大提高了测试效率,同时保证会议系统在测试过程中的稳定性,而且由于输出音频文本和原始音频文本的比较值,使得对Codec的音质效果判断更加准确。

  附图说明

  图1是现有技术中两个终端设备进行P2P通话时的Codec类型示意图;

  图2是现有技术中终端设备进入会议系统时的Codec类型示意图;

  图3是本发明实施例提供的音频编解码兼容性自动测试系统的系统框图。

  图4是本发明实施例提供的音频编解码兼容性自动测试系统与终端设备和会议系统交互时的系统框图。

  图5是本发明实施例提供的音频编解码兼容性自动测试方法的流程图。

  图6是本发明实施例提供的音频编解码兼容性自动测试方法的一实施例示意图。

  具体实施方式

  下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

  本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

  音视频会议系统一般由IVR(Interactive Voice Response,交互式语音应答或者称为语音大厅)和Conference(会议服务)组成,终端设备进入会议,一般首先会呼叫到IVR,和IVR进行一次Codec协商,根据语音提示,再输入相应的会议号码和会议密码,然后和会议服务器再进行一次Codec协商,最终进入会议成功。而本发明的音视频编解码自动测试方法就是应用于音视频会议系统,以对音视频会议系统中IVR支持的Codec类型,以及会议服务器支持Codec类型与终端设备所支持的Codec类型的兼容性进行测试,同时对测试过程中音视频会议系统的稳定性进行测试。

  如图3所示,本发明优选实施例的一种音频编解码兼容性自动测试系统,该测试系统通过与终端设备和音视频会议系统进行数据交互,完成测试工作。该测试系统包括:又参见图4,语音播放模块和自动控制模块,语音播放模块用于语音播放文本数据,该文本数据包括第一原始文本和第二原始文本;自动控制模块包括控制器、AI语音转写模块和文本比较器,控制器用于自动对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行循环遍历修改;AI语音转写模块用于根据控制器对终端设备、音视频会议系统的IVR语音大厅和会议服务器所循环遍历修改的音频编解码器类型,获取终端设备从IVR语音大厅收听的第一语音数据,并将第一语音数据转换为第一测试文本;以及获取会议服务器从所述终端设备收听的第二语音数据,并将第二语音数据转换为第二测试文本;该第一语音数据为第一原始文本对应的语音数据,该第二语音数据为第二原始文本对应的语音数据;文本比较器用于依次将第一测试文本与第一原始文本进行比较,得出第一比较结果;以及将第二测试文本与第二原始文本进行比较,得出第二比较结果。

  下面对本实施例各个功能模块进行详细描述。

  对各种音频编解码器(Codec)类型进行兼容性检测,主要是对同一段语音数据,终端设备、音视频会议系统的IVR语音大厅和会议服务器等各自的音频解码器是否能够解码出相同或相近的语音文本,因此,本实施例的语音播放模块采用固定的文本进行播放,比如播放一篇500字文章,作为原始输入数据。通过语音播放该段文章,测试各个单元的音频解码器所解码的内容是否一致。由于本本实施例需要进行两次比较检测,即终端设备呼叫音视频会议系统时和终端设备进入会议时,因此,本实施例的文本数据包括了第一原始文本和第二原始文本,第一原始文本用于终端设备呼叫音视频会议系统时检测使用,第二原始文本用于终端设备进入会议时的检测使用。第一原始文本和第二原始问题可以固定选用两段文本数据,也可以根据实际情况随机选择两段文本数据,本实施例可以设定文本数据库,每次测试都从中选择两段文本数据作为第一原始文本和第二原始文本。文本数据库可以通过算法采集生成,也可以人工添加。本实施例还包括文本输入模块,用于向语音播放模块输入文本数据,文本输入模块可以从文本数据库中调用原始文本,也可以直接输入。

  本实施例的自动控制模块主要与终端设备和音视频会议系统进行数据交互。其中的控制器实现对终端设备、音视频会议系统中IVR语音大厅和会议服务器所支持的音频解码器类型进行修改,该修改为自动修改,而且是循环遍历修改。循环遍历修改即是,每次固定终端设备的一个音频解码器类型,然后分别调整IVR语音大厅和会议服务器的音频解码器的类型,完成对终端设备该音频解码类型的测试,再将终端设备修改为下一个音频解码器类型,再分别调整调整IVR语音大厅和会议服务器的音频解码器的类型,完成该组测试,就这样,直到将终端设备的所有音频解码器类型遍历完,完成对终端设备、IVR语音大厅和会议服务器的所有音频解码器类型的测试。

  控制器每设定一组终端设备、IVR语音大厅和会议服务器的音频解码器类型,AI语音转写模块就进行两次语音识别,文本比较器就进行两次文本比较。AI语音转写模块的第一次语音识别是在终端设备发起对音视频会议系统呼叫时,此时,终端设备会先呼叫达到IVR语音大厅,然后收听IVR语音大厅向其播放的第一语音数据,而AI语音转写模块会获取该第一语音数据,并将该第一语音数据转换为第一测试文本。AI语音转写模块的第二次语音识别是在终端设备进入会议时,控制器控制终端设备输入会议号码和会议密码,使其进入会议,在终端设备进入会议后,在会议服务器上会收到终端设备播放的第二语音数据,而AI语音转写模块会获取该第二语音数据,并将该第二语音数据转换为第二测试文本。

  在每次AI语音转写模块的语音识别后,文本比较器都会将AI语音转写模块所转换的测试文本与原始文本进行比较,即依次将第一测试文本与第一原始文本进行比较,得出第一比较结果;以及将第二测试文本与第二原始文本进行比较,得出第二比较结果。

  针对文本比较器所得出的比较结果,本发明实施例的测试系统还包括判断模块,该判断模块用于根据第一比较结果判断终端设备、IVR语音大厅和会议服务器的音频编解码器是否兼容,以及根据第二比较结果判断音视频会议系统是否稳定。由于测试文本与原始文本的比较,因此,本发明实施例的第一比较结果和第二比较结果均为0%~100%。如果第一比较结果为0%,可认为就是无声,则判定终端设备、IVR语音大厅和会议服务器的音频编解码器完全不兼容,如果第一比较结果为100%,则可判定终端设备、IVR语音大厅和会议服务器的音频编解码器完全兼容,而如果第一比较结果是0%~100%的中间值,则可以作为该Codec类型的音质效果评估数据。当然,也可以将中间值定义为第一预定值,高于该第一预定值则判定兼容,低于该第一预定值则判定不兼容。对于第二比较结果,如果第二比较结果为0%,则可直接判定系统不稳定,而如果第二比较结果为100%,则可直接判定系统稳定。当然,也可以设定0%~100%的中间值为第二预定值,高于该第二预定值则判定系统稳定,低于该第二预定值则判定系统不稳定。关于第一预定值和第二预定值的设定,可以根据硬件设备或应用场景自由设定。

  以上功能操作,是将测试系统应用在音视频会议系统和终端设备的交互过程中,符合音频编解码类型兼容性的测试要求。通过语音播放模块播放预置的语音数据,通过控制器可以自动对终端和IVR语音大厅、会议服务器(Conference)的音频编解码器(AudioCodec)进行修改;通过文本比较器可以进行两个文本的文字比较,输出两个文件里的文字一致率;通过AI语音转写模块可以进行语音识别,将采集到的语音转换为文本。因此相对于现有技术,本发明实施例能够实现对音频编解码器的自动循环测试。大大提高了测试效率,同时保证会议系统在测试过程中的稳定性,而且由于输出音频文本和原始音频文本的比较值,使得对Codec的音质效果判断更加准确。

  基于上述测试系统,本发明实施例还提供了一种音频编解码兼容性自动测试方法,如图5所示,包括步骤:

  S1、控制器自动对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行修改;

  S2、响应于终端设备向音视频会议系统发起呼叫操作,AI语音转写模块获取所述终端设备从IVR语音大厅收听的第一语音数据,并将所述第一语音数据转换为第一测试文本;所述第一语音数据为第一原始文本对应的语音数据;

  S3、文本比较器将所述第一测试文本与所述第一原始文本进行比较,得出第一比较结果;

  S4、响应于所述终端设备进入所述音视频会议系统,所述AI语音转写模块获取所述会议服务器从所述终端设备收听的第二语音数据,并将所述第二语音数据转换为第二测试文本;所述第二语音数据为第二原始文本对应的语音数据;

  S5、文本比较器将所述第二测试文本与所述第二原始文本进行比较,得出第二比较结果。

  S6、控制器对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行遍历修改,重复AI语音转写模块的语音识别和文本比较器的文本比较操作步骤(S2-S5),完成对终端设备、音视频会议系统的IVR语音大厅和会议服务器的所有音频编解码器类型的测试。

  优选地,在步骤S3之后,对第一比较结果进行判断,若第一比较结果达到第一预定值,则判定所测试的所述终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器之间相互兼容,如果能够达到100%则证明完全兼容。若第一比较结果为0%,则判定所测试的所述终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器不兼容。

  而在步骤S5之后,对第二比较结果进行判断,若第二比较结果达到第二预定值,则判定在所测试的终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器下音视频会议系统稳定,若第二比较结果小于第二预定值,则判定在所测试的终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器下音视频会议系统不稳定。当然如果能够达到100%则证明系统非常稳定,而如果第二比较结果为0%则证明系统极不稳定。

  关于第一预定值和第二预定值的设定,可以参照测试系统中的描述,在此不一一赘述。

  在本实施例中,控制器对终端设备、音视频会议系统的IVR语音大厅和会议服务器的音频编解码器类型进行遍历修改,具体为:控制器依次固定终端设备的音频解码器类型,并对IVR语音大厅和会议服务器的音频编解码器进行遍历修改,并完成测试,直至将终端设备的所有音频解码器类型测试完成。

  下面结合具体的示例,对上述测试过程进行详细描述。

  设定终端支持的Codec类型数量N种,IVR支持的Codec类型数量为M种,Conference支持的Codec类型数量为K种,其中,N、M和K均为正整数,通过自动测试实现N*M*K条全路径覆盖,整体测试过程如下:

  步骤1:自动控制模块自动向各个设备发起命令,终端设备使用Codec-N1类型,IVR使用Codec-M1类型,Conference使用Codec-K1类型,终端设备使用Codec-N1类型向音视频会议系统呼叫;

  步骤2:终端设备收到指令后,发起对音视频会议系统呼叫,终端设备首先呼叫达到IVR语音大厅,终端设备听见IVR语音大厅向其播放语音;

  步骤3:自动控制模块通过AI语音转写,将终端设备听的语音,转换为文本A1,并通过自动控制模块和文本A进行比较;

  步骤4:在文件文本比较器中把文本A1和文本A的比较,文本比较器输出结果0%~100%的一个值,如果是0%则认为该Code-N1类型和IVR的Codec-M1是不兼容性的,如果是100%,则认为该Code-N1类型和IVR的Codec-M1类型是兼容性的,比较值作为音质的评估依据;

  步骤5:再执行步骤2进行IVR语音大厅之后,自动控制模块让终端设备输入会议号码和会议密码,使其进入会议;

  步骤6:当终端设备进入会议后,自动控制模块通过AI语音识别,在会议服务器上收到的终端设备播放的语音,转换为文本B1,并通过自动控制模块和文本B进行比较;

  步骤7:在文件文本比较器中把文本B1和文本B的比较,文本比较器输出结果0%~100%的一个值,如果是0%则认为该Code-N1类型和Conference的Codec-K1不兼容性的,如果是100%,则认为该Code-N1类型和Conference的Codec-K1类型是兼容性的。比较值作为音质的评估依据;

  步骤8:Codec-N1类型,测试完毕,自动控制模块输出不同Codec的IVR比较值和Conference比较值,通过循环测试验证会议系统稳定性;

  步骤9:调整终端设备Codec-N2类型,终端设备Codec循环遍历到N次,固定终端设备Codec,再分别调整IVR和Conference的Codec类型,直到所有的Codec测试完成。

  在执行完上述过程后,输出如下表1所示的结果:

  

  

  表1

  应当说明的是,上述实施例中提供的音视频编解码兼容性自动测试方法和音视频编解码兼容性自动测试方法均是基于相同的发明构思。因此,音视频编解码兼容性自动测试方法中各个具体实施例的步骤均可以由对应的功能模块所执行,功能模块中具体的功能也可以在音视频编解码兼容性自动测试系统中具有对应的方法步骤,在此不再赘述。

  综上,本发明实施例提供的音视频编解码兼容性自动测试系统和方法,针对现有会议系统中人工测试Codec兼容性工作量大的技术问题,提供了更加智能和便捷的测试方案。该测试方案能够大大提高测试的效率和准确度,而且能够保证测试过程中会议系统的稳定性。

  以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通计数人员来说,在不脱离本发明计数原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

《一种音频编解码兼容性自动测试方法及系统.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)