欢迎光临小豌豆知识网!
当前位置:首页 > 电学技术 > 电通讯技术> 一种语音播放方法及装置独创技术27823字

一种语音播放方法及装置

2020-08-20 22:49:59

  语音播放方法及装置

  第一、技术领域

  本申请涉及语音处理领域,尤其涉及一种语音播报方法及装置。

  第二、背景技术

  机器人在工作中经常会通过电话语音与用户进行交互。例如,当机器人在执行配送任务时,到达目标点后,需要通过电话通知用户取货。

  目前,机器人在电话拨打出去后,立即循环播报通知语音,在某些情况下,用户不能完全接收到播报的通知语音中的信息,即语音播报的有效性低。

  第三、发明内容

  本申请提供了一种语音播放方法及装置,目的在于解决语音播报的有效性低的问题。

  为了实现上述目的,本申请提供了以下技术方案:

  本申请提供了一种语音播报方法,包括:

  在接收到对用户电话进行拨叫的指令的情况下,拨叫所述用户电话;

  检测所述用户电话反馈的信号音中满足预设条件的信号音;所述预设条件包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配;所述预设频率指:对拨叫状态表示非接通状态的多个预设信号音分别进行时频变换得到的频率;

  在检测到所述满足预设条件的信号音的情况下,播放预设语音。

  可选的,所述检测所述用户电话反馈的信号音中满足预设条件的信号音,包括:

  获取第一信号音的频率;所述第一信号音为所述用户电话初始反馈的时长不小于预设时长的信号音;所述第一信号音的频率通过时频变换计算得到;

  在所述第一信号音的频率与所述预设频率都不匹配的情况下,确定所述第一信号音为所述满足预设条件的信号音。

  可选的,所述非接通状态包括:振铃状态、占线状态和空号状态;

  所述检测所述用户电话反馈的信号音中满足预设条件的信号音,包括:

  获取第一信号音的频率;所述第一信号音为所述用户电话初始反馈的时长不小于预设时长的信号音;所述第一信号音的频率通过时频变换计算得到;

  在所述第一信号音的频率与所述振铃状态的信号音的频率匹配的情况下,执行以下操作:

  获取第二信号音的频率;所述第二信号音为目标信号音之后的时长不小于预设时长的信号音;所述目标信号音为最晚已获取频率的信号音;

  在所述第二信号音的频率不满足与所述预设频率都不匹配的情况下,返回执行所述获取第二信号音的频率,直至检测到所述满足预设条件的信号音。

  可选的,所述非接通状态包括:振铃状态、占线状态和空号状态;还包括:

  在检测到获取的频率与所述占线状态或者所述空号状态对应的信号音的频率匹配的情况下,挂断所述用户电话。

  可选的,在所述播放预设语音之后,还包括:

  在接收到所述用户电话反馈的表示电话挂断的语音信号的情况下,挂断所述用户电话。

  本申请还提供了一种语音播报装置,包括:

  拨叫模块,在接收到对用户电话进行拨叫的指令的情况下,拨叫所述用户电话;

  检测模块,用于检测所述用户电话反馈的信号音中满足预设条件的信号音;所述预设条件包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配;所述预设频率指:对拨叫状态表示非接通状态的多个预设信号音分别进行时频变换得到的频率;

  播放模块,用于在检测到所述满足预设条件的信号音的情况下,播放预设语音。

  可选的,所述检测模块,用于检测所述用户电话反馈的信号音中满足预设条件的信号音,包括:

  所述检测模块,具体用于获取第一信号音的频率;所述第一信号音为所述用户电话初始反馈的时长不小于预设时长的信号音;所述第一信号音的频率通过时频变换计算得到;在所述第一信号音的频率与所述预设频率都不匹配的情况下,确定所述第一信号音为所述满足预设条件的信号音。

  可选的,所述非接通状态包括:振铃状态、占线状态和空号状态;所述检测模块,用于检测所述用户电话反馈的信号音中满足预设条件的信号音,包括:

  所述检测模块,具体用于获取第一信号音的频率;所述第一信号音为所述用户电话初始反馈的时长不小于预设时长的信号音;所述第一信号音的频率通过时频变换计算得到;

  在所述第一信号音的频率与所述振铃状态的信号音的频率匹配的情况下,执行以下操作:

  获取第二信号音的频率;所述第二信号音为目标信号音之后的时长不小于预设时长的信号音;所述目标信号音为最晚已获取频率的信号音;在所述第二信号音的频率不满足与所述预设频率都不匹配的情况下,返回执行所述获取第二信号音的频率,直至检测到所述满足预设条件的信号音。

  本申请还提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述任意一种所述的语音播报方法。

  本申请还提供了一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述任意一种所述的语音播报方法。

  本申请所述的语音播报方法及装置,在接收到对用户电话进行拨叫的指令的情况下,拨叫该用户电话,检测该户电话反馈的信号音中满足预设条件的信号音。其中,预设条件包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配,预设频率指:对多个预设的表示非接通状态的拨叫状态分别对应的信号音进行时频变换得到的频率。

  即本申请是从拨叫状态不同的信号音分别经时频变换得到的频率的角度,从该用户反馈的信号音中检测拨叫状态表示接通状态的信号音,并在检测到拨叫状态表示接通状态的信号音的情况下,播放预设语音。即在保证用户接听电话后,才播报预设语音,从而保证用户可以接听该预设语音的完整信息,因此,本申请可以提高语音播报的有效性。

  第四、附图说明

  为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

  图1为本申请实施例公开的一种语音播报方法的流程图;

  图2为本申请实施例公开的又一种语音播报方法的流程图;

  图3为本申请实施例公开的一种语音播报装置的结构示意图;

  图4为本申请实施例公开的一种设备的结构示意图。

  第五、具体实施方式

  下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

  发明人在研究中发现,现有技术中,用户不能完全接收播报的通知语音中的信息的原因可以包括:在机器人向用户拨叫电话后,用户由于某些原因,未能接通该电话,或者,延迟一段时间才接通该电话,使得用户漏接到通知语音中的某些信息。

  发明人在研究中还发现,在拨打用户电话后,用户电话反馈信号音。其中,信号音可以反映用户电话的状态(用户电话的拨叫状态)。在实际中,用户电话的拨叫状态可以包括:占线状态、空号状态、振铃状态和接通状态等。其中,对于某些拨叫状态,信号音的频率是不同的,例如,在用户电话的拨叫状态为振铃状态的情况下,信号音为频率为450±25Hz的交流电源,1秒送4秒断的信号音。在拨叫状态表示占线状态的情况下,信号音为频率为450±25Hz的交流电源,0.35秒送0.35秒断的信号音等等。

  因此,本申请实施例检测用户电话反馈的信号音中满足预设条件的信号音,在检测到拨叫状态表示接通状态的信号音的情况下,即在用户接通电话的情况下,播放预设语音,从而,保证用户可以完全掌握语音中的信息,因此,可以提高语音播报的有效性。

  图1为本申请实施例提供的一种语音播报方法,可以包括以下步骤:

  S101、在接收到对用户电话进行拨叫的指令的情况下,拨叫用户电话。

  在本步骤中,在接收到对用户电话进行拨叫的指令的情况下,拨打用户电话。在本实施例中,在拨打用户电话后,用户电话反馈信号音。

  S102、获取第一信号音的频率。

  在本实施例中,第一信号音用户电话初始反馈的时长不小于预设时长的信号音,并且,第一信号音为用于检测该用户电话的拨叫状态的语音片段。

  在本申请实施例中,第一信号音的起始时刻可以为用户电话接收到拨叫指令的时刻,当然,也可以为该时刻之后且与该时刻的时长较短的时刻。并且,第一信号音的时长不小于预设时长。其中,预设时长为能够区分表示不同拨叫状态的信号音的最短时长。例如,表征振铃状态的信号音是1秒送4秒断,表征占线状态的信号音是0.35秒送0.35秒断,因此,预设时长的取值可以为2秒,还可以为1秒。当然,在实际中,预设时长的取值还可以其他值,本实施例不对预设时长的具体取值作限定。

  在本步骤中,获取第一信号音的频率的具体实现方式可以包括以下步骤A1~步骤A3:

  A1、每隔预设时间间隔,读取该预设时间间隔的信号音。

  在本步骤中,预设时间间隔的取值可以为0.1秒,当然,在实际中,预设时间间隔还可以为其他取值,本实施例不对预设时间间隔的具体取值作限定。

  A2、采用时频变换,计算预设时间间隔的信号音的频率。

  在本步骤中,时频变换可以为快速傅里叶变换,其中,采用时频变换算法,计算预设时间间隔的信号音的频谱,其中,具体的计算方式为现有技术,这里不再赘述。

  需要说明的是,在实际中,除了可以采用快速傅里叶变换之外,还可以采用其他方式计算信号音的频谱,本实施例不对具体的计算方式作限定。

  A3、判断累计读取的信号音的时长是否不小于预设时长,如果否,则执行A1,直至累计读取的信号音的时长不小于预设时长。

  在步骤中,在累计读取的信号音的时长不小于预设时长的情况下,将累计读取的时长不小于预设时长的信号音的频谱,作为第一信号音的频率。

  需要说明的是,上述步骤A1~步骤A3只是一种具体的获取方式,在实际中,除了采用步骤A1~步骤A3的确定方式之外,还可以通过直接接收的方式,本实施例不对具体的获取方式作限定。

  S103、将第一信号音的频率与预设频率相匹配,得到第一匹配结果。

  在本实施例中,用户电话反馈的信号音可能存在多种拨叫状态,具体的可以包括:接通状态、振铃状态、占线状态和空号状态等。在本实施例中,对于拨叫状态中的表示非接通状态的信号音的频率不同,因此,本实施例对每个表示非接通状态的信号音进行时频变换,得到对应的频率。例如,得到表示振铃状态的信号音的频率,表示占线状态的信号音的频率,表示空号状态的信号音的频率,为了描述方便,统称为预设频率。

  在本步骤中,将第一信号音的频率与预设频率相匹配,得到第一匹配结果,该第一匹配结果可以为第一信号音的频率与预设频率中的某个频率相匹配,也可以是第一信号音的频率与预设频率都不匹配。

  由于预设频率为拨叫状态表示非接通状态的信号音的频率,因此,在第一信号音的频率与预设频率都不匹配的情况下,则第一信号音表示的拨叫状态为接通状态。

  因此,本步骤的第一匹配结果可反映第一信号音表示的拨叫状态,即匹配结果可反映用户电话的拨叫状态。

  S104、判断第一匹配结果是否表示第一信号音的频率与预设频率都不匹配,如果是,则执行S109,如果否,则执行S105。

  在本实施例中,在得到第一匹配结果之后,在本步骤中,判断第一匹配结果是否表示第一信号音的频率与预设频率都不匹配,则是判断第一匹配结果是否表征该用户电话的拨叫状态为接通状态,如果是,则执行S109,否则,第一匹配结果表征该用户电话的拨叫状态可以为振铃状态、占线状态和空号状态等中的任意一种拨叫状态,该种情况下,执行S105。

  S105、判断第一匹配结果是否表示第一信号音的频率与振铃状态的信号音的频率相匹配,如果是,则执行S106,如果否,则执行S110。

  在本实施例中,为了提高机器人拨打电话的效率,在该用户电话的拨叫状态为占线状态或空号状态的情况下,机器人可以挂断该用户电话,以便于接收下一个用户电话的拨打任务。

  因此,在本步骤中,判断第一匹配结果是否表示第一信号音的频率与振铃状态的信号音的频率相匹配,如果是,则表示该用户电话的拨叫状态为振铃状态,在该情况下,需要继续检测用户电话反馈的信号音中满足预设条件的信号音,则执行S106。如果否,即判断该用户电话的拨叫状态为占线状态或者空号状态,则执行S110。

  S106、获取第二信号音的频率。

  在本实施例中,第二信号音为目标信号音之后的时长不小于预设时长的信号音,其中,目标信号音为最晚已获取的频率的信号音。

  在本步骤中,第二信号音为该第一信号音之后的时长不小于预设时长的信号音,其中,预设时长的取值方式的选取原则,这里不再赘述。

  在本步骤中,获取第二信号音的频率的原理,可以参考步骤A1~步骤A3,这里不再赘述,需要说明的是,在本步骤中,第二信号音的起始时刻可以为判断得到匹配结果表示第一信号音的频率与拨叫状态为振铃状态信号音的频率相匹配的时刻,本实施例不对第二信号音的起始时刻的具体内容作限定。

  S107、将第二信号音的频率与预设频率相匹配,得到第二匹配结果。

  本步骤的具体实现方式可以参考S103,这里不再赘述。

  S108、判断第二匹配结果是否表示第二信号音的频率与预设频率都不匹配,如果否,则执行S106,如果是,则执行S109。

  在S107得到匹配结果后,执行本步骤的操作,判断第二匹配结果是否表示第二信号音的频率与预设频率都不匹配,即判断该用户电话的拨叫状态是否为接通状态,如果否,则执行S106,即继续获取第二信号音之后的时长不小于预设时长的信号音的频率,为了描述方便,将本步骤获取频率的信号音,也称为第二信号音,其中,本步骤获取的第二信号音的起始时刻可以为得到本步骤的判断结果为非接通状态的时刻。

  S109、播放预设语音。

  在本实施例中,在检测到满足预设条件的信号音,即得到该用户电话的拨叫状态为接通状态的情况下,执行本步骤的操作,即播放预设语音。其中,预设语音的具体内容需要依据具体的业务场景确定,本实施例不对预设语音的具体内容作限定。

  S110、挂断该用户电话。

  在实际中,在播放完预设语音的情况下,用户会挂断电话。

  在本步骤中,机器人则可以接收到用户电话反馈的表示电话挂断的语音信号,在该情况下,则挂断该用户电话。

  在本实施例中,在匹配得到频率与占线状态或空号状态的信号音的频率相匹配的情况下,即该用户电话的拨叫状态为占线状态或者空号状态的情况下,也执行本步骤的操作。

  图2为本申请实施例提供的又一种语音播报方法,可以包括以下步骤:

  S201、在接收到对用户电话进行拨叫的指令的情况下,拨叫该用户电话。

  S202、检测用户电话反馈的信号音中满足预设条件的信号音。

  在本步骤中,预设条件可以包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配;其中,预设频率指:对拨叫状态表示非接通状态的多个预设信号音分别进行时频变换得到的频率。

  由于预设频率指拨叫状态表示非接通状态的信号音分别对应的频率,因此,满足预设条件的信号音则表示用户电话的拨叫状态为接通状态。

  S203、在检测到满足预设条件的信号音的情况下,播放预设语音。

  由于预设频率指拨叫状态表示非接通状态的信号音分别对应的频率,因此,满足预设条件的信号音则表示用户电话的拨叫状态为接通状态。因此,在本步骤中,在检测到满足预设条件的信号音的情况下,播放预设语音。即在用户接听电话后,播放预设语音。

  图3为本申请是实例提供的一种语音播报装置,可以包括:拨叫模块301、检测模块302和播放模块303,其中,

  拨叫模块301,在接收到对用户电话进行拨叫的指令的情况下,拨叫用户电话。

  检测模块302,用于检测用户电话反馈的信号音中满足预设条件的信号音;预设条件包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配;预设频率指:对拨叫状态表示非接通状态的多个预设信号音分别进行时频变换得到的频率。

  播放模块303,用于在检测到满足预设条件的信号音的情况下,播放预设语音。

  可选的,检测模块302,用于检测用户电话反馈的信号音中满足预设条件的信号音,包括:

  检测模块302,具体用于获取第一信号音的频率;第一信号音为用户电话初始反馈的时长不小于预设时长的信号音;第一信号音的频率通过时频变换计算得到;在第一信号音的频率与预设频率都不匹配的情况下,确定第一信号音为满足预设条件的信号音。

  可选的,非接通状态可以包括:振铃状态、占线状态和空号状态;

  检测模块302,用于检测用户电话反馈的信号音中满足预设条件的信号音,包括:

  检测模块302,具体用于获取第一信号音的频率;第一信号音为用户电话初始反馈的时长不小于预设时长的信号音;第一信号音的频率通过时频变换计算得到;在第一信号音的频率与振铃状态的信号音的频率匹配的情况下,执行以下操作:

  获取第二信号音的频率;第二信号音为目标信号音之后的时长不小于预设时长的信号音;目标信号音为最晚已获取频率的信号音;在第二信号音的频率不满足与预设频率都不匹配的情况下,返回执行获取第二信号音的频率,直至检测到满足预设条件的信号音。

  可选的,非接通状态包括:振铃状态、占线状态和空号状态;该装置还可以包括:

  第一挂断模块,用于在检测到获取的频率与占线状态或者所述空号状态对应的信号音的频率匹配的情况下,挂断用户电话。

  可选的,该装置还可以包括第二挂断模块,用于在播放预设语音之后,在接收到用户电话反馈的表示电话挂断的语音信号的情况下,挂断用户电话。

  语音播报装置包括处理器和存储器,上述拨叫模块301、检测模块302和播放模块303等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

  处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决语音播报的有效性低的问题。

  本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述语音播报方法。

  本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述语音播报方法。

  本发明实施例提供了一种设备,如图4所示,设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的语音播报方法。本文中的设备可以是服务器、PC、PAD、手机等。

  本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:

  在接收到对用户电话进行拨叫的指令的情况下,拨叫所述用户电话;

  检测所述用户电话反馈的信号音中满足预设条件的信号音;所述预设条件包括:时长不小于预设时长且经时频变换得到的频率与预设频率都不匹配;所述预设频率指:对拨叫状态表示非接通状态的多个预设信号音分别进行时频变换得到的频率;

  在检测到所述满足预设条件的信号音的情况下,播放预设语音。

  本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

  在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

  存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

  计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。

  还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

  本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

  以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

  本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

  本说明书的各个实施例中记载的特征可以相互替换或者组合,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。

  对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

《一种语音播放方法及装置.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)