掌桥专利:专业的专利平台
掌桥专利
首页

基于语音识别的调度电话拨打方法及装置、介质、设备

文献发布时间:2024-04-18 19:58:26


基于语音识别的调度电话拨打方法及装置、介质、设备

技术领域

本申请涉及调度领域,尤其是涉及到一种基于语音识别的调度电话拨打方法及装置、介质和设备。

背景技术

调度电话是一种专用的通信系统,用于管理和协调调度员之间的通话和任务分配。在电力系统中调度电话系统通常与其他电力监控和管理系统集成,实现自动化的电力调度和监测。调度员使用专门的调度电话设备或软件应用,与发电厂、输电线路、变电站等各个环节进行通讯与协调。由于电力系统的特殊性,调度电话的效率对于电力系统的安全运行、故障排查、任务分配、团队协作、资源调配和应急管理等方面至关重要。然而现有的调度电话拨打方法仍然是手动输入电话号码进行呼叫,拨打效率不高,导致沟通效率以及响应速度降低。

发明内容

有鉴于此,本申请提供了一种基于语音识别的调度电话拨打方法及装置、介质和设备,解决了现有方法拨打效率不高,导致沟通效率以及响应速度降低的问题。

根据本申请的一个方面,提供了一种基于语音识别的调度电话拨打方法,包括:

响应于第一语音输入请求,接收第一语音输入,并识别所述第一语音输入得到第一字符串;

若所述第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,其中,所述检验字符串包含请求拨打电话的语义信息;

响应于用户在所述电话拨打界面输入的第二语音输入请求,接收第二语音输入,其中,所述第二语音输入包括一个或多个被呼叫终端标识;

识别所述第二语音输入得到第二字符串,生成与所述第二字符串对应的确认提示信息,并播报所述确认提示信息,其中,所述确认提示信息为语音类型的信息;

若接收到与所述确认提示信息对应的确认信息,则基于所述第二字符串拨打调度电话,以呼叫所述被呼叫终端标识对应的终端。

可选地,所述响应于第一语音输入请求,接收第一语音输入,并识别所述第一语音输入得到第一字符串,包括:

响应于第一语音输入请求,创建语音识别对象,并利用所述语音识别对象调用预设的语音识别函数;

依次接收多个第一语音片段,每接收到一个第一语音片段,就利用所述语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段;

组合多个所述第一字符串片段,得到所述第一字符串。

可选地,所述利用所述语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段,包括:

利用所述语音识别函数解析所述当前第一语音片段,得到第一文本片段;

拼接所述第一文本片段、当前第一语音片段对应的接收时刻以及所述当前第一语音片段对应的编号,得到第一字符串片段,其中,所述编号用于指示所述当前第一语音片段在多个第一语音片段中的顺序;

相应地,所述组合所述第一字符串片段,得到所述第一字符串,包括:

按照所述编号依次排列多个所述第一字符串片段,并根据多个所述第一字符串片段中的接收时刻的先后顺序校验所述第一字符串的排列顺序;

若校验通过,则提取每个所述第一字符串片段中的第一文本片段,并按照所述编号依次拼接所述第一文本片段,得到所述第一字符串。

可选地,所述第一语音输入请求为基于呼叫终端的触摸事件;

相应地,所述响应于第一语音输入请求,创建语音识别对象,包括:

响应于所述基于呼叫终端的触摸事件,创建语音识别对象,并持续检测所述触摸事件;

所述组合多个所述第一字符串片段,包括:

若检测到所述触摸事件结束,则确定所述第一语音输入完成,组合多个所述第一字符串片段。

可选地,所述校验字符串为至少一个;

相应地,所述若所述第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,包括:

确定所述校验字符串的格式为目标格式,并将所述第一字符串转换至所述目标格式;

依次比较所述第一字符串与每个所述校验字符串,若所述第一字符串与任一校验字符串相同,则确定所述匹配结果满足校验条件。

可选地,所述被呼叫终端标识为被呼叫终端对应的电话号码或所述被呼叫终端对应的联系人标识;

相应地,所述基于所述第二字符串拨打电话,包括:

若所述第二语音输入包括多个所述被呼叫终端标识,且所述被呼叫终端标识为所述电话号码,则根据预设的电话号码长度,将所述第二字符串切分成多个所述电话号码,并基于所述多个电话号码拨打群组电话。

可选地,所述基于所述第二字符串拨打电话包括:

若所述第二语音输入包括多个所述被呼叫终端标识,且所述被呼叫终端标识为所述联系人标识,则基于所述第二语音输入中的至少一个静默时段,确定联系人标识分割位置;

基于所述联系人标识分割位置,将所述第二字符串切分成多个所述联系人标识,并基于所述多个联系人标识拨打群组电话。

根据本申请的另一方面,提供了一种基于语音识别的调度电话拨打装置,所述装置包括:

呼叫请求接收模块,用于响应于第一语音输入请求,接收第一语音输入,并识别所述第一语音输入得到第一字符串;

呼叫请求校验模块,用于若所述第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,其中,所述检验字符串包含请求拨打电话的语义信息;

被呼终端信息接收模块,用于响应于用户在所述电话拨打界面输入的第二语音输入请求,接收第二语音输入,其中,所述第二语音输入包括一个或多个被呼叫终端标识;

被呼终端信息确认模块,用于识别所述第二语音输入得到第二字符串,生成与所述第二字符串对应的确认提示信息,并播报所述确认提示信息,其中,所述确认提示信息为语音类型的信息;

呼叫模块,用于若接收到与所述确认提示信息对应的确认信息,则基于所述第二字符串拨打调度电话,以呼叫所述被呼叫终端标识对应的终端。

可选地,所述呼叫请求接收模块用于:

响应于第一语音输入请求,创建语音识别对象,并利用所述语音识别对象调用预设的语音识别函数;

依次接收多个第一语音片段,每接收到一个第一语音片段,就利用所述语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段;

组合多个所述第一字符串片段,得到所述第一字符串。

可选地,所述呼叫请求接收模块用于:

利用所述语音识别函数解析所述当前第一语音片段,得到第一文本片段;

拼接所述第一文本片段、当前第一语音片段对应的接收时刻以及所述当前第一语音片段对应的编号,得到第一字符串片段,其中,所述编号用于指示所述当前第一语音片段在多个第一语音片段中的顺序;

相应地,所述组合所述第一字符串片段,得到所述第一字符串,包括:

按照所述编号依次排列多个所述第一字符串片段,并根据多个所述第一字符串片段中的接收时刻的先后顺序校验所述第一字符串的排列顺序;

若校验通过,则提取每个所述第一字符串片段中的第一文本片段,并按照所述编号依次拼接所述第一文本片段,得到所述第一字符串。

可选地,所述第一语音输入请求为基于呼叫终端的触摸事件;

相应地,所述呼叫请求接收模块用于:

响应于所述基于呼叫终端的触摸事件,创建语音识别对象,并持续检测所述触摸事件;

以及,若检测到所述触摸事件结束,则确定所述第一语音输入完成,组合多个所述第一字符串片段。

可选地,所述校验字符串为至少一个;

相应地,所述呼叫请求校验模块用于:

确定所述校验字符串的格式为目标格式,并将所述第一字符串转换至所述目标格式;

依次比较所述第一字符串与每个所述校验字符串,若所述第一字符串与任一校验字符串相同,则确定所述匹配结果满足校验条件。

可选地,所述被呼叫终端标识为被呼叫终端对应的电话号码或所述被呼叫终端对应的联系人标识;

相应地,所述呼叫模块用于:

若所述第二语音输入包括多个所述被呼叫终端标识,且所述被呼叫终端标识为所述电话号码,则根据预设的电话号码长度,将所述第二字符串切分成多个所述电话号码,并基于所述多个电话号码拨打群组电话。

可选地,所述呼叫模块用于:

若所述第二语音输入包括多个所述被呼叫终端标识,且所述被呼叫终端标识为所述联系人标识,则基于所述第二语音输入中的至少一个静默时段,确定联系人标识分割位置;

基于所述联系人标识分割位置,将所述第二字符串切分成多个所述联系人标识,并基于所述多个联系人标识拨打群组电话。

根据本申请又一个方面,提供了一种介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现上述基于语音识别的调度电话拨打方法。

根据本申请再一个方面,提供了一种设备,包括存储介质和处理器,所述存储介质存储有计算机程序所述处理器执行所述计算机程序时实现上述基于语音识别的调度电话拨打方法。

借由上述技术方案,本申请当用户需要打电话时,在主界面按住屏幕说出“拨打电话”或“打电话”等第一语音输入之后,松开屏幕即可调用语音识别功能,返回识别结果,若结果与软件内置的校验字符串“拨打电话”或“打电话”相同时即可进入语音拨打电话功能。进入语音拨打界面之后,用户可以按住屏幕说出如电话号码等第二语音输入,之后会进行播报确认电话号码是否输入有问题,待确认之后即可进行自动拨打。该实施例只需用户语音输入电话号码,无需手动输入号码并拨打电话,解决了现有方法拨打效率不高,导致沟通效率以及响应速度降低的问题。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1示出了本申请实施例提供的一种基于语音识别的调度电话拨打方法的流程示意图;

图2示出了本申请实施例提供的另一种基于语音识别的调度电话拨打方法的流程示意图;

图3示出了本申请实施例提供的另一种基于语音识别的调度电话拨打方法的流程示意图;

图4示出了本申请实施例提供的另一种基于语音识别的调度电话拨打方法的流程示意图;

图5示出了本申请实施例提供的另一种基于语音识别的调度电话拨打方法的流程示意图;

图6示出了本申请实施例提供的另一种基于语音识别的调度电话拨打方法的流程示意图;

图7示出了本申请实施例提供的一种基于语音识别的调度电话拨打装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

在本实施例中提供了一种基于语音识别的调度电话拨打方法,如图1所示,该方法包括:

步骤101,响应于第一语音输入请求,接收第一语音输入,并识别第一语音输入得到第一字符串;

步骤102,若第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,其中,检验字符串包含请求拨打电话的语义信息;

步骤103,响应于用户在电话拨打界面输入的第二语音输入请求,接收第二语音输入,其中,第二语音输入包括一个或多个被呼叫终端标识;

步骤104,识别第二语音输入得到第二字符串,生成与第二字符串对应的确认提示信息,并播报确认提示信息,其中,确认提示信息为语音类型的信息;

步骤105,若接收到与确认提示信息对应的确认信息,则基于第二字符串拨打调度电话,以呼叫被呼叫终端标识对应的终端。

本申请实施例提供的基于语音识别的调度电话拨打方法,用于识别用户输入的语音,并根据语音自动拨打调度电话,该实施例无需人工拨号,提高了调度电话的拨打效率。

在该实施例中,首先由用户发出第一语音输入请求,通讯终端接收用户发出的第一语音输入请求,开始接收与该请求对应的第一语音输入,并利用语音识别技术将第一语音输入由语音格式转化为字符串格式,得到第一字符串。然后匹配第一字符串与预设的校验字符串,其中,预设的校验字符串包含用于请求拨打电话这一动作的指示信息,如“打电话”,若第一字符串与预设的校验字符串相匹配,则认为第一字符串的含义为指示拨打调度电话。

基于此,显示电话拨打界面,以接收用户在电话拨打界面输入的第二语音输入请求,并在接收到第二语音输入请求后,开始接收第二语音输入并将其转换为字符串格式,得到第二字符串。其中,第二语音输入包括至少一个被呼叫终端标识,用于指示被呼叫终端,例如,电话号码“13012345678”,转换得到的第二字符串也同样包括前述被呼叫终端标识。

在得到第二字符串后,利用语音合成技术生成与第二字符串对应的语音格式的确认提示信息请进行播放,例如,“您要拨打的调度电话是13012345678吗?”

如下代码为一个实施例中的生成语音格式的确认提示信息的代码:

privateSpeechSynthesizermTts=SpeechSynthesizer.createSynthesizer(MainActivity.this,mTtsInitListener)privateSynthesizerListenermSynListener=new SynthesizerL

istener(){

//

会话结束回调接口,没有错误时,error为null

public void onCompleted(SpeechError error){

if(error!=null){Log.d("mySynthesiezer complete code:",error.getEr

rorCode()+"");}else{Log.d("mySynthesiezer complete code:","0");}}

mTts.startSpeaking(texts,mSynListener);

在上述代码中,创建了一个SpeechSynthesizer对象并进行语音合成,并使用SynthesizerListener来监听合成的过程和结果。首先,通过调用SpeechSynthesizer的createSynthesizer()方法来创建一个SpeechSynthesizer对象。参数MainActivity.this代表了当前的Activity,而mTtsInitListener是一个初始化监听器,用于监听语音合成引擎初始化的过程。接下来,定义一个SynthesizerListener实例mSynListener,并实现其中的onCompleted()方法。onCompleted()方法是合成完成的回调接口,在会话结束时会被调用。如果error参数为null,则表示合成过程没有错误;否则,可以通过error对象获取错误信息。最后,通过调用mTts的startSpeaking()方法来开始语音合成,接收一个texts参数作为待合成的文本,同时传入mSynListener作为语音合成的监听器。

若接收到用户发送的与该确认提示信息对应的确认信息,例如用户输入包含“确认”的语音信息,则可基于第二字符串拨打调度电话。具体地,若第二语音输入中包括一个被呼叫终端标识,则第二字符串中也包括一个被呼叫终端标识,基于此,可拨打电话以建立当前通讯终端与被呼叫终端之间的通信连接;若第二语音输入中包括多个被呼叫终端标识,则第二字符串中也包括多个被呼叫终端标识,基于此,可同时呼叫多个终端,以实现当前终端与多个被呼叫终端之间的群组电话。

该实施例当用户需要打电话时,在主界面按住屏幕说出“拨打电话”或“打电话”等第一语音输入之后,松开屏幕即可调用语音识别功能,返回识别结果,若结果与软件内置的校验字符串“拨打电话”或“打电话”相同时即可进入语音拨打电话功能。进入语音拨打界面之后,用户可以按住屏幕说出如电话号码等第二语音输入,之后会进行播报确认电话号码是否输入有问题,待确认之后即可进行自动拨打。该实施例只需用户语音输入电话号码,无需手动输入号码并拨打电话,解决了现有方法拨打效率不高,导致沟通效率以及响应速度降低的问题。

进一步地,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种基于语音识别的调度电话拨打方法,如图2所示,在该方法中,响应于第一语音输入请求,接收第一语音输入,并识别第一语音输入得到第一字符串,包括如下步骤:

步骤201,响应于第一语音输入请求,创建语音识别对象,并利用语音识别对象调用预设的语音识别函数;

步骤202,依次接收多个第一语音片段,每接收到一个第一语音片段,就利用语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段;

步骤203,组合多个第一字符串片段,得到第一字符串。

在步骤201-203中,在接收到第一语音输入请求后,首先完成接收第一语音输入的准备工作。具体地,首先创建语音识别对象AAIClient,该对象包括上下文属性、ID属性以及鉴权属性等,可用于调用语音识别函数,其中,语音识别函数是预设的用于识别语音并将语音转换为文字的函数。此后即可接收第一语音输入进而对其进行识别,其中,可采用边接收边识别的方式,具体地,每接收到一段语音也即一个第一语音片段,就执行一次语音识别操作,将其转换为一个字符串也即第一字符串片段。待所有第一语音片段都转换完成,将所有第一字符串片段拼接起来,即得到第一字符串。

该实施例采用了边接收边识别的方式,每接收到一个第一语音片段就识别该语音片段中的内容,同时接收单元不停止工作,仍在继续接收新的第一语音片段。这样的方式能够在接收到语音的同时进行识别,无需等待全部语音输入完成,这可以显著降低语音识别的延迟时间,有效提高了调度电话的拨打效率。

可选地,如图3所示,在另一种基于语音识别的调度电话拨打方法中,利用语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段,包括如下步骤:

步骤301,利用语音识别函数解析当前第一语音片段,得到第一文本片段;

步骤302,拼接第一文本片段、当前第一语音片段对应的接收时刻以及当前第一语音片段对应的编号,得到第一字符串片段,其中,编号用于指示当前第一语音片段在多个第一语音片段中的顺序。

在步骤301-302中,每接收到一个第一语音片段,就实时对其进行识别。具体地,接收第一语音片段的同时记录该第一语音片段对应的编号以及接收时刻,编号用于指示当前第一语音片段是接收到的第几个第一语音片段。然后利用语音识别函数解析接收到的当前第一语音片段,将语音格式的第一语音片段转换为文本格式的第一文本片段。最后将当前第一语音片段转换得到的第一文本片段、当前第一语音片段对应的接收时刻以及对应的编号拼接起来,得到第一字符串片段。

例如,若在20:10:00接收到第三个语音片段“aabb”,则可将“aabb”与“20:10:00”以及“03”组合起来得到第一字符串片段。

如下代码为一个实施例中的分片语音识别成功后调用的代码:

public void onSliceSuccess(AudioRecognizeRequest request,

AudioRecognizeResult result,intseq){

if(dontHaveResult&&!TextUtils.isEmpty(result.

getText())){dontHaveResult=false;

Date date=new Date();

DateFormat format=new SimpleDateFormat

("yyyy-MM-ddHH:mm:ss:SSS");

String time=format.format(date);

String message=String.format("voice flow order=%d,receive firstresponse in%s,result is=%s",seq,time,result.getText());Log.i(PERFORMANCE_TAG,message);}

AAILogger.info(logger,"分片on slice success..");

AAILogger.info(logger,"分片slice seq={},voi ceid={},result={}",seq,result.getVoiceId(),result.getText());

resMap.put(String.valueOf(seq),result.getText());final String msg=buildMessage(resMap);AAILogger.info(logger,"分片slice msg="+msg);

handler.post(new Runnable()

{@Override

public void run(){

recognizeResult.setText(msg);

}

});

}

具体地,上述代码定义了一个方法onSliceSuccess(),该方法接收三个参数:一个AudioRecognizeRequest对象request、一个AudioRecognizeResult对象result,以及一个整型变量seq。在if语句的条件中,使用了逻辑运算符"&&",判断dontHaveResult为true且result.getText()不为空,则进入条件中的代码块。在if条件满足时,创建了一个Date对象date,并定义了一个DateFormat对象format,用于格式化时间的显示。使用format对象将当前时间date格式化为字符串形式,存储在字符串变量time中。使用String.format()方法,将seq、time和result.getText()等信息组合成一个字符串message,用于记录日志或输出调试信息。调用Log.i()方法,将message作为日志信息输出。调用AAILogger.info()方法,使用logger记录分片成功的日志信息。使用resMap集合,将seq作为键、result.getText()作为值存储。调用buildMessage()方法,根据resMap构建一个消息字符串msg。使用handler.post()方法,将显示msg的任务添加到主线程的消息队列中,以更新识别结果。

相应地,如图4所示,组合第一字符串片段,得到第一字符串,包括如下步骤:

步骤401,按照编号依次排列多个第一字符串片段,并根据多个第一字符串片段中的接收时刻的先后顺序校验第一字符串的排列顺序;

步骤402,若校验通过,则提取每个第一字符串片段中的第一文本片段,并按照编号依次拼接第一文本片段,得到第一字符串片段。

在步骤401-402中,由于在语音识别过程中,采用了边接收边识别,分片识别并转换为文本的方式,因此,转换结果为多个第一字符串片段。在转换之后,按顺序组合第一字符串片段,才能得到完整的第一字符串。

具体地,由于每个第一语音片段的编号标识该第一语音片段的接收次序,因此可按照编号依次排列所有第一字符串片段,此时第一字符串片段的排列顺序就是第一语音片段的接收顺序。此后,根据第一字符串片段的接收时刻校验第一字符串片段的排列顺序是否正确,若校验通过则认为排列属性正确,提取出每个第一字符串片段中的第一文本片段,并按照校验过的排列顺序进行拼接,得到完整的只包含文本内容的第一字符串片段。

可选地,在另一种基于语音识别的调度电话拨打方法中,第一语音输入请求为基于呼叫终端的触摸事件;

相应地,响应于第一语音输入请求,创建语音识别对象,包括:

响应于基于呼叫终端的触摸事件,创建语音识别对象,并持续检测触摸事件;

组合多个第一字符串片段,包括:

若检测到触摸事件结束,则确定第一语音输入完成,组合多个第一字符串片段。

在该实施例中,第一语音输入请求为基于呼叫终端的触摸事件,例如,对通讯终端的屏幕施加触摸事件。在监测到用户在通讯终端的屏幕施加了触摸事件,即认为用户请求发出第一语音输入,基于此,创建语音识别对象以接收并识别第一语音输入,在此过程中持续检测触摸事件的状态。若检测到触摸事件在持续进行状态,则认为用户在输入第一语音输入;若检测到触摸事件结束,也即用户不再对通讯终端的屏幕施加触摸事件,则认为第一语音输入完成,因此,可认为此时已获得了所有的第一语音片段,可执行第一字符串片段的组合操作。

例如,用户按住屏幕说“请拨打电”,然后松开屏幕说“话”,则在监测到用户按住屏幕时,即开始接收用户输入的语音并边接收边将其识别为文本格式的字符串片段,同时持续检测用户是否始终按住屏幕。若检测到用户松开屏幕,则确认语音输入结束,此时,将字符串片段按接收顺序组合起来,得到“请拨打电”,而“话”并未被接收。

可选地,在另一种基于语音识别的调度电话拨打方法中,校验字符串为至少一个;

相应地,如图5所示,若第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,包括如下步骤:

步骤501,确定校验字符串的格式为目标格式,并将第一字符串转换至目标格式;

步骤502,依次比较第一字符串与每个校验字符串,若第一字符串与任一校验字符串相同,则确定匹配结果满足校验条件。

在步骤501-502中,校验字符串数量可以为多个,例如,可以为“拨打电话”、“请拨打电话”、“请打电话”、“打电话”、“语音通话”等。在第一字符串与校验字符串的匹配过程中,依次比较第一字符串与每个校验字符串是否相同,若第一字符串与任一个校验字符串相同,则确定匹配结果满足校验条件,也即用户有打电话的需求;若第一字符串与每个校验字符串均不相同,则确定匹配结果不满足校验条件,也即用户并没有打电话的需求。

此外,在将第一语音输入转换为第一字符串时,可调用预设云服务系统提供的语音识别功能,在预设云服务系统中完成语音的识别以及语音到文字的格式转换。由于预设云服务系统转换得到的第一字符串格式与预设的校验字符串的格式可能不同,例如,第一字符串可能为json字符串,而校验字符串可能为普通字符串。因此,首先要对第一字符串进行格式转换,将其转换至校验字符串对应的目标格式,然后再进行匹配。

可选地,在另一种基于语音识别的调度电话拨打方法中,被呼叫终端标识为被呼叫终端对应的电话号码或被呼叫终端对应的联系人标识;

相应地,如图6所示,基于第二字符串拨打电话,包括如下步骤:

步骤601,若第二语音输入包括多个被呼叫终端标识,且被呼叫终端标识为电话号码,则根据预设的电话号码长度,将第二字符串切分成多个电话号码,并基于多个电话号码拨打群组电话;

步骤602,若第二语音输入包括多个被呼叫终端标识,且被呼叫终端标识为联系人标识,则基于第二语音输入中的至少一个静默时段,确定联系人标识分割位置;

步骤603,基于联系人标识分割位置,将第二字符串切分成多个联系人标识,并基于多个联系人标识拨打群组电话。

在步骤601-603中,若第二语音输入请求包括多个被呼叫终端标识,则用户请求同时连线多个被呼叫终端,也即拨打群组电话。基于此,要从用户输入的第二语音输入中提取出多个被呼叫终端标识。

在具体应用过程中,可根据被呼叫终端标识类型,采取不同的提取方式。若被呼叫终端标识为电话号码,由于电话号码通常有特定长度,因此可根据电话号码长度切分第二字符串,得到多个电话号码。例如,某内网电话均为4位,若第二字符串为238323052367,则可将其切分成如下三个电话号码“2383”、“2305”以及“2367”。此后即可同时给这三个电话号码拨打电话,以实现群组电话的自动拨号。

若被呼叫终端标识为联系人标识,如联系人姓名,由于联系人姓名可为两个字,也可为三个字或四个字等,因此不适用于按照长度切分第二字符串的方式。此时可基于第二语音输入中的静默时段确定联系人标识的分割位置。例如,用户按住屏幕说“张三”,之后静默1秒再说“李四”,则可根据用户静默的位置,将第二字符串“张三李四”切分成“张三”、“李四”两个联系人姓名。此后即可同时给这两个联系人拨打电话,以实现群组电话的自动拨号。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

进一步地,作为上述基于语音识别的调度电话拨打方法的具体实现,本申请实施例提供了一种基于语音识别的调度电话拨打装置,如图7所示,该装置包括:呼叫请求接收模块、呼叫请求校验模块、被呼终端信息接收模块、被呼终端信息确认模块以及呼叫模块。

呼叫请求接收模块,用于响应于第一语音输入请求,接收第一语音输入,并识别第一语音输入得到第一字符串;

呼叫请求校验模块,用于若第一字符串与预设的校验字符串之间的匹配结果满足校验条件,则显示电话拨打界面,其中,检验字符串包含请求拨打电话的语义信息;

被呼终端信息接收模块,用于响应于用户在电话拨打界面输入的第二语音输入请求,接收第二语音输入,其中,第二语音输入包括一个或多个被呼叫终端标识;

被呼终端信息确认模块,用于识别第二语音输入得到第二字符串,生成与第二字符串对应的确认提示信息,并播报确认提示信息,其中,确认提示信息为语音类型的信息;

呼叫模块,用于若接收到与确认提示信息对应的确认信息,则基于第二字符串拨打调度电话,以呼叫被呼叫终端标识对应的终端。

在具体的应用场景中,可选地,呼叫请求接收模块用于:

响应于第一语音输入请求,创建语音识别对象,并利用语音识别对象调用预设的语音识别函数;

依次接收多个第一语音片段,每接收到一个第一语音片段,就利用语音识别函数识别接收到的当前第一语音片段,得到第一字符串片段;

组合多个第一字符串片段,得到第一字符串。

在具体的应用场景中,可选地,呼叫请求接收模块用于:

利用语音识别函数解析当前第一语音片段,得到第一文本片段;

拼接第一文本片段、当前第一语音片段对应的接收时刻以及当前第一语音片段对应的编号,得到第一字符串片段,其中,编号用于指示当前第一语音片段在多个第一语音片段中的顺序;

相应地,组合第一字符串片段,得到第一字符串,包括:

按照编号依次排列多个第一字符串片段,并根据多个第一字符串片段中的接收时刻的先后顺序校验第一字符串的排列顺序;

若校验通过,则提取每个第一字符串片段中的第一文本片段,并按照编号依次拼接第一文本片段,得到第一字符串。

在具体的应用场景中,可选地,第一语音输入请求为基于呼叫终端的触摸事件;

相应地,呼叫请求接收模块用于:

响应于基于呼叫终端的触摸事件,创建语音识别对象,并持续检测触摸事件;

以及,若检测到触摸事件结束,则确定第一语音输入完成,组合多个第一字符串片段。

在具体的应用场景中,可选地,校验字符串为至少一个;

相应地,呼叫请求校验模块用于:

确定校验字符串的格式为目标格式,并将第一字符串转换至目标格式;

依次比较第一字符串与每个校验字符串,若第一字符串与任一校验字符串相同,则确定匹配结果满足校验条件。

在具体的应用场景中,可选地,被呼叫终端标识为被呼叫终端对应的电话号码或被呼叫终端对应的联系人标识;

相应地,呼叫模块用于:

若第二语音输入包括多个被呼叫终端标识,且被呼叫终端标识为电话号码,则根据预设的电话号码长度,将第二字符串切分成多个电话号码,并基于多个电话号码拨打群组电话。

在具体的应用场景中,可选地,呼叫模块用于:

若第二语音输入包括多个被呼叫终端标识,且被呼叫终端标识为联系人标识,则基于第二语音输入中的至少一个静默时段,确定联系人标识分割位置;

基于联系人标识分割位置,将第二字符串切分成多个联系人标识,并基于多个联系人标识拨打群组电话。

根据本申请又一个方面,提供了一种介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现上述基于语音识别的调度电话拨打方法。

需要说明的是,本申请实施例提供的一种基于语音识别的调度电话拨打装置所涉及各功能模块的其他相应描述,可以参考上述方法中的对应描述,在此不再赘述。

基于上述方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述基于语音识别的调度电话拨打方法。

基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。

基于上述如图1至图6所示的方法,以及图7所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种设备,具体可以为个人计算机、服务器、网络设备等,该电子设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图6所示的基于语音识别的调度电话拨打方法。

可选地,该电子设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。

本领域技术人员可以理解,本实施例提供的一种电子设备结构并不构成对该电子设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。

存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存电子设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各控件之间的通信,以及与该实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。

本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的单元或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的单元可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的单元可以合并为一个单元,也可以进一步拆分成多个子单元。

上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

相关技术
  • 基于语音识别的销售订单获取方法、装置、设备及介质
  • 一种语音识别方法、装置、设备及介质
  • 实时语音识别方法、装置、设备及存储介质
  • 一种语音识别方法及装置、设备、介质
  • 语音识别方法、装置、计算机设备及存储介质
  • 基于穿戴式设备的拨打电话方法、装置、设备及存储介质
  • 基于网络电话系统的机器人调度方法、装置、设备及介质
技术分类

06120116490955