掌桥专利:专业的专利平台
掌桥专利
首页

处理方法、移动终端及存储介质

文献发布时间:2023-06-19 12:21:13


处理方法、移动终端及存储介质

技术领域

本申请涉及计算机技术领域,具体涉及一种处理方法、移动终端及存储介质。

背景技术

从文本到语音(Text To Speech,TTS)播报技术是指将文本内容转化为音频内容并播放出来的技术,被广泛应用于不适合或无法通过视觉获取信息的场景。TTS播报技术可以对文本内容进行实时转换,在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。

一些实现中,为了提升语音播报的用户体验,可以对TTS语音播报的表达方式进行更改,如男声、女声、地方语言等。在构思及实现本申请过程中,发明人发现至少存在如下问题:还未出现对TTS语音播报的语速进行调节的相关应用,影响到用户体验。

前面的叙述在于提供一般的背景信息,并不一定构成现有技术。

发明内容

针对上述技术问题,本申请提供一种处理方法、移动终端及存储介质,可以实现语音播报的语速调节的自动化和智能化。

为解决上述技术问题,本申请提供一种处理方法,应用于移动终端,包括:

获取目标语速等级;

控制人机交互应用按照该目标语速等级进行语音播报。

可选地,该获取目标语速等级,包括:获取用户设定的语速等级,将该用户设定的语速等级作为目标语速等级。

可选地,该获取用户设定的语速等级,包括:显示语速调节界面,该语速调节界面包括至少一个语速等级选项;在检测到针对该至少一个语速等级选项的选择操作时,将该选择操作所选中的语速等级选项所对应的语速等级确定为用户设定的语速等级。

可选地,该获取用户设定的语速等级,包括:显示语速调节界面,该语速调节界面包括语速调节滑动条;根据针对该语速调节滑动条的滑动操作,确定为用户设定的语速等级。

可选地,该获取目标语速等级,包括:当检测到语速智能调节功能开启时,根据获取的语速调节参考参数确定目标语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的年龄参数;根据该年龄参数确定目标语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取待播报语音的文本信息,可选地,该文本信息包括以下情况中的任意一种或多种:文本长度、文本关键词、文本内容;根据该文本信息确定目标语速等级;可选地,该目标语速等级为一个或多个语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的情绪状态;根据该用户的情绪状态确定目标语速等级。

可选地,该获取用户的情绪状态,包括:获取人机交互过程中用户的语音信息;根据该用户的语音信息确定该用户的情绪状态。

可选地,该获取用户的情绪状态,包括:获取人机交互过程中用户的脸部图像数据;根据该用户的脸部图像数据确定该用户的情绪状态。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中的环境参数;根据该环境参数确定目标语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,进一步包括:根据语速调节参考参数对待播报内容进行处理。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中用户的语音的语速等级;根据该用户的语音的语速等级确定目标语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的多媒体喜好信息;根据该用户的多媒体喜好信息确定目标语速等级。

可选地,该根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中用户的语音信息,判断是否为目标用户,若是,则确定该目标用户对应的预设语速等级为所述目标语速等级。

可选地,该方法还包括:若在人机交互过程中检测到用户语音输入的语速调节指令,则按照该语速调节指令对人机交互应用进行语音播报的语速等级进行调整;可选地,该语速调节指令用于指示将语速等级降低或者提高。

本申请还提供一种语音调节装置,该装置包括获取单元和控制单元,其中:该获取单元,用于获取目标语速等级;该控制单元,用于控制人机交互应用按照该目标语速等级进行语音播报。

本申请还提供一种移动终端,包括:存储器、处理器,其中,该存储器上存储有处理程序,该处理程序被该处理器执行时实现如上任一所述方法的步骤。

本申请还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如上任一所述方法的步骤。

如上所述,本申请的处理方法中,通过获取目标语速等级,并控制人机交互应用按照该目标语速等级进行语音播报,从而可以实现语音播报的语速调节的自动化和智能化。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是实现本申请各个实施例的一种移动终端的硬件结构示意图;

图2是本申请实施例提供的一种通信网络系统架构图;

图3是根据第一实施例示出的一种处理方法的流程示意图;

图4是根据第二实施例示出的另一种处理方法的流程示意图;

图5是根据第二实施例示出的一种语速调节界面的示意图;

图6是根据第二实施例示出的另一种语速调节界面的示意图;

图7是根据第三实施例示出的又一种处理方法的流程示意图;

图8是根据第三实施例示出的一种消息提示的示意图;

图9是根据本申请实施例提供的一种语音调节装置的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。

应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本申请使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的,或意味着任一个或任何组合。例如,“包括以下至少一个:A、B、C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”,再如,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A和B和C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。

应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

需要说明的是,在本文中,采用了诸如S301、S302等步骤代号,其目的是为了更清楚简要地表述相应内容,不构成顺序上的实质性限制,本领域技术人员在具体实施时,可能会先执行S301后执行S302等,但这些均应在本申请的保护范围之内。

应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。

移动终端可以以各种形式来实施。例如,本申请中描述的移动终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、导航装置、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。

后续描述中将以移动终端为例进行说明,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本申请的实施方式的构造也能够应用于固定类型的终端。

请参阅图1,其为实现本申请各个实施例的一种移动终端的硬件结构示意图,该移动终端100可以包括:RF(Radio Frequency,射频)单元101、WiFi模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解,图1中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图1对移动终端的各个部件进行具体的介绍:

射频单元101可用于收发信息或通话过程中,信号的接收和发送,可选地,将基站的下行信息接收后,给处理器110处理;可选地,将上行的数据发送给基站。通常,射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于GSM(Global System of Mobile communication,全球移动通讯系统)、GPRS(General Packet Radio Service,通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000,码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access,时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution,频分双工长期演进)和TDD-LTE(Time DivisionDuplexing-Long Term Evolution,分时双工长期演进)等。

WiFi属于短距离无线传输技术,移动终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102,但是可以理解的是,其并不属于移动终端的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

音频输出单元103可以在移动终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将射频单元101或WiFi模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元103还可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元103可以包括扬声器、蜂鸣器等等。

A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

移动终端100还包括至少一种传感器105,比如光传感器、运动传感器以及其他传感器。可选地,光传感器包括环境光传感器及接近传感器,可选地,环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度,接近传感器可在移动终端100移动到耳边时,关闭显示面板1061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元106可包括显示面板1061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1061。

用户输入单元107可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。可选地,用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作),并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。可选地,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器110,并能接收处理器110发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071,用户输入单元107还可以包括其他输入设备1072。可选地,其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种,具体此处不做限定。

可选地,触控面板1071可覆盖显示面板1061,当触控面板1071检测到在其上或附近的触摸操作后,传送给处理器110以确定触摸事件的类型,随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中,触控面板1071与显示面板1061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板1071与显示面板1061集成而实现移动终端的输入和输出功能,具体此处不做限定。

接口单元108用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端100和外部装置之间传输数据。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区,可选地,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器109可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器109内的软件程序和/或模块,以及调用存储在存储器109内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器110可包括一个或多个处理单元;优选的,处理器110可集成应用处理器和调制解调处理器,可选地,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。

移动终端100还可以包括给各个部件供电的电源111(比如电池),优选的,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图1未示出,移动终端100还可以包括蓝牙模块等,在此不再赘述。

为了便于理解本申请实施例,下面对本申请的移动终端所基于的通信网络系统进行描述。

请参阅图2,图2为本申请实施例提供的一种通信网络系统架构图,该通信网络系统为通用移动通信技术的LTE系统,该LTE系统包括依次通讯连接的UE(User Equipment,用户设备)201,E-UTRAN(Evolved UMTS Terrestrial Radio Access Network,演进式UMTS陆地无线接入网)202,EPC(Evolved Packet Core,演进式分组核心网)203和运营商的IP业务204。

可选地,UE201可以是上述移动终端100,此处不再赘述。

E-UTRAN202包括eNodeB2021和其它eNodeB2022等。可选地,eNodeB2021可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接,eNodeB2021连接到EPC203,eNodeB2021可以提供UE201到EPC203的接入。

EPC203可以包括MME(Mobility Management Entity,移动性管理实体)2031,HSS(Home Subscriber Server,归属用户服务器)2032,其它MME2033,SGW(Serving Gate Way,服务网关)2034,PGW(PDN Gate Way,分组数据网络网关)2035和PCRF(Policy andCharging Rules Function,政策和资费功能实体)2036等。可选地,MME2031是处理UE201和EPC203之间信令的控制节点,提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能,并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送,PGW2035可以提供UE 201的IP地址分配以及其它功能,PCRF2036是业务数据流和IP承载资源的策略与计费控制策略决策点,它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。

IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem,IP多媒体子系统)或其它IP业务等。

虽然上述以LTE系统为例进行了介绍,但本领域技术人员应当知晓,本申请不仅仅适用于LTE系统,也可以适用于其他无线通信系统,例如GSM、CDMA2000、WCDMA、TD-SCDMA以及未来新的网络系统等,此处不做限定。

为了更好地理解本申请实施例,介绍了上述移动终端硬件结构以及通信网络系统,现在提出本申请各个实施例。

下面对本申请实施例提供的处理方法、移动终端及存储介质进一步进行详细描述。请参见图3,图3是根据第一实施例示出的一种处理方法的流程示意图。图3所示的处理方法包括S301~S302。本申请实施例的该方法可以由图1所示的移动终端来执行,也可以由该移动终端中的芯片来执行,该移动终端可以应用于图2所示的通信网络系统。图3所示的方法执行主体以移动终端为例。其中:

S301、获取目标语速等级。

本申请实施例中,该目标语速等级可以采用不同的方式进行确定。示例性的,该目标语速等级可以由用户自行设定,也可以在语速智能调节功能开启的情况下,根据语速调节参考参数进行设定。可选地,语速调节参考参数可以是用户年龄参数、待播报语音的文本信息、用户的情绪状态、人机交互过程中的环境参数,等等。基于该方式,可以实现对语音播报的语速的调节。

需要说明的是,该目标语速等级可以是在人机交互之前进行设定,也可以是在人机交互的过程中进行设定,在此不作限定。

S302、控制人机交互应用按照该目标语速等级进行语音播报。

本申请实施例中,移动终端控制人机交互应用按照该目标语速等级生成待播报语音的音频信息,然后对该音频信息进行播报。基于该方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

在图3所描述的方法中,通过获取目标语速等级,并控制人机交互应用按照该目标语速等级进行语音播报。因此,基于图3所描述的方法,可以实现语音播报的语速调节的自动化和智能化。

请参见图4,图4是根据第二实施例示出的另一种处理方法的流程示意图。图4所示的处理方法包括S401~S403。本申请实施例的该方法可以由图1所示的移动终端来执行,也可以由该移动终端中的芯片来执行,该移动终端可以应用于图2所示的通信网络系统。图4所示的方法执行主体以移动终端为例。其中:

S401、获取用户设定的语速等级。

可选地,移动终端获取用户设定的语速等级,包括:显示语速调节界面,该语速调节界面包括至少一个语速等级选项;在检测到针对该至少一个语速等级选项的选择操作时,将该选择操作所选中的语速等级选项所对应的语速等级确定为用户设定的语速等级。

例如,如图5所示,示出了本申请实施例提供的一种语速调节界面,该语速调节界面中包括三个语速等级选项、一个智能调节的选项、一个确定选项和一个取消选项,可选地,三个语速等级选项分别是较快、正常和较慢。当移动终端检测到用户针对这三个语速等级选项的点击操作,并且检测到对确定选项的点击操作时,将该点击操作所选中的语速等级选项所对应的语速等级确定为用户设定的语速等级;当移动终端检测到对取消选项的点击操作时,则退出该语速调节界面。例如,语速等级共划分为10个等级,较快的语速等级选项对应的语速等级为8,正常的语速等级选项对应的语速等级为5,较慢的语速等级选项对应的语速等级为3。移动终端检测到用户对正常的语速等级选项进行了点击操作,正常的语速等级选项对应的语速等级为5,因此确定用户设定的语速等级为5。

可选地,当移动终端检测到用户对智能调节的选项进行了选择操作时,移动终端开启语速智能调节功能,具体实现方式请参考图7所示的方法,在此不作赘述。

可选地,移动终端获取用户设定的语速等级,包括:显示语速调节界面,该语速调节界面包括语速调节滑动条;根据针对该语速调节滑动条的滑动操作,确定为用户设定的语速等级。

例如,如图6所示,示出了本申请实施例提供的一种语速调节界面,该语速调节界面中包括一个语速调节滑动条、一个智能调节的选项、一个确定选项和一个取消选项,可选地,语速调节滑动条从左到右滑动表示语速从慢到快,语速调节滑动条滑动到的不同位置对应不同的语速等级,滑动到中间位置表示正常语速。当移动终端根据针对该语速调节滑动条的滑动操作,并且检测到对确定选项的点击操作时,将滑动到的位置所对应的语速等级确定为用户设定的语速等级;当移动终端检测到对取消选项的点击操作时,则退出该语速调节界面。例如,语速等级共划分为10个等级,移动终端检测到针对该语速调节滑动条的滑动操作,此时滑动到的位置所对应的语速等级为7,因此确定用户设定的语速等级为7。

可选地,当移动终端检测到用户对智能调节的选项进行了选择操作时,移动终端开启语速智能调节功能,具体实现方式请参考图7所示的方法,在此不作赘述。

S402、将该用户设定的语速等级作为目标语速等级。

本申请实施例中,用户自行设定语音播报的语速等级,有利于解决用户对语音播报语速的接受程度存在差异的问题,同时也能够更加快速地调节播报语速。

S403、控制人机交互应用按照该目标语速等级进行语音播报。

可选地,S403的具体实现方式与上述S302的具体实现方式相同,在此不赘述。

在图4所描述的方法中,人机交互应用按照获取的目标语速等级进行语音播报,可选地,目标语速等级由用户自行设定。因此,基于图4所描述的方法,可以实现语音播报的语速调节的自动化和智能化。

请参见图7,图7是根据第三实施例示出的又一种处理方法的流程示意图。图7所示的处理方法包括S701~S703。本申请实施例的该方法可以由图1所示的移动终端来执行,也可以由该移动终端中的芯片来执行,该移动终端可以应用于图2所示的通信网络系统。图7所示的方法执行主体以移动终端为例。其中:

S701、当检测到语速智能调节功能开启时,根据获取的语速调节参考参数确定目标语速等级。

本申请实施例中,用户启动语速智能调节功能,有利于解决用户对语音播报语速的接受程度存在差异的问题,同时也能够更加便捷地调节播报语速。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的年龄参数,根据该年龄参数确定目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,语速等级共划分为10个等级,若年龄参数在12岁及12岁以下,则语速等级设定为3级;若年龄参数在13岁至30岁,则语速等级设定为6级;若年龄参数在31岁至50岁,则语速等级设定为5级;若年龄参数在50岁以上,则语速等级设定为2级。此时,获取到的用户的年龄参数为23岁,23岁对应的语速等级设定为6级,因此确定目标语速等级为6。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取待播报语音的文本信息,该文本信息包括以下情况中的任意一种或多种:文本长度、文本关键词、文本内容;根据该文本信息确定目标语速等级;可选地,该目标语速等级为一个或多个语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,获取到的待播报语音的文本信息为文本长度,当文本长度超过预设阈值时,移动终端可以提高语速等级。假设语速等级共划分为10个等级,当前的语速等级为5,文本长度的预设阈值为500字,此时获取到的待播报语音的文本长度为600字,超过了文本长度的预设阈值,因此将语速等级提高到7级,确定目标语速等级为7。

又例如,获取到的待播报语音的文本信息为文本关键词,文本关键词出现后,移动终端可以降低或者提高语速等级。假设语速等级共划分为10个等级,文本关键词为“但是”,文本关键词出现之前的语速等级为6,文本关键词出现后的语速等级降低为4,因此,该目标语速等级为两个语速等级。

又例如,获取到的待播报语音的文本信息为文本内容,当文本内容为特殊信息时,移动终端可以降低语速等级;当文本内容为一般信息时可以提高语速等级;当文本内容为科普知识或者返回查询的结果时可以降低语速等级。假设语速等级共划分为10个等级,当前的语速等级为5,若文本内容为今天有暴雨,则将语速等级降低为4;若文本内容为今天天气晴朗,则将语速等级提高为6;若文本内容为科普知识,则将语速等级降低为4。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的情绪状态;根据该用户的情绪状态确定目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,当获取到的用户的情绪状态为悲伤时,移动终端可以降低语速等级;当获取到的用户的情绪状态为快乐时,移动终端可以提高语速等级。假设语速等级共划分为10个等级,当前的语速等级为5,当获取到的用户的情绪状态为悲伤时,将语速等级降低为4;当获取到的用户的情绪状态为快乐时,将语速等级提高为6。

可选地,移动终端获取用户的情绪状态,包括:获取人机交互过程中用户的语音信息;根据该用户的语音信息确定该用户的情绪状态。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,人机交互过程中用户的语音信息为“今天的任务又没有完成”,根据该用户的语音信息可以确定出该用户的情绪状态为悲伤。

可选地,移动终端获取用户的情绪状态,包括:获取人机交互过程中用户的脸部图像数据;根据该用户的脸部图像数据确定该用户的情绪状态。

例如,人机交互过程中用户的脸部图像是开心的表情,根据该用户的脸部图像数据可以确定出该用户的情绪状态为快乐。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中的环境参数;根据该环境参数确定目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,当人机交互过程中的环境参数表示为嘈杂环境时,移动终端可以降低语速等级;当人机交互过程中的环境参数表示为安静环境时,移动终端可以提高语速等级。假设语速等级共划分为10个等级,当前的语速等级为5,当人机交互过程中的环境参数表示为嘈杂环境时,将语速等级降低为4;当人机交互过程中的环境参数表示为安静环境时,将语速等级提高为6。

可选地,移动终端可以根据人机交互过程中的环境参数提高或降低音量。例如,当人机交互过程中的环境参数表示为嘈杂环境时,可以提高音量;当人机交互过程中的环境参数表示为安静环境时,可以降低音量。

可选地,上述环境参数还可以是时间和/或地点参数,例如,若在家里和/或夜晚,可以降低音量,若在户外和/或白天,可以提高音量。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,进一步包括:根据语速调节参考参数对待播报内容进行处理。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,当获取到用户处于急躁状态时,移动终端可以提高语速等级,和/或进一步确定重点内容,只对该重点内容进行播报。假设语速等级共划分为10个等级,当前的语速等级为5,当获取到用户处于急躁状态时,将语速等级提高为6,还可进一步确定待播报内容中的重点内容,只对该重点内容进行播报。

又例如,当获取到用户处于悠闲轻松状态时,移动终端可以降低语速等级,和/或进一步确定重点内容,只对该重点内容进行播报。假设语速等级共划分为10个等级,当前的语速等级为5,当获取到用户处于悠闲轻松状态时,将语速等级降低为4,还可进一步确定待播报内容中的重点内容,只对该重点内容进行播报。

可选地,移动终端可以对待播报内容中的次要内容进行显示而不进行播报。

可选地,移动终端可以在对待播报内容中的主要内容进行播报时提高音量。

可选地,上述确定重点内容的方式,可以是根据用户习惯或者大数据分析,也可以是用户设定(如根据设定关键词,确定该关键词所在行或段落等为重点内容)或用户选择(如通过触控操作)等。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中用户的语音的语速等级;根据该用户的语音的语速等级确定目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,当人机交互过程中用户的语音的语速等级属于较快语速时,移动终端可以提高语速等级;当人机交互过程中用户的语音的语速等级属于较慢语速时,移动终端可以降低语速等级。假设语速等级共划分为10个等级,语速等级为1到4时,表示较慢语速;语速等级为5时,表示正常语速;语速等级为6到10时,表示较快语速。当前的语速等级为5,获取到的人机交互过程中用户的语音的语速等级为7,因此可以将语速等级提高为6,确定目标语速等级为6。

可选地,移动终端将人机交互过程中用户的语音的语速等级确定为目标语速等级。例如,获取到的人机交互过程中用户的语音的语速等级为6,则将目标语速等级设置为6。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取用户的多媒体喜好信息;根据该用户的多媒体喜好信息确定目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,当用户的多媒体喜好信息为电子摇滚音乐、热血视频、搞笑视频时,移动终端可以提高语速等级;当用户的多媒体喜好信息为轻音乐、慢节奏的视频时,移动终端可以降低语速等级。假设语速等级共划分为10个等级,语速等级为1到4时,表示较慢语速;语速等级为5时,表示正常语速;语速等级为6到10时,表示较快语速。获取到的用户的多媒体喜好信息为电子摇滚音乐时,将目标语速等级确定为7;获取到的用户的多媒体喜好信息为轻音乐时,将目标语速等级确定为4。

可选地,用户的多媒体喜好信息,可以是由用户设定,或者根据用户使用习惯和/或大数据分析获得。

可选地,移动终端根据获取的语速调节参考参数确定目标语速等级,包括:获取人机交互过程中用户的语音信息,判断是否为目标用户,若是,则确定该目标用户对应的预设语速等级为目标语速等级。基于该可能的实现方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

例如,假设对目标用户A预设的语速等级为6,在人机交互过程中,获取用户的语音信息,移动终端根据该语音信息确定该用户是否是目标用户A。如果该用户是目标用户A,则将该目标用户对应的预设语速等级确定为目标语速等级,即目标语速等级为6。

S702、控制人机交互应用按照该目标语速等级进行语音播报。

可选地,S702的具体实现方式与上述S302的具体实现方式相同,在此不赘述。

S703、若在人机交互过程中检测到用户语音输入的语速调节指令,则按照该语速调节指令对人机交互应用进行语音播报的语速等级进行调整。

本申请实施例中,该语速调节指令用于指示将语速等级降低或者提高。基于该可能的实现方式,有利于提高用户体验。例如,在人机交互过程中检测到用户语音输入的语速调节指令为将语速等级降低,因此移动终端将人机交互应用进行语音播报的语速等级降低。

可选地,若在预设时间内,多次采用该目标语速等级对同一播报内容进行语音播报,则移动终端提示用户是否需要将语速等级降低或者提高。在预设时间内,多次采用该目标语速等级对同一播报内容进行语音播报,可能表示用户没有听清楚播报内容或者表示用户喜欢该播报内容,因此移动终端可以提示用户是否需要将语速等级降低或者提高。需要说明的是,预设时间可以设定为任意时间,在此不作限定。提示可以是采用语音提示,也可以采用在界面中输出提示信息的方式进行提示。

如图8所示,移动终端采用在界面中输出提示信息的方式进行提示。例如,在10分钟内,移动终端检测到多次采用该目标语速等级对同一播报内容进行语音播报,则移动终端在显示屏上显示诸如图8所示的消息提示框,该消息提示框包括“提高语速选项”和“降低语速选项”;根据用户针对该两个选项的选择操作确定是提高语音播报的语速,还是降低语音播报的语速。

可选地,若在预设时间内,多次采用该目标语速等级对同一播报内容进行语音播报,则移动终端将语速等级降低,并提高播报音量。在预设时间内,多次采用该目标语速等级对同一播报内容进行语音播报,可能表示用户没有听清楚播报内容,因此可以降低播报语速等级,并提高播报音量。基于该方式,可以实现语音播报的语速调节的自动化和智能化,有利于提高用户体验。

在图7所描述的方法中,人机交互应用按照获取的目标语速等级进行语音播报,可选地,目标语速等级是在语速智能调节功能开启的情况下,根据语速调节参考参数进行确定。因此,基于图7所描述的方法,可以实现语音播报的语速调节的自动化和智能化。

请参见图9,图9是本申请实施例提供的一种语音调节装置的结构示意图。该装置90包括获取单元901和控制单元902,其中:

获取单元901,用于获取目标语速等级。可选地,该获取单元901所执行的操作可以参照上述图3所示方法中的S301中的介绍。

控制单元902,用于控制人机交互应用按照该目标语速等级进行语音播报。可选地,该控制单元902所执行的操作可以参照上述图3所示方法中的S302中的介绍。

在一些实施例中,该获取单元901,在获取目标语速等级时,具体用于:获取用户设定的语速等级,将该用户设定的语速等级作为目标语速等级。

在一些实施例中,该获取单元901,在获取用户设定的语速等级时,具体用于:显示语速调节界面,该语速调节界面包括至少一个语速等级选项;在检测到针对该至少一个语速等级选项的选择操作时,将该选择操作所选中的语速等级选项所对应的语速等级确定为用户设定的语速等级。

在一些实施例中,该获取单元901,在获取用户设定的语速等级时,具体用于:显示语速调节界面,该语速调节界面包括语速调节滑动条;根据针对该语速调节滑动条的滑动操作,确定为用户设定的语速等级。

在一些实施例中,该获取单元901,在获取目标语速等级时,具体用于:当检测到语速智能调节功能开启时,根据获取的语速调节参考参数确定目标语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取用户的年龄参数;根据该年龄参数确定目标语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取待播报语音的文本信息,可选地,该文本信息包括以下情况中的任意一种或多种:文本长度、文本关键词、文本内容;根据该文本信息确定目标语速等级;可选地,该目标语速等级为一个或多个语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取用户的情绪状态;根据该用户的情绪状态确定目标语速等级。

在一些实施例中,该获取单元901,在获取用户的情绪状态时,具体用于:获取人机交互过程中用户的语音信息;根据该用户的语音信息确定该用户的情绪状态。

在一些实施例中,该获取单元901,在获取用户的情绪状态时,具体用于:获取人机交互过程中用户的脸部图像数据;根据该用户的脸部图像数据确定该用户的情绪状态。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取人机交互过程中的环境参数;根据该环境参数确定目标语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,进一步用于:根据语速调节参考参数对待播报内容进行处理。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取人机交互过程中用户的语音的语速等级;根据该用户的语音的语速等级确定目标语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取用户的多媒体喜好信息;根据该用户的多媒体喜好信息确定目标语速等级。

在一些实施例中,该获取单元901,在根据获取的语速调节参考参数确定目标语速等级时,具体用于:获取人机交互过程中用户的语音信息,判断是否为目标用户,若是,则确定该目标用户对应的预设语速等级为目标语速等级。

在一些实施例中,该装置还包括调整单元,该调整单元用于:若在人机交互过程中检测到用户语音输入的语速调节指令,则按照该语速调节指令对人机交互应用进行语音播报的语速等级进行调整;可选地,该语速调节指令用于指示将语速等级降低或者提高。

需要说明的是,图9所示的装置的各个单元执行的操作可以上述方法实施例的相关内容。此处不再详述。上述各个单元可以以硬件,软件或者软硬件结合的方式来实现。

本申请还提供一种移动终端,移动终端包括存储器、用户接口、处理器,存储器上存储有处理程序,处理程序被处理器执行时结合用户接口实现上述任一实施例中的处理方法的步骤。其中,用户接口包括输入设备和输出设备,输入设备包括拾音设备、触控屏等等,输出设备包括扬声器、显示屏等等。

本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有处理程序,处理程序被处理器执行时实现上述任一实施例中的处理方法的步骤。

在本申请提供的移动终端和计算机可读存储介质的实施例中,包含了上述处理方法各实施例的全部技术特征,说明书拓展和解释内容与上述方法的各实施例基本相同,在此不做再赘述。

本申请实施例还提供一种计算机程序产品,计算机程序产品包括计算机程序代码,当计算机程序代码在计算机上运行时,使得计算机执行如上各种可能的实施方式中的方法。

本申请实施例还提供一种芯片,包括存储器和处理器,存储器用于存储计算机程序,处理器用于从存储器中调用并运行计算机程序,使得安装有芯片的设备执行如上各种可能的实施方式中的方法。

上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。

本申请实施例设备中的单元可以根据实际需要进行合并、划分和删减。

在本申请中,对于相同或相似的术语概念、技术方案和/或应用场景描述,一般只在第一次出现时进行详细描述,后面再重复出现时,为了简洁,一般未再重复阐述,在理解本申请技术方案等内容时,对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等,可以参考其之前的相关详细描述。

在本申请中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本申请技术方案的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本申请记载的范围。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台移动终端(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本申请每个实施例的方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络,或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、存储盘、磁带)、光介质(例如,DVD),或者半导体介质(例如固态存储盘Solid State Disk(SSD))等。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

相关技术
  • 移动终端对焦处理方法、装置、移动终端及存储介质
  • 移动终端蓝牙设备搜索处理方法、移动终端及存储介质
技术分类

06120113268506