掌桥专利:专业的专利平台
掌桥专利
首页

电子装置、其控制方法、以及该电子装置的声音输出控制系统

文献发布时间:2024-04-18 19:59:31


电子装置、其控制方法、以及该电子装置的声音输出控制系统

技术领域

本公开涉及电子装置、其控制方法、以及该电子装置的声音输出控制系统,例如涉及用于对与语音识别装置位于同一空间的电子装置输出的声音进行控制的技术。

背景技术

根据网络和多媒体再现技术的发展,许多用户在一个空间内使用多个电子装置。电子装置包括基于互联网实现的多媒体再现装置、音频系统或具有音频输出功能的扬声器等。

而且,由于人工智能(AI)的发展,能够识别人类语音命令的语音识别装置的使用也越来越多。由此,对基于机器学习算法的AI系统及其应用进行了积极的研究。

当通过语音识别装置输入语音命令时,可能存在从位于语音识别装置周围的另一电子装置输出的声音或噪声。在此情况中,降低了语音识别装置的语音命令识别率。

由此,近来,越来越关注当用户通过语音识别装置输入语音命令时用于降低或抑制从位于语音识别装置周围的另一电子装置输出的声音来提高语音识别率的技术。而且,对选择性地限制从与语音识别装置位于同一空间的电子装置和与语音识别装置位于不同空间的另一电子装置输出的声音的技术进行了研究。

发明内容

本公开的实施方式提供了一种用于基于语音识别装置的位置选择性地控制从与语音识别装置位于同一空间的电子装置和与语音识别装置位于不同空间的另一电子装置输出的声音的技术。

本公开的附加方面部分地在下面的描述中阐述并部分地根据该描述变得明显。

根据本公开的示例性方面,电子装置包括:通信装置,包括通信电路,被配置为检测距所述电子装置指定距离内的语音识别装置;存储装置,包括存储器,被配置为存储检测到的语音识别装置的识别信息;以及控制器,被配置为:基于通信装置从服务器接收到已经接收到来自用户的语音命令的语音识别装置的识别信息,比较接收的识别信息与存储在所述存储装置中的识别信息;以及基于所述控制器确定接收的识别信息与存储的识别信息相同,控制所述电子装置停止输出声音或减小正被输出的声音的音量。

所述通信装置可以从所述服务器接收到用于所述电子装置的声音输出停止命令,当所述通信装置从所述服务器接收已经接收到所述语音命令的所述语音识别装置的识别信息和用于所述电子装置的声音输出停止命令时,所述控制器可以比较接收的识别信息与存储在所述存储装置中的所述识别信息。

当所述控制器确定接收的识别信息与存储的识别信息相同时,所述控制器可以将正从所述电子装置输出的声音的音量减小至预定音量。

当所述控制器确定接收的识别信息与存储的识别信息相同时,所述控制器可以将所述电子装置断电。

当所述控制器确定接收的识别信息与存储的识别信息不相同时,所述控制器可以控制所述电子装置继续输出声音。

所述通信装置可以包括包含蓝牙低能耗(BLE)电路的BLE模块并且可以被配置为通过所述BLE模块的短程通信检测距所述电子装置预定距离内的音频识别装置。

存储在所述存储装置中的所述语音识别装置的识别信息可以包括在所述语音识别装置访问所述服务器时被指派给网络的媒体访问控制(MAC)地址。

根据本公开的另一示例性方面,一种控制电子装置的方法包括:检测距所述电子装置指定距离的语音识别装置;存储检测到的语音识别装置的识别信息;从服务器接收已经接收到来自用户的语音命令的语音识别装置的识别信息;以及比较接收的识别信息与存储的识别信息,并基于确定所述接收的识别信息与所述存储的识别信息相同控制所述电子装置停止输出声音或减小正被输出的声音的音量。

所述方法还可以包括从所述服务器接收用于所述电子装置的声音输出停止命令,其中当从服务器接收已经接收到所述语音命令的所述语音识别装置的识别信息和用于所述电子装置的所述声音输出停止命令时可以比较所述接收的识别信息与所述存储的识别信息。

所述方法还可以包括当确定所述接收的识别信息与所述存储的识别信息相同时将正从所述电子装置输出的声音的音量减小至预定音量。

所述方法还可以包括当确定所述接收的识别信息与所述存储的识别信息相同时将所述电子装置断电。

所述方法还可以包括当确定所述接收的识别信息与所述存储的识别信息不相同时控制所述电子装置继续输出声音。

检测距所述电子装置指定距离内的所述语音识别装置可以包括:通过蓝牙低能耗(BLE)模块的短程通信检测距所述电子装置指定距离内的语音识别装置。

根据本公开的另一示例性方面,一种电子装置的声音输出控制系统包括:语音识别装置,包括语音识别电路,被配置为接收来自用户的语音命令;服务器,被配置为将已经接收到语音命令的语音识别装置的识别信息发送给电子装置;以及所述电子装置,被配置为检测距所述电子装置指定距离内的语音识别装置,存储检测到的语音识别装置的识别信息,基于从服务器接收已经接收到所述语音命令的所述语音识别装置的识别信息比较接收的识别信息与存储的识别信息,以及基于确定所述接收的识别信息与所述存储的识别信息相同停止输出声音或减小正被输出的声音的音量。

所述服务器可以将用于所述电子装置的声音输出停止命令发送给所述电子装置,当所述电子装置从所述服务器接收已经接收到所述语音命令的所述语音识别装置的识别信息和用于所述电子装置的所述声音输出停止命令时,所述电子装置可以比较接收的识别信息与存储的识别信息。

当确定从所述服务器接收的识别信息与存储的识别信息相同时,所述电子装置可以将正被输出的声音的音量减小至预定音量。

当确定从所述服务器接收的识别信息与存储的识别信息相同时,所述电子装置可以被断电。

当确定从所述服务器接收的识别信息与存储的识别信息不相同时,所述电子装置可以继续输出声音。

所述电子装置可以包括包含蓝牙低能耗(BLE)电路的BLE模块,并通过所述BLE模块的短程通信检测距所述电子装置预定距离内的语音识别装置。

附图说明

结合附图,根据下面的详细描述,本公开的某些实施方式的这些和其它的方面、特征和优点将变得更加明显,在附图中:

图1是示出根据本公开的实施方式的电子装置的示例性声音输出控制系统的示图;

图2是示出根据本公开的实施方式的示例性电子装置的框图;

图3是示出根据本公开的实施方式的示例性电子装置的示例性操作的控制流程图;

图4是示出根据本公开的实施方式的检测电子装置周围的装置以存储识别信息的示例性方法的示图;

图5是示出根据本公开的实施方式的限制从与语音识别装置位于同一空间的电子装置输出的声音的示例性方法的示图;

图6是示出根据本公开的另一实施方式的限制从与语音识别装置位于同一空间的电子装置输出的声音的示例性方法的示图;

图7和图8是示出根据本公开的实施方式的当语音识别装置的位置改变时限制从电子装置输出的声音的示例性方法的示图;

图9是示出根据本公开的实施方式的限制从与语音识别装置位于同一空间的灯输出的照明的示例性方法的示图;以及

图10是示出根据本公开的实施方式的控制电子装置的示例性方法的流程图。

具体实施方式

在下文,在本公开中相似的参考标号指代相似的部件。此公开可能未描述各个示例性实施方式的全部部件,可能未描述本公开所属技术领域的一般信息或实施方式之间的重叠信息。如本文中所使用的,术语“部分”、“零件”、“模块”、“构件”或“块”可以被实现为软件、硬件、或它们的任意组合,根据实施方式,多个“部分”、“零件”、“模块”、“构件”或“块”可以被实现为单个部件,或者单个“部分”、“零件”、“模块”、“构件”或“块”可以包括多个部件。

将理解,当某一零件被称为“连接”至另一零件时,它可以直接或间接地连接至其它零件。当零件间接地连接至另一零件时,它可以例如但非限制地通过无线通信网络连接至另一零件。

将理解,当术语“包含(includes)”、“包括(comprises)”、“包含(including)”、和/或“包括(comprising)”在本公开中使用时规定了所阐述的部件的存在,但是不排除一个或多个其它部件的存在或附加。

术语“第一”和“第二”在本文中使用时用于标识目的并且不暗示任何的重要性顺序。

将理解,单数形式“一个(a)”、“一个(an)”和“所述(the)”包括复数个所指物,除非上下文清楚地另有指示。

在操作中使用的参考标号被提供用于方便描述但不描述操作的顺序,操作可以按与所阐述的顺序不同的顺序执行,除非在上下文中明确规定了具体的顺序。

在下文,将参考附图更详细地描述本公开的操作原理和各个示例性实施方式。

图1是示出根据本公开的实施方式的电子装置的示例性声音输出控制系统的示图,以及图2是示出根据本公开的实施方式的示例性电子装置的框图。

参考图1,根据网络和多媒体再现技术的发展,许多用户可能在给定的空间内使用多个电子装置。电子装置可以包括例如但不限于基于互联网实现的多媒体再现装置、音频系统、具有音频输出功能的扬声器等。

如图1所示,多个电子装置10、20、30、40和50可以位于多个空间内。例如,TV 10、语音识别装置20、计算机30和音频系统40可位于第一区域1中,例如条形音箱50的多媒体装置可以位于第二区域2中。

电子装置可以包括输出声音的多媒体再现装置或不输出声音的装置。电子装置可以通过例如互联网连接至服务器100,并且通过服务器100共享它们的操作信息和控制数据。

用于识别人类语音命令以执行命令内容的例如人工智能(AI)扬声器的语音识别装置20被广泛使用。语音识别装置20还可以通过网络与服务器100通信,服务器100可以基于由语音识别装置20识别的语音命令控制其它电子装置,语音识别装置20可以执行语音命令的内容。

例如,用户可以通过语音识别装置20输入用于获取天气信息的语音命令。在此示例中,语音识别装置20可以响应于接收的语音命令,将语音命令的内容发送给服务器100。此后,语音识别装置20可以从服务器100接收与天气有关的信息并且输出与天气有关的信息,由此向用户提供天气信息。

用户可以通过语音识别装置20输入用于播放音乐的语音命令。在此示例中,语音识别装置20可以响应于接收的语音命令,将语音命令的内容发送给服务器100。此后,语音识别装置20可以从服务器100接收音乐内容并输出音乐内容,由此向用户提供音乐。

此外,用户可以通过语音识别装置20输入用于控制电子装置的命令。在此示例中,通过服务器100与语音识别装置20连接的电子装置可以响应于用户的语音命令进行操作。例如,用户可以通过语音识别装置20输入用于电子装置的唤醒命令,语音识别装置20可以响应于接收的语音命令将用于电子装置的唤醒命令发送给服务器100。

服务器100可以响应于通过语音识别装置20接收的用户的语音命令,将唤醒命令发送给与服务器100连接的电子装置。电子装置可以从服务器100接收唤醒命令,并行响应于唤醒命令进行操作。例如,当电子装置处于断电状态时,电子装置可以根据通过语音识别装置20从用户接收的唤醒命令而被上电。

语音识别装置20例如可以是扬声器,扬声器内安装有(例如,包括语音输入电路的)语音输入器,例如能够识别语音命令的麦克风。语音识别装置20可以是移动装置,例如能够识别语音命令的智能电话。例如,根据本公开的实施方式的语音识别装置20可以在类型和形状方面不受限,并且可以是能够接收语音命令的任意装置。

在示例中当用户通过语音识别装置20输入语音命令时,声音从与语音识别装置20位于同一空间的电子装置输出。在此示例中,可能会降低语音识别装置20的语音识别率。例如,从与多媒体再现装置对应的电子装置输出的语音或声音可能充当噪声,从而可能会降低语音识别装置20的语音命令识别率。

为了防止和/或降低语音识别装置20的语音识别率的劣化,当用户的语音命令被输入到语音识别装置20时,网络上与电子装置连接的服务器100可以将声音输出停止命令发送给正在输出声音的电子装置。

例如,如图1所示,当用户通过语音识别装置20输入语音命令且服务器100确定语音命令已被输入时,服务器100可以将声音输出停止命令发送给位于第一区域1中的电子装置(例如,TV 10、计算机30和音频系统40),同样地,服务器100可以将声音输出停止命令发送给位于第二区域2中的电子装置(例如,条形音箱50)。

位于第一区域1和第二区域2中的电子装置10、30、40和50可以从服务器100接收声音输出停止命令来停止输出声音、减小音量、或断电,由此防止和/或减少可能使语音识别装置20的语音识别率劣化的噪声的生成。

如图1所示,当语音识别装置20位于第一区域1中时,从位于第二区域2中的条形音箱50输出的声音可能不会影响语音识别装置20的语音识别率。然而,条形音箱50也可以根据从服务器100接收的声音输出停止命令停止输出声音。

例如,如上所述,服务器100可以通过网络连接至多个电子装置,电子装置可以通过服务器100共享操作信息和控制数据。因此,服务器100可以立即将声音输出停止命令发送给与网络连接的多个电子装置。

由此,位于与语音识别装置20所在的空间不同的空间内的电子装置也可以停止输出声音。

根据本公开的实施方式的电子装置及其控制方法可以基于语音识别装置20的位置,选择性地控制来自与电子识别装置20位于同一空间的电子装置和与语音识别装置20位于不同空间的另一电子装置的声音输出。

在下面给出的本公开的实施方式中,为了方便描述,假设语音识别装置20是能够识别语音命令的扬声器,并假设根据本公开的实施方式的用于执行控制操作的电子装置是TV。然而,将理解本公开不限于此。

参考图2,电子装置10可以包括用于执行与其它电子装置的通信的(例如,包含通信电路的)通信装置11、存储与电子装置10的操作和控制相关的数据的存储装置12、以及用于控制电子装置10的操作的(例如,包含处理电路的)控制器13,电子装置可以执行与服务器100的通信并可以检测电子装置10周围的语音识别装置20。

电子装置10可以经由网络通过通信装置11连接至服务器100,并通过通信装置11向服务器100发送/从服务器100接收与电子装置10的操作和控制相关的数据。电子装置10可以通过通信装置11检测位于电子装置10周围的语音识别装置20。

通信装置11可以包括各种通信电路,包括例如但不限于包含各种无线通信电路的无线通信模块和包含各种短程通信电路的短程通信模块等中的至少一个,能够执行与服务器100和其它电子装置的通信以向服务器100和其它电子装置发送数据/从服务器100和其它电子装置接收数据。

无线通信模块可以包括各种无线通信电路,各种无线通信电路包含在可以通过例如但不限于无线保真(Wi-Fi)、无线宽带(Wibro)、全球无线通信系统(GSM)、码分多址(CDMA)、宽带码分多址(WCDMA)、通用移动通信系统(UMTS)、时分多址(TDMA)、长期演进(LTE)、第4代(4G)移动通信、第5代(5G)移动通信等的无线通信方法连接至互联网的各种无线通信模块的至少一个中。

短程通信模块可以包括各种短程通信电路,各种短程通信电路包含在例如但不限于蓝牙模块、红外线数据协会(IrDA)通信模块、射频识别(RFID)通信模块、无线局域网(WLAN)通信模块、近场通信(NFC)通信模块、Zigbee通信模块、蓝牙低能耗(BLE)通信模块等的各种短程通信模块的至少一个中。

尽管通信装置11包括各种短程通信模块,但是将关于非限制性示例性情况描述根据本公开的实施方式的电子装置10,在该非限制性示例性情况中通信装置11包括(例如,包含BLE电路的)BLE模块11a。然而,将理解,本公开不限于此。

因为BLE模块以低功率操作,所以尽管蓝牙功能一直打开,但是BLE的电池电量可以不会极大地受蓝牙功能影响。由此,当电子装置10处于打开状态时,电子装置10可以实时地通过BLE模块11a的短程通信将数据发送给其它电子装置/从其它电子装置接收数据,并检测距电子装置10预定距离内的其它电子装置。

存储装置12可以存储被通信装置11检测到的语音识别装置20的识别信息。存储装置12可以存储与电子装置10的控制相关的各种数据。

存储装置12可以被实现为例如但不限于非暂时存储器装置(例如,高速缓存、只读存储器(ROM)、可编程ROM(PROM)、可擦除可编程ROM(RPROM)、电可擦除可编程ROM(EEPROM)和闪存)、暂时存储器装置(例如,随机存取存储器(RAM))或存储介质例如硬盘驱动(HDD)、只读光盘存储器(CD-ROM)中的至少一个,但是不限于此。存储装置12可以是被实现为与上述存储器分离的芯片的存储器而不管控制器13如何,或者存储装置12和处理器可以被集成到单个芯片中。

当通信装置11从服务器100接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息时,控制器13可以比较接收的识别信息与存储在存储装置12中的识别信息。当控制器13确定接收的识别信息与存储的识别信息相同时,控制器13可以控制电子装置10停止输出声音。

下面参考图3至图10更详细地描述用于基于控制器13的控制流控制电子装置10的方法以及控制器13的控制。

图3是示出根据本公开的实施方式的示例性电子装置的示例性操作的控制流程图。图4是示出根据本公开的实施方式的检测电子装置周围的装置以存储识别信息的示例性方法的示图。图5是示出根据本公开的实施方式的限制从与语音识别装置位于同一空间的电子装置输出的声音的示例性方法的示图。图6是示出根据本公开的另一实施方式的限制从与语音识别装置位于同一空间的电子装置输出的声音的示例性方法的示图。图7和图8是示出根据本公开的实施方式的当语音识别装置的位置改变时限制从电子装置输出的声音的示例性方法的示图。

参考图3,语音识别装置20和多个电子装置10的识别信息以及与语音识别装置20和电子装置10的操作相关的信息可以已经被存储在通过网络与语音识别装置20和电子装置10连接的服务器100中。

例如,当语音识别装置20和电子装置10通过网络连接至服务器100时,语音识别装置20和电子装置10可以将它们的识别信息发送给服务器100。

识别信息可以例如但不限于被表示成语音识别装置20和电子装置10的生产编号、序列号等,可以是由服务器100等随意设置的数据编码。识别信息可以包括当语音识别装置20和电子装置10访问服务器100时被指派给网络的媒体访问控制(MAC)地址。

电子装置10可以通过通信装置11检测电子装置10周围的语音识别装置20。如本文中所使用的,术语“周围”可以指例如在指定、给定或预定的距离或距离范围内。

参考图4,位于第一区域1中的电子装置10可以通过通信装置11中包含的BLE模块11a的短程通信,检测距电子装置10预定距离内的语音识别装置20和其它电子装置30、40。

位于第二区域2中的另一电子装置(例如,条形音箱50)可以检测距该另一电子装置预定距离内的语音识别装置和其它电子装置。

电子装置10的存储装置12可以存储电子装置10、检测到的语音识别装置20和检测到的其它电子装置30、40的识别信息200。

如图4所示,位于第一区域1中的语音识别装置20以及多个电子装置10、30和40中的每个都可以存储识别信息。

例如,被实现为扬声器的语音识别装置20的识别信息可以被检测成'12ab',TV 10的识别信息可以被检测成'34cd',PC 30的识别信息可以被检测成'56ef',并且音频系统40的识别信息可以被检测成'78gh'。

电子装置10可以将检测到的识别信息存储在存储装置12中,检测到的识别信息可以包括例如'12ab',即位于第一区域1中的语音识别装置20的识别信息。

位于第一区域1中的语音识别装置20以及电子装置10、30和40的识别信息也可以被存储在计算机30和音频系统40内。

位于第二区域2中的电子装置50也可以存储在第二区域2中检测到的其自身的识别信息300。

位于第一区域1中的电子装置10可以通过通信装置11中包含的BLE模块11a检测位于预定距离内的语音识别装置20和其它电子装置30、40。

当语音识别装置20接收到来自用户的语音命令时,电子装置10可以将实时检测的语音识别装置20和其它电子装置30、40的识别信息发送给服务器100。而且,当语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通过短程通信将实时检测的语音识别装置20和其它电子装置30、40的识别信息发送给语音识别装置20周围的其它电子装置30、40。

例如,当语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通知服务器100用户已经输入语音命令。

服务器100可以通知电子装置10已经接收到来自用户的语音命令,电子装置10可以将实时检测到的语音识别装置20和其它电子装置30、40的识别信息发送给服务器100或其它电子装置30、40。

同样地,当另一语音识别装置21例如如图6所示位于第二区域2中时,位于第二区域2中的电子装置50可以实时检测到位于电子装置50周围的语音识别装置21。

当语音识别装置21接收到来自用户的语音命令时,电子装置50可以将实时检测到的语音识别装置21的识别信息发送给服务器100或直接发送给语音识别装置21。

根据本公开的另一实施方式,语音识别装置20可以实时检测位于同一空间的其它电子装置10、30和40的识别信息。例如,如图4所示,语音识别装置20可以通过BLE模块或另一短程通信定期地或实时地检测位于第一区域1中且与语音识别装置20相邻或距语音识别装置20预定距离内的电子装置10、30和40,并将电子装置10、30和40的识别信息存储在存储器中。

在此示例中,语音识别装置20可以存储电子装置10、30和40的识别信息,电子装置10可以不存储语音识别装置20或其它电子装置30、40的识别信息。

同样地,如图6所示,当语音识别装置21位于第二区域2中时,语音识别装置21可以通过短程通信检测位于第二区域2中的电子装置50并存储电子装置50的识别信息。

语音识别装置20可以将电子装置的识别信息列表发送给服务器100或直接发送给电子装置。

同时,参考图6,语音识别装置21可以位于第二区域2中。

当语音识别装置21位于第二区域2中时,位于第二区域2中的电子装置50可以检测位于电子装置50周围的语音识别装置21,并存储包含与在第二区域2中检测到的语音识别装置21有关的信息的识别信息31作为检测结果。

例如,被实现为输出声音的多媒体再现装置的多个电子装置10、30、40和50可以存储位于电子装置10、30、40和50周围的语音识别装置20和21的识别信息以当语音命令被输入到语音识别装置20和21时限制输出声音。

参考图3和图5,当语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通知服务器100用户已经输入语音命令。

服务器100可以将用户对其输入了语音命令的语音识别装置20的识别信息以及用于电子装置10、30、40和50的声音输出停止命令发送给电子装置10、30、40和50。

例如,如图5所示,当用户通过被实现为扬声器的语音识别装置20输入语音命令时,服务器100可以将与语音识别装置20的识别信息对应的'12ab'、与语音识别装置20的类型有关的信息、以及用于电子装置10、30、40和50的声音输出停止命令发送给位于第一区域1和第二区域2中的电子装置10、30、40和50。

当通信装置11从服务器100接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息以及用于电子装置10、30、40和50的声音输出停止命令时,电子装置10的控制器13可以比较接收的识别信息与存储在存储装置12中的识别信息200。

当控制器13确定从服务器100接收的识别信息与存储在存储装置12中的识别信息200相同时,控制器13可以控制电子装置10停止输出声音。同时,当控制器13确定从服务器100接收的识别信息与存储在存储装置12中的识别信息200不相同时,控制器13可以控制电子装置10继续输出声音从而可以维持电子装置10的当前声音输出状态。

而且,当语音识别装置20通知服务器100用户已经输入语音命令时,服务器100可以通过接入点(AP)将直接从电子装置10接收的语音识别装置20的识别信息以及位于电子装置10周围的其它电子装置30和40的识别信息列表发送给多个电子装置10、30、40和50。同时,服务器100可以将声音输出停止命令发送给多个电子装置10、30、40和50。

当从服务器100接收到包含语音识别装置20的识别信息和多个电子装置10、30、40和50的识别信息的识别信息列表时,电子装置10的控制器13可以比较接收的识别信息列表中包含的识别信息与存储在存储装置12中的识别信息200。

控制器13可以确定语音识别装置20的识别信息和包括控制器13的电子装置10的识别信息是否都包含在从服务器100接收的识别信息列表中。

当控制器13确定语音识别装置20的识别信息和电子装置10的识别信息都包含在从服务器100接收的识别信息列表中时,电子装置10的控制器13可以控制电子装置10停止输出声音。

当控制器13确定语音识别装置20的识别信息和电子装置10的识别信息不是都包含在从服务器100接收的识别信息列表中时,电子装置10的控制器13可以控制电子装置继续输出声音从而可以维持电子装置10的当前声音输出状态。

例如,电子装置10可以基于包含在从服务器100接收的识别信息列表中的语音识别装置20的识别信息和电子装置10的识别信息,确定语音识别装置20和电子装置10是否位于同一区域中,控制器12可以基于确定的结果控制电子装置10停止输出声音。

如图5所示,因为语音识别装置20位于第一区域1中而不位于第二区域2中,所以位于第一区域1中的电子装置10、30和40可以存储有如上参考图4描述被检测的语音识别装置20的识别信息。

由此,当位于第一区域1中的电子装置10接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息和声音输出停止命令时,因为存储在电子装置10中的识别信息200包括从服务器100接收的识别信息'12ab',所以电子装置10可以根据控制器13的控制停止输出声音。

位于第一区域1中的电子装置10可以根据预先由用户设置的控制设定值或根据电子装置10的类型将正被输出的声音的音量减小至预定音量,或者电子装置10可以被断电。

位于第一区域1中的其它电子装置30和40也可以根据控制器13的控制以相同的方式操作。

如此,当用户通过位于第一区域1中的语音识别装置20输入语音命令时,与语音识别装置20位于同一空间的电子装置10可以减小正被输出的声音的音量或停止输出声音,由此提高语音识别率。

同时,如图5所示,因为语音识别装置20不位于第二区域2中,所以位于第二区域2中的电子装置50可以未存储有如上参考图4描述的语音识别装置20的识别信息'12ab'。

由此,当位于第二区域2中的电子装置50接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息和声音输出停止命令时,因为存储在电子装置50中的识别信息不包括接收的识别信息'12ab',所以电子装置50可以继续输出声音。

根据另一实施方式,如图5所示,当语音识别装置20位于第一区域1中且语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以将存储的电子装置10、30和40的识别信息发送给服务器100或直接发送给电子装置10、30和40。也就是说,语音识别装置20可以将在第一区域1中检测到的电子装置10、30和40的识别信息发送给服务器100或电子装置10、30和40。

例如,在一些情况中,当语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通过短程通信而不经由服务器100将语音识别装置20周围的电子装置的识别信息列表和语音输出停止命令直接发送给电子装置10、30和40。

由语音识别装置20从用户接收的语音命令可以例如是用于电子装置10、30和40的唤醒命令。

服务器100可以将从语音识别装置20接收的电子装置10、30和40的识别信息和用于电子装置10、30和40的声音输出停止命令发送给电子装置10、30、40和50。

当用户通过语音识别装置20输入语音命令时,语音识别装置20可以将包含与位于第一区域1中的电子装置10、30和40的识别信息对应的'34cd'、'56ef'和'78gh'的识别信息列表发送给服务器100。

服务器100可以将从语音识别装置20接收的电子装置10、30和40的识别信息和用于电子装置10、30和40的声音输出停止命令发送给电子装置10、30、40和50。

在此示例中,服务器100可以通过AP将从语音识别装置20接收的电子装置10、30和40的识别信息列表发送给位于第一区域1和第二区域2中的电子装置10、30、40和50。

电子装置10、30、40和50可以确定它们自身的识别信息是否包含在从服务器100接收的识别信息中。

由语音识别装置20生成的识别信息可以包括位于第一区域1中的电子装置10、30和40的识别信息。因此,当服务器100将识别信息和声音输出停止命令发送给位于第一区域1和第二区域2中的电子装置10、30、40和50时,电子装置10、30、40和50能够确定它们自身的识别信息是否包含在从服务器100接收的识别信息中。

例如,位于第一区域1中的电子装置10的控制器13可以确定电子装置10的识别信息是否包含在从服务器100接收的识别信息中,当控制器13确定电子装置10的识别信息与从服务器100接收的识别信息中的一个相同时,控制器13可以基于从服务器100接收的声音输出停止命令控制电子装置10停止输出声音。

当位于第二区域2中的电子装置50的识别信息不包含在从服务器100接收的识别信息中时,电子装置50可以继续输出声音而不需要停止输出声音。

同样地,如图6所示,可能存在语音识别装置21位于第二区域2中的示例。在此示例中,当语音识别装置21接收到来自用户的语音命令时,语音识别装置21可以将存储在其内的预先检测到的电子装置50的识别信息发送给服务器100或直接发送给电子装置50。例如,语音识别装置21可以将在第二区域2中检测到的电子装置50的识别信息发送给服务器100或其它电子装置。

服务器100可以将从语音识别装置21接收的电子装置50的识别信息和用于电子装置10、30、40和50的声音输出停止命令发送给电子装置10、30、40和50。

例如,当用户通过语音识别装置21输入语音命令时,语音识别装置21可以将与位于第二区域2中的电子装置50的识别信息对应的'96MK'发送给服务器100。

服务器100可以将从语音识别装置21接收的电子装置50的识别信息和用于电子装置10、30、40和50的声音输出停止命令发送给电子装置10、30、40和50。

在此示例中,服务器100可以通过AP将从语音识别装置21接收的电子装置50的识别信息发送给位于第一区域1和第二区域2中的电子装置10、30、40和50。

电子装置10、30、40和50可以确定它们自身的识别信息是否包含在从服务器100接收的识别信息中。

由语音识别装置21生成的识别信息可以包括位于第二区域2中的电子装置50的识别信息。因此,当服务器100将识别信息和声音输出停止命令发送给位于第一区域1和第二区域2中的全部电子装置10、30、40和50时,电子装置10、30、40和50能够确定它们自身的识别信息是否包含在从服务器100接收的识别信息中。

位于第二区域2中的电子装置50的控制器可以确定从服务器100接收的识别信息是否包括电子装置50的识别信息。当控制器确定电子装置50的识别信息与从服务器100接收的识别信息中的一个相同时,控制器可以基于从服务器100接收的声音输出停止命令控制电子装置50停止输出声音。

位于第一区域1中的电子装置10、30和40可以继续输出声音而不需要停止输出声音,这是因为它们自身的识别信息未包括在从服务器100接收的识别信息中。

例如,电子装置10可以检测和存储位于同一区域的语音识别装置20的识别信息,当用户通过语音识别装置20输入语音命令时,电子装置10可以停止输出声音。然而,还可能是语音识别装置20生成位于同一区域的电子装置10、30和40的识别信息列表并通过服务器100将识别信息列表发送给电子装置10、30和40从而当用户通过语音识别装置20输入语音命令时包含在识别信息列表中的电子装置10、30和40可以停止输出声音。

如图6所示,当语音识别装置21位于第二区域2中时,位于第二区域2中的电子装置50可以检测到位于电子装置50周围的语音识别装置21,并存储包含'24yj'的识别信息301即在第二区域2中检测到的语音识别装置21的识别信息作为检测结果。

例如,可能存在语音识别装置20位于第一区域1中且语音识别装置21位于第二区域2中的示例。在此示例中,当用户通过被实现为扬声器的语音识别装置20和21输入语音命令时,服务器100可以将与语音识别装置20和21的识别信息对应的'12ab'和'24yj'、与语音识别装置20和21的类型有关的信息、以及用于电子装置10、30、40和50的声音输出停止命令发送给位于第一区域1和第二区域2中的电子装置10、30、40和50。

在此示例中,已经如上参考图5描述了限制从位于第一区域1中的电子装置10、30和40输出的声音。

因为语音识别装置21位于第二区域2中,所以通过检测获取的语音识别装置21的识别信息301可以已经被存储在位于第二区域2中的电子装置50中,如上所述。

由此,当位于第二区域2中的电子装置50接收到已经接收到来自用户的语音命令的语音识别装置21的识别信息301和声音输出停止命令时,因为存储在电子装置50中的识别信息301包括从服务器100接收的识别信息'24yj',所以电子装置50可以停止输出声音。

位于第二区域2中的电子装置50可以根据预先由用户设置的控制设定值或根据电子装置50的类型将正被输出的声音的音量减小至预定音量,或者电子装置50可以被断电。

例如,通过限制从与接收来自用户的语音命令的语音识别装置20位于同一空间的电子装置输出的声音,可以提高语音识别装置20的语音识别率,并且可以维持从位于与语音识别装置20所在的空间不同的空间内的另一电子装置输出的声音。

参考图7和图8,语音识别装置22可以被实现为可移动类型,不需要被固定在预定空间。例如,语音识别装置22可以被实现为移动装置(例如但不限于智能电话),用户可以在移动语音识别装置22的同时输入语音命令。

如图7所示,当语音识别装置22位于第一区域1中时,位于第一区域1中的电子装置10、30和40能够检测到语音识别装置22,检测到的语音识别装置22的识别信息'28xy'可以存储在位于第一区域1中的电子装置10、30和40中。

同时,位于第二区域2中的电子装置50可能无法检测到语音识别装置22,因此语音识别装置22的识别信息'28xy'可能不被存储在位于第二区域2中的电子装置50中。

如图8所示,当语音识别装置22位于第二区域2中时,位于第二区域2中的电子装置50能够检测到语音识别装置22,并且检测到的语音识别装置22的识别信息'28xy'可以被存储在位于第二区域2中的电子装置50中。

同时,位于第一区域1中的电子装置10、30和40可能无法检测到语音识别装置22,因此语音识别装置22的识别信息'28xy'可以不被存储在位于第一区域1中的电子装置10、30和40中。

当用户通过位于第一区域1中的语音识别装置22输入语音命令时,可限制从位于第一区域1中的电子装置10、30和40输出的声音,并且可不限制从位于第二区域2中的电子装置50输出的声音。

同时,当用户通过位于第二区域2中的语音识别装置22输入语音命令时,可限制从位于第二区域2中的电子装置50输出的声音,可不限制从位于第一区域1中的电子装置10、30和40输出的声音。

限制从电子装置输出的声音的方法如上已经参考图5和图6进行了描述,因此这里可能不再重复冗余描述。

如此,即使当语音识别装置22的位置改变时,也可限制从与语音识别装置22位于同一空间的电子装置输出的声音。

图9是示出根据本公开的实施方式的限制与语音识别装置位于同一空间的灯输出的照明的示例性方法的示图。

为了方便起见,假设根据图9中公开的实施方式的电子装置是灯61和62。然而将理解本公开不限于此。

参考图9,位于第一区域1中的灯61能够检测到位于第一区域1中的电子装置10、30和40和语音识别装置20,并存储检测到的电子装置10、30和40和检测到的语音识别装置20的识别信息203。

位于第二区域2中的灯62能够检测到位于第二区域2中的电子装置50和任意语音识别装置,并存储检测到的电子装置50的识别信息303。

位于第一区域1中的灯61中存储的识别信息203可以包括语音识别装置20的识别信息'12ab'。同时,位于第二区域2中的灯62中存储的识别信息303可以不包括语音识别装置20的识别信息'12ab'。

当位于第一区域1中的语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通知服务器100用户已经输入语音命令。

用户可以通过语音识别装置20输入用于关闭灯61和62的命令,服务器100可以基于已经接收到来自用户的语音命令的语音识别装置20的识别信息和由用户输入的语音命令的内容,将用于关闭灯61和62的命令发送给位于第一区域1和第二区域2中的灯61和62。

例如,如图9所示,当用户通过被实现为扬声器的语音识别装置20输入用于关闭灯61和62的命令时,服务器100可以将与语音识别装置20的识别信息对应的'12ab'、与语音识别装置20的类型有关的信息、以及用于关闭灯61和62的命令发送给位于第一区域1和第二区域2中的灯61和62。

灯61和62可以比较从服务器100接收的语音识别装置20的识别信息与预存储的识别信息203和303。

当灯61和62中的每个确定从服务器100接收的语音识别装置20的识别信息包含在预存储的识别信息203和303中时,灯61和62中的每个可以被关闭。当灯61和62中的每个确定从服务器100接收的语音识别装置20的识别信息未包含在预存储的识别信息203和303中时,灯61和62中的每个可以被维持在打开状态。

因为语音识别装置20位于第一区域1中、而不位于第二区域2中,所以位于第一区域1中的灯61可以存储有语音识别装置20的识别信息,位于第二区域2中的灯62可以未存储有语音识别装置20的识别信息。

由此,当位于第一区域1中的灯61接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息和关闭命令时,因为存储在灯61中的识别信息203包括从服务器100接收的识别信息'12ab',所以灯61可以被关闭。

当位于第二区域2中的灯62接收到已经接收到来自用户的语音命令的语音识别装置20的识别信息和关闭命令时,因为存储在灯62中的识别信息303不包括从服务器100接收的识别信息'12ab',所以灯62可以被维持在打开状态。

例如,根据本公开的实施方式,当用户通过语音识别装置20输入用于关闭灯61和62的命令时,与语音识别装置20位于同一空间的灯61可以被关闭,与语音识别装置20位于不同空间的灯62可以被维持在打开状态,由此完全反映输入语音命令的用户的意图。

图10是示出根据本公开的实施方式的控制电子装置的示例性方法的流程图。

参考图10,在操作1000中电子装置10可以通过通信装置11检测电子装置10周围的语音识别装置20,在操作1100中存储装置12可以存储检测到的语音识别装置20的识别信息200。

当语音识别装置20接收到来自用户的语音命令时,语音识别装置20可以通知服务器100用户已经输入语音命令。

服务器100可以将用户向其输入了语音命令的语音识别装置20的识别信息和用于多个电子装置的声音输出停止命令发送给电子装置。

在操作1200中,电子装置10的通信装置11可以从服务器100接收已经接收到来自用户的语音命令的语音识别装置20的识别信息和用于电子装置的声音输出停止命令。在操作1300中,控制器13可以比较接收到的识别信息与存储在存储装置12中的识别信息200。

当控制器13确定从服务器100接收的识别信息与存储在存储装置12中的识别信息200相同时,在操作1400中,控制器13可以控制电子装置10停止输出声音来减小正被输出的声音的音量、或将其断电。

同时,当控制器13确定从服务器100接收的识别信息与存储在存储装置12中的识别信息200不相同时,控制器13可以控制电子装置10继续输出声音而不需要停止输出声音。

如此,根据本公开的实施方式的电子装置、其控制方法、以及电子装置的声音输出控制系统可以限制从与接收到来自用户的语音命令的语音识别装置20位于同一空间的电子装置输出的声音,由此提高语音识别装置20的语音识别率,同时维持从位于与语音识别装置20所在的空间不同的空间内的另一电子装置输出的声音。

同时,所公开的实施方式可以由AI系统基于机器学习算法实现和实施。

AI系统可以指例如用于实现人类级别智能的计算机系统,其中机器自身学习、判断和获得比过去更高的识别率。

AI技术可以包括例如基于机器学习算法的机器学习(深度学习)技术和元素技术。

机器学习技术可以使用自己分类/学习输入数据的特性的算法。元素技术可以使用机器学习算法来模仿人脑功能,例如识别和判定。

元素技术可以包括例如但不限于用于识别人类语言/性格的语言理解、用于识别在人类视觉中实现的对象的视觉理解、用于确定信息以逻辑推断和预测它的推断/预测、用于将人类的经验信息处理成知识数据的知识表达、用于控制车辆的自动驾驶的运动控制、机器人运动等中的至少一个。

语音理解可以指例如用于识别和应用/处理人类语言/性格的技术,并包括自然语言处理、机器翻译、对话系统、查询响应、语音识别/分析等。

视觉理解可以指例如用于识别和处理在人类视觉中实现的对象的技术,并包括对象识别、对象追踪、图像检测、人类识别、场景理解、空间理解和图像增强。

推断/预测可以指例如用于判断和逻辑推断和预测信息的技术,并包括基于知识/概率的推断、优化预测、基于喜好的规划、建议等。

知识表达可以指例如用于将人类经验信息自动化为知识数据的技术,并包括知识构建(数据创建/分类)、知识管理(数据使用)等。

运动控制可以指例如用于控制车辆的自动驾驶、机器人运动等的技术,并包括运动控制(导航、防撞、驾驶)、操作控制(行为控制)等。

根据本公开的实施方式的电子装置、其控制方法、以及电子装置的声音输出控制系统可以被实现为上述的AI系统,并且精确度可以通过向所公开的实施方式应用机器学习得以提高。

同时,所公开的实施方式可以用存储可由计算机执行的指令的记录介质的形式实现。指令可以以程序代码的形式进行存储,并在由处理器执行时,指令可以生成程序模块来执行所公开的实施方式的操作。记录介质可以被实现为计算机可读记录介质。

计算机可读记录介质包括存储可以由计算机解密的指令的所有类型的记录媒质。例如,计算机可读记录介质可以包括例如但不限于ROM、RAM、磁带、磁盘、闪存、光学数据存储装置等。

通过限制从与语音识别装置位于同一空间的电子装置输出的声音,可以提高语音识别装置的语音识别率,同时维持从位于与语音识别装置所在的空间不同的空间内的另一电子装置输出的声音。

尽管已经示出和描述了本公开的各种示例性实施方式,但是本领域技术人员将理解,可以在不脱离本公开的原理和精神的前提下对这些实施方式进行改变,本公开的范围例如可以在权利要求及其等同中被限定。

技术分类

06120116523896