语音控制图像显示装置及图像显示装置的语音控制方法

申请号 CN201480078665.2 申请日 2014-11-20 公开(公告)号 CN106462379A 公开(公告)日 2017-02-22
申请人 朴男泰; 发明人 朴男泰;
摘要 本 发明 提供一种语音控制图像显示装置及在上述语音控制图像显示装置执行的图像显示装置的语音控制方法,上述语音控制图像显示装置是具备显示部且能够进行语音控制的图像显示装置,所述语音控制图像显示装置其特征在于,构成为包括:存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的 数据库 ; 语音识别 部,其接受用户的语音输入;信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入 信号 。
权利要求

1.一种语音控制图像显示装置,其是具备显示部且能够进行语音控制的图像显示装置,所述语音控制图像显示装置其特征在于,构成为包括:
存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射的数据库
语音识别部,其接受用户的语音输入;
信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及,
控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号
2.根据权利要求1所述的语音控制图像显示装置,其特征在于,
上述显示部以在显示画面时将按照画面上的执行单元区域分配的标识语音数据也一起显示的方式构成。
3.根据权利要求1所述的语音控制图像显示装置,其特征在于,
上述数据库,对于通过上述显示部而显示的互不相同的2个以上的画面,按照各画面上的执行单元区域分配并映射有标识语音数据。
4.根据权利要求1所述的语音控制图像显示装置,其特征在于,
构成为:
在上述数据库中进一步存储有与控制命令对应的控制语音数据,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;
上述信息处理部,在上述语音识别部接收了用户的语音的情况下检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在;
上述控制部,在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与该控制语音数据对应的控制命令。
5.一种图像显示装置的语音控制方法,该方法是在权利要求1至4中任一项所述的语音控制图像显示装置执行的图像显示装置的语音控制方法,所述图像显示装置的语音控制方法其特征在于,构成为包括:
(a)上述存储部存储标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射的数据库的步骤;
(b)上述语音识别部接受用户的语音输入的步骤;
(c)上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤;以及,
(d)在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤。
6.根据权利要求5所述的图像显示装置的语音控制方法,其特征在于,在按照显示于上述显示部的画面上的执行单元区域分配的语音数据所显示的状态下执行上述(b)步骤。
7.根据权利要求5所述的图像显示装置的语音控制方法,其特征在于,构成为:
上述(a)步骤以上述存储部存储进一步包括与控制命令对应的控制语音数据的数据库的方式执行,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;
上述(c)步骤以上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在的方式执行;
上述(d)步骤以在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,上述控制部产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与上述控制语音数据对应的控制命令的方式执行。
1.一种语音控制图像显示装置,其是具备显示部且能够进行语音控制的图像显示装置,所述语音控制图像显示装置其特征在于,构成为包括:
存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射的数据库;
语音识别部,其接受用户的语音输入;
信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及,
控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号,
在上述数据库中进一步存储有与控制命令对应的控制语音数据,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制,
上述信息处理部,在上述语音识别部接收了用户的语音的情况下检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在,
上述控制部,在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号,并以产生了输入信号的执行单元区域为基准执行与该控制语音数据对应的控制命令。
2.根据权利要求1所述的语音控制图像显示装置,其特征在于,
上述显示部以在显示画面时将按照画面上的执行单元区域分配的标识语音数据也一起显示的方式构成。
3.根据权利要求1所述的语音控制图像显示装置,其特征在于,
上述数据库,对于通过上述显示部而显示的互不相同的2个以上的画面,按照各画面上的执行单元区域分配并映射有标识语音数据。
4.一种图像显示装置的语音控制方法,该方法是在权利要求1至3中任一项所述的语音控制图像显示装置执行的图像显示装置的语音控制方法,所述图像显示装置的语音控制方法其特征在于,构成为包括:
(a)上述存储部存储标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射的数据库的步骤;
(b)上述语音识别部接受用户的语音输入的步骤;
(c)上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤;以及,
(d)在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤,上述(a)步骤以上述存储部存储进一步包括与控制命令对应的控制语音数据的数据库的方式执行,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制,
上述(c)步骤以上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在的方式执行,
上述(d)步骤以在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号,并以产生了输入信号的执行单元区域为基准执行与上述控制语音数据对应的控制命令的方式执行。
5.根据权利要求4所述的图像显示装置的语音控制方法,其特征在于,在按照显示于上述显示部的画面上的执行单元区域分配的语音数据所显示的状态下执行上述(b)步骤。

说明书全文

语音控制图像显示装置及图像显示装置的语音控制方法

技术领域

[0001] 本发明涉及一种语音控制图像显示装置及图像显示装置的语音控制方法,更详细地讲,涉及一种语音控制图像显示装置及这种图像显示装置的语音控制方法,所述语音控制图像显示装置构成如下:将按照通过显示部而显示的画面上的执行单元区域分配的标识语音数据与所输入的用户的语音进行比较,而在与用户的语音对应的标识语音数据存在的情况下,在该标识语音数据所分配的执行单元区域产生输入信号

背景技术

[0002] 最近,随着多种智能设备上市而图像显示装置也在实现多功能化、尖端化,且也在开发用于控制图像显示装置的多种输入方法,而除了如鼠标键盘触摸板、按钮式遥控器等那样的现有方法之外还有运动传感遥控器、触摸屏等的输入方式在开发并亮相。在如此多种输入方法中,语音控制方式近来在受到关注,为了使用户更加容易地控制图像显示装置,所述语音控制方式识别用户的语音而控制图像显示装置。
[0003] 然而,就识别用户发出的语音而控制图像显示装置的语音控制方式而言,因用户每个人的口腔构造和发音的差异而识别率降低这一点和用户须学习存储于数据库的语音指令的不便等被指出成问题。即、实际情况是在用户的便利性方面至今尚未亮相令人满意的平的语音控制方式。

发明内容

[0004] 技术问题
[0005] 本发明其目的在于提供一种语音控制图像显示装置及这种图像显示装置的语音控制方法,所述语音控制图像显示装置构成如下:将按照通过显示部而显示的画面上的执行单元区域分配的标识语音数据与所输入的用户的语音进行比较,而在与用户的语音对应的标识语音数据存在的情况下,在该标识语音数据所分配的执行单元区域产生输入信号,从而能够将现有触摸屏控制方式的用户体验(UX)所具有的便利性和直观性适用于语音控制。
[0006] 解决问题方案
[0007] 为了解决前面所述的问题,本发明提供一种语音控制图像显示装置,该装置是具备显示部且能够进行语音控制的图像显示装置,所述语音控制图像显示装置其特征在于,构成为包括:存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库;语音识别部,其接受用户的语音输入;信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号。
[0008] 此时,本发明其特征在于,上述显示部能够以在显示画面时将按照画面上的执行单元区域分配的标识语音数据也一起显示的方式构成。
[0009] 另外,本发明其特征在于,上述数据库,对于通过上述显示部而显示的互不相同的2个以上的画面,能够按照各画面上的执行单元区域分配并映射有标识语音数据。
[0010] 另外,本发明其特征在于,构成为:在上述数据库中能够进一步存储有与控制命令对应的控制语音数据,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述信息处理部,能够在上述语音识别部接收了用户的语音的情况下检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在;上述控制部,能够在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与该控制语音数据对应的控制命令。
[0011] 另外,本发明同时提供一种图像显示装置的语音控制方法,该方法是在上述语音控制图像显示装置执行的图像显示装置的语音控制方法,所述图像显示装置的语音控制方法其特征在于,构成为包括:(a)上述存储部存储标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库的步骤;(b)上述语音识别部接受用户的语音输入的步骤;(c)上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤;以及(d)在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤。
[0012] 此时,本发明其特征在于,能够在按照显示于上述显示部的画面上的执行单元区域分配的语音数据所显示的状态下执行上述(b)步骤。
[0013] 另外,本发明其特征在于,能够构成为:上述(a)步骤以上述存储部存储进一步包括与控制命令对应的控制语音数据的数据库的方式执行,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述(c)步骤以上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在的方式执行;上述(d)步骤以在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,上述控制部产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与上述控制语音数据对应的控制命令的方式执行。
[0014] 发明效果
[0015] 利用根据本发明的语音控制图像显示装置及图像显示装置的语音控制方法则有如下效果。
[0016] 1.本发明将按照通过显示部而显示的画面上的执行单元区域分配的语音数据与所输入的用户的语音进行比较,利用这种方式来执行输入控制,从而将现有触摸屏方式的输入控制方式照旧适用于语音控制方式,因而能够具体实现简便而直观的语音控制。
[0017] 2.本发明能够以有限的语音数据来执行多种输入控制而不同于使用数十至数百种语音指令的现有语音控制方式。
[0018] 3.本发明使得用户即使不学习很多语音指令也能够容易地执行语音控制。
[0019] 4.本发明对于难以具体实现且难以操作触摸屏的可穿戴设备、虚拟现实机(VR设备)、搭载移动操作系统并能够进行语音控制的投影仪等,能够提供有用的用户界面附图说明
[0020] 图1是触摸屏的示意图。
[0021] 图2是通过根据本发明的语音控制图像显示装置的显示部而显示的安卓(Android)智能手机的一般主画面。
[0022] 图3是在图2的主画面触摸了‘应用程序’②时出现的应用程序画面。
[0023] 图4是通过根据本发明的语音控制图像显示装置的显示部而显示的画面上的执行单元区域构成例。
[0024] 图5是存储于根据本发明的语音控制图像显示装置的存储部的数据库的实施例
[0025] 图6是在通过根据本发明的语音控制图像显示装置的显示部而显示的画面具有由6×4的矩阵构成的执行单元区域的情况下,字母字符自存在于画面上端右侧的执行单元区域以字母顺序并作为各执行单元区域所固有的标识语音数据而分配的实施例。
[0026] 图7是在根据本发明的语音控制图像显示装置中标识语音数据和控制语音数据配合而使用的实施例。
[0027] 图8是根据本发明的图像显示装置的语音控制方法的流程图

具体实施方式

[0028] 本发明的优选实施方式如下。
[0029] 1.语音控制图像显示装置
[0030] 本发明的语音控制图像显示装置,其是具备显示部且能够进行语音控制的图像显示装置,所述语音控制图像显示装置其特征在于,构成为包括:存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库;语音识别部,其接受用户的语音输入;信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号。
[0031] 所述语音控制图像显示装置其特征在于,构成为:在上述数据库中进一步存储有与控制命令对应的控制语音数据,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述信息处理部,在上述语音识别部接收了用户的语音的情况下检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在;上述控制部,在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与该控制语音数据对应的控制命令。
[0032] 2.图像显示装置的语音控制方法
[0033] 本发明的图像显示装置的语音控制方法,该方法是在上述语音控制图像显示装置执行的图像显示装置的语音控制方法,所述图像显示装置的语音控制方法构成为包括:(a)上述存储部存储标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库的步骤;(b)上述语音识别部接受用户的语音输入的步骤;(c)上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤;以及(d)在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤。
[0034] 所述图像显示装置的语音控制方法其特征在于,构成为:上述(a)步骤以上述存储部存储进一步包括与控制命令对应的控制语音数据的数据库的方式执行,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述(c)步骤以上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在的方式执行;上述(d)步骤以在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,上述控制部产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与上述控制语音数据对应的控制命令的方式执行。
[0035] 发明的实施方式
[0036] 以下,与具体实施例一起详细说明根据本发明的语音控制图像显示装置及图像显示装置的语音控制方法。
[0037] 1.语音控制图像显示装置
[0038] 根据本发明的语音控制图像显示装置构成为包括:显示部;存储部,其存储有标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库;语音识别部,其接受用户的语音输入;信息处理部,其在上述语音识别部接收了用户的语音的情况下,检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在;以及控制部,其在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,在该标识语音数据所分配的执行单元区域产生输入信号。具有这种构成的根据本发明的语音控制图像显示装置能够在包括过去广泛使用的智能手机、平板电脑、智能电视、导航装置在内最近亮相的智能玻璃、智能手表、如虚拟现实耳机(VR设备)那样的可穿戴设备、以及搭载移动操作系统并能够进行语音控制的投影仪等能够具体实现语音控制的所有图像显示装置上具体实现。
[0039] 如图1中所图示,近来适用于智能手机、平板电脑等而广为使用的触摸屏的输入控制方式中有电阻式和电容式,其中,电阻式是测定触摸屏的施加有压的部分的坐标值而在该部分产生输入信号的方式,电容式是附着于触摸屏的四个棱边的传感器检测已进行触摸的部分的电子变化而测定坐标值并在该部分产生输入信号的方式。触摸屏方式是在图形用户界面(Graphic User Interface,GUI)环境中直观的输入方式,因而用户便利性非常高。现有语音控制方式是使语音指令与特定执行内容以1:1来对应的方式执行,而本发明其特征在于通过与现有语音控制方式截然不同的访问而能够将触摸屏方式的优点适用于语音控制。
[0040] 在本发明中,上述执行单元区域是触摸屏输入方式中相当于触摸屏和触摸手段(例如,手指、静电笔等)所接触的接触面的概念,是指在通过上述显示部而显示的画面上产生输入信号和执行信号的范围。即、上述执行单元区域基本上是指以诸多像素(Pixel)构成的一定区域,也就是即使在相应区域上的任何像素产生输入信号或执行信号也能够看作是带来相同的结果的区域的、能够以包括一个图标配置区域、超级链接部等的方式划分的概念。如下面将要观察的实施例和图2至图6所示,作为上述执行单元区域例子,可举出在显示于智能手机的显示部的画面上各种应用程序的快捷方式图标所排列的各个矩阵型格子区域,上述执行单元区域是各画面其大小和数量、形状以及排列可以变化的可变性概念。
[0041] 上述存储部以内置于语音控制图像显示装置的存储器芯片来具体实现,其中,上述语音控制图像显示装置以智能手机、平板电脑等来具体实现。标识语音数据按照通过上述显示部而显示的画面上的执行单元区域分配并映射(mapping)在上述数据库,具体来讲,上述数据库包括按照在画面上被认定为相同的执行单元区域的区域赋予的固有的坐标信息。另外,考虑到用户的口腔构造和发声特性并为了提高语音识别率,上述标识语音数据还能够利用用户亲自录音的数据。另外,上述存储部由于预先存储通过上述显示部而显示的基本的画面的各执行单元区域的分布图案格式,因而还能够通过用户而选择特定格式。
[0042] 上述语音识别部是接受用户的语音输入的部分,其以内置于语音控制图像显示装置的麦克装置及语音识别电路来具体实现,其中,上述语音控制图像显示装置以智能手机、平板电脑等来具体实现。
[0043] 上述信息处理部和上述控制部以包括内置于语音控制图像显示装置的中央处理器(CPU)和随机存取存储器(RAM)在内的控制电路部来具体实现,其中,上述语音控制图像显示装置以智能手机、平板电脑等来具体实现。上述信息处理部在上述语音识别部接收了用户的语音的情况下发挥检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的作用,具体来讲,上述信息处理部在与上述用户的语音对应的标识语音数据存在的情况下检测出该标识语音数据所分配的执行单元区域的固有坐标信息。另外,上述控制部在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下发挥在该标识语音数据所分配的执行单元区域产生输入信号的作用,即在具有通过上述信息处理部而检测出的坐标信息的画面上的区域产生输入信号。输入信号的产生结果因存在于相应执行单元区域的内容而异。在相应执行单元区域存在特定应用程序的快捷方式图标的情况下将执行该应用程序,在相应执行单元区域存在虚拟键盘字盘的特定文字的情况下将输入该特定文字,在相应执行单元区域指定有如切换画面那样的命令的情况下将执行该命令,根据情况还可以不执行任何命令。
[0044] 图2是安卓(Android)智能手机的一般主画面。图3是在上述主画面触摸了‘应用程序’②时出现的应用程序画面。所要通过操作触摸屏而在非为主画面的应用程序画面执行应用程序‘abc’①的情况下,触摸主画面的右侧下端‘应用程序’②,其结果若出现应用程序画面则触摸应用程序画面上的‘abc’③即可。
[0045] 在本发明中,能够以语音控制方式来具体实现这种过程。具体来讲,如图4所示,通过上述显示部而显示的画面上的执行单元区域被划分,如图5所示,就上述数据库而言,包括主画面和应用程序画面在内的各个画面分别按照执行单元区域分配并映射而生成有标识语音数据,在假定为在以库(library)①来显示的主画面上的执行单元区域‘F4’映射有称为‘应用程序’的标识语音数据,且在以库②来显示的应用程序画面上的执行单元区域‘C1’映射有称为‘abc’的标识语音数据时,在上述显示部显示主画面,在通过上述语音识别部而输入了称为‘应用程序’的用户的语音的情况下,上述信息处理部检索对于主画面的数据库而判断与称为‘应用程序’的用户的语音对应的标识语音数据是否存在。在上述信息处理部检索到与称为‘应用程序’的用户的语音对应的标识语音数据即‘应用程序’的情况下,上述控制部在该标识语音数据所分配的执行单元区域即‘F4’产生输入信号。其结果执行应用程序画面。另外,在应用程序画面在上述显示部正在执行的状态下通过上述语音识别部而输入了称为‘abc’的用户的语音的情况下,上述信息处理部检索对于应用程序画面的数据库而判断与称为‘abc’的用户的语音对应的标识语音数据是否存在。在上述信息处理部检索到与称为‘abc’的用户的语音对应的标识语音数据即‘abc’的情况下,上述控制部在该标识语音数据所分配的执行单元区域即‘C1’产生输入信号。其结果执行称为‘abc’的应用程序。
[0046] 通过上述实施例可确认出,上述数据库其特征是,对于通过上述显示部而显示的2个以上互不相同的画面,能够按照各画面上的执行单元区域分配并映射有标识语音数据。以这种方式构成数据库,则使显示于各画面上的执行单元区域的图标的名称明确,因而是要将该图标的名称用作标识语音数据时理想的方式。另一方面,在执行单元区域的分布相同的画面的情况下,还可以具有相同的数据库。例如,在如图2至图5的实施例所示那样通过上述显示部而显示的各画面具有由6×4的矩阵构成的执行单元区域的情况下,可考虑将字母字符如图6所示那样自存在于画面上端右侧的执行单元区域以字母顺序并作为各执行单元区域所固有的标识语音数据而分配。就这种方式的数据库构成而言,其在由于显示于各画面上的执行单元区域的图标的名称并不明确等理由而具有与画面的变化无关的不变的标识语音数据为有效时较佳。尤其,在以这种方式构成数据库的情况下理想的是,上述显示部以在显示画面时连按照画面上的执行单元区域分配的标识语音数据也一起显示的方式构成。具体来讲,可考虑在画面上利用背景而模糊地显示各执行单元区域的固有标识语音数据的方法等。
[0047] 根据本发明的语音控制图像显示装置其特征在于,能够构成为:在上述数据库中进一步存储有与控制命令对应的控制语音数据,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述信息处理部,在上述语音识别部接收了用户的语音的情况下检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在;上述控制部,在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与该控制语音数据对应的控制命令。
[0048] 在图7中图示有将标识语音数据和控制语音数据配合而使用的具体实施例。图7的实施例假定如下:通过上述显示部而显示的画面划分为由6×4的矩阵构成的执行单元区域,在各执行单元区域从画面右侧上端的执行单元区域以字母顺序分配有标识语音数据,在上述数据库进一步存储有作为用于放大画面的控制命令的称为‘放大(Zoom-In)’的控制语音数据。在这种情况下,在用户以用户的语音连续输入‘F’和‘放大(Zoom-In)’的情况下,上述控制部将画面上的相片中执行单元区域F(相当于第2行第2列的部分)放大而显示。当然,还能够任意设定标识语音数据和控制语音数据的输入顺序。
[0049] 另一方面,还能够将根据本发明的语音控制图像显示装置作为第一设备并将不能或不便进行语音控制的另一装置作为第二设备而执行镜像(mirroring)。通过这种镜像,能够将在上述语音控制图像显示装置中所具体实现的语音控制方式为了控制其它设备而使用。作为第二设备可假定为设置于汽车的车载信息娱乐系统、智能电视等。
[0050] 此时,第二设备的控制界面通过第一设备即上述语音控制图像显示装置而显示,对此,在难以标识第二设备的信息的情况下,仅将第二设备的图像信号和控制信息中控制信息的文本按照显示于第一设备的画面上的执行单元区域显示,且上述信息处理部通过基于文本的语音合成而将各文本生成为标识语音数据,并按照执行单元区域映射标识语音数据而生成数据库,之后在通过上述显示部而显示的画面仅显示上述控制信息的文本,由此用户能够将显示于上述显示部的控制信息的文本用作语音指令。
[0051] 另外,在进行无线镜像时所使用的无线通信方式的带宽并不足够或者从第二设备传输的信息过多的情况下,在向第一设备即上述语音控制图像显示装置传输第二设备的信息时进行定标(scaling)以能够仅传输适当水平的信息。
[0052] 2.图像显示装置的语音控制方法
[0053] 本发明还提供一种图像显示装置的语音控制方法,该方法是在上述语音控制图像显示装置执行的图像显示装置的语音控制方法,所述图像显示装置的语音控制方法其特征在于,构成为包括:(a)上述存储部存储标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)的数据库的步骤;(b)上述语音识别部接受用户的语音输入的步骤;(c)上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤;以及(d)在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤。上述图像显示装置的语音控制方法其前提是在前面所说明的根据本发明的语音控制图像显示装置执行。在图8图示有根据本发明的图像显示装置的语音控制方法的流程图。
[0054] 上述(a)步骤是上述存储部建立数据库的步骤,而上述数据库使标识语音数据按照通过上述显示部而显示的画面上的执行单元区域所分配并映射(mapping)。具体来讲,上述数据库包括按照在画面上被认定为相同的执行单元区域的区域赋予的固有的坐标信息,考虑到用户的口腔构造和发声特性并为了提高语音识别率,上述标识语音数据还能够利用用户亲自录音的数据。另外,上述存储部由于预先存储通过上述显示部而显示的基本的画面的各执行单元区域的分布图案格式,因而还能够通过用户而选择特定格式。
[0055] 上述(b)步骤是上述语音识别部接受用户的语音输入的步骤。本步骤是在上述语音控制图像显示装置切换成语音识别模式的状态下执行。为了使用户有效地认知标识语音数据,最好在按照显示于上述显示部的画面上的执行单元区域分配的标识语音数据被显示的状态下执行本步骤。
[0056] 上述(c)步骤是上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据是否存在的步骤。具体来讲,上述信息处理部在与上述用户的语音对应的标识语音数据存在的情况下,检测出该标识语音数据所分配的执行单元区域的固有坐标信息。
[0057] 上述(d)步骤是在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,上述控制部在该标识语音数据所分配的执行单元区域产生输入信号的步骤。在本步骤中,上述控制部在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据的情况下,发挥在该标识语音数据所分配的执行单元区域产生输入信号的作用,即在具有通过上述信息处理部而检测出的坐标信息的画面上的区域产生输入信号。输入信号的产生结果因存在于相应执行单元区域的内容而异。在相应执行单元区域存在特定应用程序的快捷方式图标的情况下将执行该应用程序,在相应执行单元区域存在虚拟键盘字盘的特定文字的情况下将输入该特定文字,在相应执行单元区域指定有如切换画面那样的命令的情况下将执行该命令,根据情况还可以不执行任何命令。
[0058] 另一方面,根据本发明的图像显示装置的语音控制方法其特征在于,能够构成为:上述(a)步骤以上述存储部存储进一步包括与控制命令对应的控制语音数据的数据库的方式执行,其中,上述控制命令用以在与标识语音数据配合使用的情况下以标识语音数据所分配的执行单元区域为基准执行特定的画面控制;上述(c)步骤以上述信息处理部检索上述数据库而判断与上述用户的语音对应的标识语音数据和控制语音数据是否存在的方式执行;上述(d)步骤以在上述信息处理部的判断结果存在与上述用户的语音对应的标识语音数据和控制语音数据的情况下,上述控制部产生该标识语音数据所分配的执行单元区域输入信号,并以产生了输入信号的执行单元区域为基准执行与上述控制语音数据对应的控制命令的方式执行。与此相关的具体实施例与在图7所观察的实施例相同。
[0059] 以上与具体实施例一起详细说明了根据本发明的语音控制图像显示装置及图像显示装置的语音控制方法。然而,本发明并不限定于上述具体实施例,在不逸出本发明的要旨的范围内能够进行或多或少的修改变形。因此,本发明的权利要求书包括落入本发明的真正范围内的修改及变形。
[0060] 工业上可利用性
[0061] 根据本发明的语音控制图像显示装置及图像显示装置的语音控制方法,将按照通过显示部而显示的画面上的执行单元区域分配的语音数据与所输入的用户的语音进行比较,利用这种方式来执行输入控制,从而将现有触摸屏方式的输入控制方式照旧适用于语音控制方式,因而本发明是能够具体实现简便而准确的语音控制的技术,从这一点上具有工业上可利用性。
QQ群二维码
意见反馈