首页 / 专利库 / 人工智能 / 图像识别 / 一种具备语音交互功能的广告机

一种具备语音交互功能的广告机

阅读:396发布:2024-02-13

专利汇可以提供一种具备语音交互功能的广告机专利检索,专利查询,专利分析的服务。并且本 发明 实施例 提供了一种具备语音交互功能的广告机,包括:壳体、显示模 块 、语音处理模块及控 制模 块,所述显示模块设置于所述壳体外侧,语音处理模块设置在壳体内并透过壳体表面与外界连通,以拾取外部语音,所述 控制模块 位于所述壳体内部并分别与显示模块和语音处理模块 信号 连接;其中,所述显示模块用于显示多媒体内容;所述语音处理模块用于拾取语音并对获取的语音信息进行语义识别,并将语义识别结果发送给控制模块;所述控制模块用于根据接收到的语义识别结果改变显示模块的显示内容。,下面是一种具备语音交互功能的广告机专利的具体信息内容。

1.一种具备语音交互功能的广告机,其特征在于,所述广告机包括:壳体、显示模、语音处理模块及控制模块,所述显示模块设置于所述壳体外侧,语音处理模块设置在壳体内并透过壳体表面与外界连通,以拾取外部语音,所述控制模块位于所述壳体内部并分别与显示模块和语音处理模块信号连接;其中,
所述显示模块用于显示多媒体内容;
所述语音处理模块用于拾取语音并对获取的语音信息进行语义识别,并将语义识别结果发送给控制模块;
所述控制模块用于根据接收到的语义识别结果改变显示模块的显示内容。
2.根据权利要求1所述的广告机,其特征在于,所述语音处理模块包括:语音获取单元、语音转换单元及语音识别单元;其中,
所述语音获取单元用于获取外部输入的第一语音信息,并将获取的第一语音信息发送给语音转换单元;
所述语音转换单元用于对接收到的第一语音信息进行模数转换得到第二语音信息;
所述语音识别单元用于提取第二语音信息中的语音特征参数,并对提取的语音特征参数进行语义识别,得到语音识别结果。
3.根据权利要求2所述的广告机,其特征在于,所述语音获取单元为麦克
4.根据权利要求1至3其中任一项所述的广告机,其特征在于,所述广告机还包括:图像处理模块用于对获取的图像信息进行图像识别,并将图像识别结果发送给控制模块;
所述控制模块还用于根据接收到的图像识别结果改变显示模块的显示内容或进行用户信息录入或进行用户登录认证。
5.根据权利要求4所述广告机,其特征在于,所述视觉识别模块包括:图像采集单元和图像识别单元;其中,
所述图像采集单元用于采集图像信息;
所述图像识别单元用于从所述图像采集单元采集到的图像信息中提取图像特征信息,对所述图像特征信息进行图像识别,得到图像识别结果。
6.根据权利要求5所述的广告机,其特征在于,所述图像采集单元为摄像头。

说明书全文

一种具备语音交互功能的广告机

技术领域

[0001] 本发明涉及多媒体广告机技术领域,具体涉及一种具备语音交互功能的广告机。

背景技术

[0002] 广告机是指通过终端软件控制、网络信息传输和多媒体终端显示构成一个完整的广告播控系统,并通过图片、文字、视频、小插件等多媒体素材进行广告宣传的新一代智能设备。随着多样化的媒体传播技术的快速发展,广告机作为常用的媒体播放装置也越来越广泛的应用在了商业楼宇、卖场超市、航空终端、医院、户外公共场所、公共交通、学校校园、地站等地点。
[0003] 近年来,随着多样化的媒体传播技术的快速发展,广告机作为常用的媒体播放装置也得到越来越广泛的应用。但现有的广告机大多只是纯粹的进行广告的播放,无法为用户提供多样性的人机交互功能,这样,容易给用户造成听觉和视觉上的疲劳,达不到理想的广告的效果。

发明内容

[0004] 为了解决现有技术中广告机无法为用户提供多样性的人机交互功能的问题,本发明实施例期望提供一种具备语音交互功能的广告机。
[0005] 本发明实施例提供了一种具备语音交互功能的广告机包括:壳体、显示模、语音处理模块及控制模块,所述显示模块设置于所述壳体外侧,语音处理模块设置在壳体内并透过壳体表面与外界连通,以拾取外部语音,所述控制模块位于所述壳体内部并分别与显示模块和语音处理模块信号连接;其中,
[0006] 所述显示模块用于显示多媒体内容;
[0007] 所述语音处理模块用于拾取语音并对获取的语音信息进行语义识别,并将语义识别结果发送给控制模块;
[0008] 所述控制模块用于根据接收到的语义识别结果改变显示模块的显示内容。
[0009] 上述方案中,所述语音处理模块包括:语音获取单元、语音转换单元及语音识别单元;其中,
[0010] 所述语音获取单元用于获取外部输入的第一语音信息,并将获取的第一语音信息发送给语音转换单元;
[0011] 所述语音转换单元用于对接收到的第一语音信息进行模数转换得到第二语音信息;
[0012] 所述语音识别单元用于提取第二语音信息中的语音特征参数,并对提取的语音特征参数进行语义识别,得到语音识别结果。
[0013] 上述方案中,所述语音获取单元为麦克
[0014] 上述方案中,所述广告机还包括:
[0015] 图像处理模块用于对获取的图像信息进行图像识别,并将图像识别结果发送给控制模块;
[0016] 所述控制模块还用于根据接收到的图像识别结果改变显示模块的显示内容或进行用户信息录入或进行用户登录认证。
[0017] 上述方案中,所述视觉识别模块包括:图像采集单元和图像识别单元;其中,[0018] 所述图像采集单元用于采集图像信息;
[0019] 所述图像识别单元用于从所述图像采集单元采集到的图像信息中提取图像特征信息,对所述图像特征信息进行图像识别,得到图像识别结果。
[0020] 上述方案中,所述图像采集单元为摄像头。
[0021] 与现有技术相比,本发明实施例至少具备以下优点:
[0022] 本发明实施例提供的具备语音交互功能的广告机能够为用户提供一种更为方便、灵活的人机交互方式,用户可通过语音来对广告机进行控制,解放了用户双手且使得人机交互更加人性化。相较于传统的广告机,本发明所提供的具备语音交互功能的广告机具备更好的趣味性,更易吸引人群,使得广告机的受众率大大提高,达到更好的宣传效果。附图说明
[0023] 图1为本发明实施例提供的具备语音交互功能的广告机在一个度的示意图一;
[0024] 图2为本发明实施例提供的具备语音交互功能的广告机的内部结构图一;
[0025] 图3为本发明实施例提供的具备语音交互功能的广告机的语音处理模块的基本结构图;
[0026] 图4为本发明实施例提供的具备语音交互功能的广告机在一个角度的示意图二;
[0027] 图5为本发明实施例提供的具备语音交互功能的广告机的图像处理模块的基本结构图;
[0028] 图6为本发明实施例提供的一种具备语音交互功能的广告机的示意图。

具体实施方式

[0029] 下面通过具体实施方式结合附图对本发明作进一步详细说明。
[0030] 参照图1和图2,示出了本发明一种具备语音交互功能的广告机的结构框图,所述广告机包括:壳体11、显示模块12、语音处理模块13及控制模块14,显示模块12设置于壳体11外侧,语音处理模块13设置在壳体内并透过壳体表面与外界联通,以拾取外部语音;控制模块14位于壳体11内部并分别与显示模块12和语音处理模块13信号连接;其中,[0031] 显示模块12用于显示多媒体内容;
[0032] 语音处理模块13用于拾取语音并对获取的语音信息进行语义识别,并将语义识别结果发送给控制模块14;
[0033] 控制模块14用于根据接收到的语义识别结果改变显示模块的显示内容。
[0034] 具体的,显示模块12可以通过设置于广告机上的液晶显示屏实现,主要用于展示广告。
[0035] 具体的,参见图3,上述语音处理模块13包括:语音获取单元1301、语音转换单元1302及语音识别单元1303;其中,
[0036] 所述语音获取单元1301用于获取外部输入的第一语音信息,并将获取的第一语音信息发送给语音转换单元1302;
[0037] 所述语音转换单元1302用于对接收到的第一语音信息进行模数转换得到第二语音信息,即,将语音信息从模拟信号(第一语音信息)转换为数字信号(第二语音信息);
[0038] 所述语音识别单元1303用于提取第二语音信息中的语音特征参数,并对提取的语音特征参数进行语义识别,得到语音识别结果。
[0039] 实际实现中,所述语音获取单元1301可以由具备音频采集功能的麦克风来实现;所述语音转换单元1302可以由音频模数转换器来实现。
[0040] 语音识别单元1303采用预设语音识别模型对语音特征参数进行语义识别,从而得到语音识别结果。
[0041] 语音处理模块13对获取的语音信号进行语义识别得到语义识别结果后,将语义识别结果发送给控制模块14,控制模块14中预先设置有不同语义识别结果所对应的控制指令,因此,控制模块14通过比对直接确定出所述语义识别结果对应的控制指令,并执行相应的控制指令,从而实现不同操作。通过这一语音识别功能,能够实现用户对广告机的语音控制,如,用户可以通过语音识别功能用特定语音打断正在播放的广告节目并进入到人机交互界面,或者,将处于休眠状态的广告机唤醒,进行人机交互体验;更进一步的,用户还可以通过语音识别功能询问日常信息,如天气,歌曲,电影,新闻等内容,所述日常信息可以为预设于广告机内的信息或者从网络上获取的信息。
[0042] 可见,用户可以通过特定语音来操作广告机,这直接避免了用户使用手动输入方式操作广告机的繁琐,解放了用户的双手,使得人机交互更加人性化,也提高了用户体验。
[0043] 参见图2和图4,在本发明的一种可选实施例中,所述广告机还包括:
[0044] 图像处理模块15用于对获取的图像信息进行图像识别,并将图像识别结果发送给控制模块;
[0045] 所述控制模块,还用于根据接收到的图像识别结果改变显示模块的显示内容或进行用户信息录入或进行用户登录认证。
[0046] 具体的,上述视觉识别模块15,参见图5,包括:图像采集单元1501和图像识别单元1502;其中,
[0047] 所述图像采集单元1501用于采集图像信息;
[0048] 所述图像识别单元1502用于从所述图像采集单元1501采集到的图像信息中提取图像特征信息,对所述图像特征信息进行图像识别,得到图像识别结果。
[0049] 实际实现中,所述图像获取单元1501可以由具备图像采集功能的摄像头来实现。
[0050] 图像处理模块15对图像信息进行识别后得到图像识别结果,之后,将图像识别结果发送给控制模块14,控制模块14中预先设置有不同图像识别结果所对应的控制指令,因此,控制模块14通过比对直接确定出所述图像识别结果对应的控制指令,并执行相应的控制指令,从而实现不同操作。
[0051] 实际应用中,所述图像识别结果可以为手势图像或者人脸图像,手势图像可用于用户与广告机内安装的游戏软件进行交互,即,不同手势图像的图像识别结果对应不同的游戏操作,控制模块14确定出图像识别结果对应的操作之后,执行相应操作,从而实现用户通过变换手势即可实现对游戏的操作。人脸图像可用于用户通过人脸识别对系统的登录认证,或者,用于用户资料的登记录入。
[0052] 可见,增加了图像处理模块15之后,本发明实施例所提供的广告机不仅能够通过语音来对广告机进行控制,还能够通过手势对广告机进行控制,而且用户可以在广告机上直接通过人脸识别完成用户信息的登记或用户身份的鉴别
[0053] 参见图6,示出了依据本发明实施例所设计的一种具备语音交互功能的广告机的示意图,如图6所示,所述广告机包括:视觉区61、听觉区62及显示区63;上述方案中的显示模块12即设置于显示区内,语音处理模块13即设置于听觉区62内,图像处理模块15即设置于视觉区61内。本领域技术人员可以理解的是图6仅给出了本发明的一种示例,并不用于限定本发明的保护范围。在实现实现时,具备语音交互功能的广告机中视觉区、听觉区及显示区的位置不局限于图6所示出的位置;所述视觉区、听觉区及显示区的数量不局限于图6示出的数量;所述视觉区、听觉区及显示区的形状也不局限于图6示出的形状。
[0054] 本发明所提供的具备语音交互功能的广告机为用户提供了一种更为方便、灵活的人机交互方式,用户可通过语音来对广告机进行控制,解放了用户双手且使得人机交互更加人性化。相较于传统的广告机,本发明所提供的具备语音交互功能的广告机具备更好的趣味性,更易吸引人群,使得广告机的受众率大大提高,达到更好的宣传效果。
[0055] 在具体实施过程中,上述语音处理模块13、图像处理模块15及控制模块14可以由具备语音交互功能的广告机内的中央处理器(CPU,Central Processing Unit)、微处理器(MPU,Micro Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)或可编程逻辑阵列(FPGA,Field-Programmable Gate Array)来实现。
[0056] 本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0057] 本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0058] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0059] 这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0060] 尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0061] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0062] 以上对本发明所提供的一种具备语音交互功能的广告机,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,根据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈