首页 / 国际专利分类库 / 物理 / 乐器;声学 / 语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
序号 专利名 申请号 申请日 公开(公告)号 公开(公告)日 发明人
101 一种音频信号控制信号传输系统及使用方法 CN201710328254.X 2017-05-11 CN107204112A 2017-09-26 熊安永; 庞念彬; 杨卓
发明公开了一种音频信号控制信号传输系统,包括发射部分和接收部分,所述发射部分包括依次连接的发射音频接口、音频数据编码模块、数据打包模块、数据调制模块,所述接收部分包括依次连接的接收音频接口模块、音频数据解码模块、数据拆包模块、数据解调模块,所述数据调制模块与所述数据解调模块网络连接,所述发射部分还包括发射控制信号接口模块及与其连接的控制信号数据编码模块,所述控制信号数据编码模块与所述数据打包模块连接,所述接收部分还包括接收控制信号接口模块及与其连接的控制信号数据解码模块,所述控制信号数据解码模块与所述数据拆包模块连接。本发明具有安装使用方便、布线成本降低、传输质量较高等特点。
102 基于DCT和LBP特征融合的图像特征提取方法 CN201710289330.0 2017-04-27 CN107203769A 2017-09-26 侯庆志; 张克兴; 王建荣; 于健; 赵满坤; 曲悦欣
发明属于语音识别、多模态信息处理和图像处理领域,为通过综合考虑图像的整体特征和局部特征,提供一种基于特征融合的、相对完善的特征提取方法,能有效地弥补使用单一特征在图像特征提取上的不足,使提取的图像特征更加完整。本发明采用的技术方案是,基于DCT和LBP特征融合的图像特征提取方法,步骤如下:步骤一:获取DCT特征;步骤二:获取LBP特征;步骤三:将提取的DCT特征向量和LBP特征向量拼接到一起得到图像的最终特征。本发明主要应用于设计制造场合。
103 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法 CN201480002625.X 2014-07-15 CN104769671B 2017-09-26 萨沙·迪施; 弗雷德里克·纳格尔; 拉尔夫·热日尔; 巴拉吉·纳根德兰·托斯卡纳; 康斯坦丁·施密特; 斯特凡·拜尔; 克里斯蒂安·诺伊坎; 贝恩德·埃德勒; 克里斯蒂安·黑尔姆里希
一种用于对编码音频信号进行解码的设备,包括:频谱域音频解码器(602),其用于生成第一组第一频谱部分的第一解码表示,第一解码表示是频谱预测残差值;频率再生器(604),其用于使用第一组第一频谱部分中的第一频谱部分来生成重构的第二频谱部分,其中,重构的第二频谱部分另外地包括频谱预测残差值;以及逆预测滤波器(606),其用于使用包括在编码音频信号中的预测滤波器信息(607)使用第一组第一频谱部分和重构的第二频谱部分的频谱残差值来执行关于频率的逆预测。
104 一种语音输入方法及移动终端 CN201710339137.3 2017-05-15 CN107193914A 2017-09-22 李滨何
发明实施例公开了一种语音输入方法及移动终端,其中,该方法包括:检测移动终端当前显示界面中的目标输入栏,该目标输入栏为未输入文字信息的输入栏;接收用户按照预设方式触发的语音输入开启指令;根据该语音输入开启指令,开启语音输入模式;在该语音输入模式下,接收输入的语音信息;在目标输入栏中显示该语音信息对应的文字信息。实施本发明实施例,能够提高语音输入的操作效率。
105 音频处理方法和音频处理设备 CN201480054981.6 2014-09-26 CN105612767B 2017-09-22 艾伦·J·泽费尔特; 马克·S·文顿; C·菲利普·布朗
诸如上混器的音频处理系统能够分离N个输入音频信号的散射部分和非散射部分。上混器能够检测瞬时音频信号条件的情况。在瞬时音频信号条件的情况期间,上混器能够向输出M个音频信号的散射信号扩展处理添加信号自适应控制。上混器可以随时间改变散射信号扩展处理,使得在瞬时音频信号条件的情况期间,音频信号的散射部分可以基本上仅被分布至空间上靠近输入通道的输出通道。在非瞬时音频信号条件的情况期间,音频信号的散射部分可以以基本均匀的方式分布。
106 一种可改变音频、音色、音调传声方法 CN201710565013.7 2017-07-12 CN107180641A 2017-09-19 颜佳
申请实施例公开了一种可改变音频、音色、音调传声方法,包括:传声筒接收用户在第一开口输入的声音,所述第一开口为所述传声筒中的一个开口;所述传声筒将所述声音进行变声和/或改变所述声音的尾音;所述传声筒将处理后的声音传输至第二开口,所述第二开口为所述传声筒的一个开口。这样,传声筒在接收到用户输入的声音后,还对该声音进行了变声和/或改变声音的尾音的处理,使得另一开口听该声音的用户无法轻易辨别输入声音用户是谁,提高了趣味性,也提高了用户体验。
107 短语辨认系统和方法 CN201310462805.3 2013-10-08 CN103714813B 2017-09-19 S·沙弗尔; K·庞廷; V·C·马图拉
发明涉及一种短语辨认系统和方法。本发明提供用于在音频流之内识别指定短语的方法和系统。更指定地,指定短语。然后针对短语监控音频流。响应于确定音频流包含短语,从用户请求短语实际被包括在音频流中的验证。如果这样的验证被接收到,则记录音频流的包括短语的部分。记录的短语然后可以应用于在监控的音频流中识别短语的未来实例。
108 一种用于实时语音识别的蓝牙机及系统 CN201710519732.5 2017-06-30 CN107172521A 2017-09-15 石城川; 陈国强
发明提供一种用于实时语音识别的蓝牙机及系统,包括耳机外壳、设置在耳机内部的智能装置及运行在移动终端上面的软件。该智能装置包括语音输入模、蓝牙模块和电源模块;语音输入模块收集语音信号,蓝牙模块将语音信号传输给移动终端上面的软件,软件进行语音识别,将识别之后的文字信息实时显示在移动终端的显示屏上面。健听人佩戴着蓝牙耳机说话,听障人拿着移动终端并打开相应软件,由此,听障人可以实时看到健听人讲话的内容,提高了沟通效率。
109 基于MVDR的隐声方法 CN201710163190.2 2017-03-19 CN107170462A 2017-09-15 陈景东; 梁菲菲; 王雪瀚; 黄海; 聂玮奇
发明公开了一种基于MVDR的隐声方法,该方法是先利用短时傅里叶变换,将传感器阵列接收到的时域信号分解成频域子带信号,在各子带上构造基于MVDR的隐声滤波器,使得来自隐声距离以内声源的声信号无衰减通过隐声滤波器,最终通过反STFT得到估计信号。本发明具有较好的隐声效果。
110 一种基于声音刺激的视觉图像感知系统和方法 CN201710441277.1 2017-06-13 CN107157651A 2017-09-15 王宁远; 丁鼐; 苏乃婓; 孙晓安; 黄穗; 张晓薇; 田春; 李方波
发明公开了一种基于声音刺激的视觉图像感知系统和方法,其中系统包括眼镜架、体外机和机,其中眼镜架上设置摄像头;体外机包括图像处理、声音合成模块和声音播放模块,所述摄像头与体外机的图像处理模块连接,摄像头获取二维或三维图像,图像处理模块将二维或三维图像进行深度检测、二值化、轮廓提取和字符识别后,输出给声音合成模块进行声音处理后,将声音信号传输给声音播放模块通过双通道气导或骨导耳机播放。本发明可帮助盲人通过立体声音感知物体的轮廓,形状,甚至距离远近,方便他们进行简单的物体识别,会对盲人的生活带来极大的帮助。
111 用于对多信道HOA音频信号进行编码以便降噪的方法和设备以及用于对多信道HOA音频信号进行解码以便降噪的方法和设备 CN201380036698.6 2013-07-16 CN104428833B 2017-09-15 J.贝姆; S.科唐; A.克鲁格; P.贾克斯
一种用于对多信道HOA音频信号进行编码以便降噪的方法,包括以下步骤:使用逆自适应DSHT对信道进行解相关(81),所述逆自适应DSHT包括旋转运算(330)和逆DSHT(810),所述旋转运算旋转iDSHT的空间采样网格;对每个经解相关的信道进行感知编码(82);对旋转信息(SI)进行编码,所述旋转信息包括定义所述旋转运算的参数;以及,传输或存储经感知编码的信道和经编码的旋转信息。
112 用于音频数据处理的装置和方法 CN201280065399.0 2012-09-13 CN104012068B 2017-09-15 B.卡里米-切尔坎迪; V.兰加纳森; S.W.阿利
一种通信终端、系统以及方法利用了激活语音到文本应用以便使得将从呼叫者接收到的后续音频转换成文本的通信设备。呼叫者然后可以响应于问题来提供音频。呼叫者可以通过例如按压通信设备上的按钮来发送输入,以激活所述语音到文本应用,说出回答,并且然后按压按钮来指示对问题的回答完成。所说出的回答可以被转换成文本并且然后可以被存储、解析,以及然后被分配给表示发布给呼叫者的问题的对象。分配给表示所述问题的所述对象的所存储的文本然后可以被用来填充不同的表格或数据库以供后续使用,或者用于经由那个人的计算机设备的显示设备来显示给用户。
113 用于适配情境模型的方法和装置 CN201080068322.X 2010-07-01 CN103038765B 2017-09-15 M·安尼克塞拉; A·埃罗南; J·莱帕南
公开一种用于适配情境模型的方法、设备、计算机程序产品和因特网服务。在该方法中,接收媒体剪辑。也接收至少部分在捕获媒体剪辑时捕获的传感器数据。至少部分基于传感器数据使用情境模型来推导情境,并且向用户提供关于情境的指示。从用户接收关于情境的相关度的反馈。基于反馈,继而可以适配情境模型。
114 子带处理单元、生成合成子带信号的方法以及存储介质 CN201410460670.1 2011-01-05 CN104318928B 2017-09-12 拉尔斯·维尔默斯
本文档涉及子带处理单元、生成合成子带信号的方法以及存储介质。子带处理单元包括提取器、非线性处理单元以及重叠及相加单元。块提取器被配置为重复地根据多个复值分析样本得出L个输入样本的帧;以及在得出L个输入样本的接下来的帧之前对多个复值分析样本应用p个样本的块跳跃大小由此生成输入样本的一系列帧。非线性帧处理单元被配置为根据输入样本的帧确定经处理样本的帧。重叠及相加单元被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定合成子带信号,其中分析子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联。
115 用于信号增强的增益后处理 CN201210080971.2 2012-03-23 CN103325380B 2017-09-12 孙学京; 格伦·N·迪金森
发明涉及一种方法、一种装置以及逻辑,用于对通过输入处理确定的原始增益进行后处理以生成经后处理的增益,包括使用增量增益平滑和判决引导的增益平滑之一或两者。增量增益平滑包括将具有取决于如下增益增量的平滑因子的平滑滤波器应用于原始增益:当前的原始增益和前一帧的经后处理的增益之间的差的绝对值。判决引导的增益平滑包括将原始增益转换为信噪比,将具有平滑因子的平滑滤波器应用到信噪比以计算平滑信噪比,以及转换平滑信噪比以确定第二平滑增益,其中平滑因子可能取决于增益增量。
116 基于二进制语音识别的慢病数据备份装置及方法 CN201710529300.2 2017-07-01 CN107147746A 2017-09-08 张贯京; 葛新科; 王海荣; 张红治; 周亮
发明提供一种基于二进制语音识别的慢病数据备份装置及方法,该方法包括:第一数据处理装置从第一服务器接收待备份的慢病数据并将慢病数据转换成二进制码;第一数据处理装置控制语音播放装置播放二进制码;当所述语音播放装置播放二进制码时,第二数据处理装置控制录音装置记录所播放的二进制码;第二数据处理装置通过语音识别算法识别出所记录的二进制码,并根据识别出的二进制码转换成对应的慢病数据并保存于第二服务器中。实施本发明可以避免数据直接传输导致的网络攻击的传染性,当第一服务器受到网络攻击而宕机时,作为备用的第二服务器并不会受到网络攻击,有效提升了不同服务器之间的数据安全。
117 环境监控方法、装置及具有该装置的空调 CN201710295035.6 2017-04-28 CN107144341A 2017-09-08 郑文成; 王子; 刘光有; 毛跃辉; 梁博
发明提供了一种环境监控方法、装置及具有该装置的空调。其中环境监控方法包括:声音采集步骤,用于采集环境声音信息;判断步骤,用于识别所述采集到的环境声音信息是否符合场景特征,和/或判断所述采集到的环境声音信息的音量是否大于预设的音量阈值,当所述采集到的环境声音信息符合场景特征,和/或所述采集到的环境声音信息的音量大于预设的音量阈值时,判断为声音环境异常。本发明的技术方案通过声音识别来实施环境监控布防,通过识别场景特征和音量判断,从各个度对环境声音信息进行全面精确地监控,减少了环境异常的漏判率,使环境安全更有保障性,提高了环境监控的可靠性。
118 由智能数字助理进行的中断的上下文相关处理 CN201380045211.0 2013-09-10 CN104584096B 2017-09-08 M·范奥斯
发明公开了与由数字助理进行的智能中断处理相关的方法和系统。在一些实施例中,响应于接收到第一语音输入而发起第一信息提供过程。该第一信息提供过程包括准备对第一语音输入的第一响应和第二响应。在将第一响应提供至用户之后或同时,但在将第二响应提供至用户之前,检测到用于发起第二信息提供过程的事件。响应于检测到该事件而发起第二信息提供过程。该第二信息提供过程包括准备对事件的第三响应。确定第二响应和第三响应之间的相对紧迫性。基于所确定的相对紧迫性以一定次序将第二响应和第三响应中的一者提供至用户。
119 导航期间的语音指令 CN201380028721.7 2013-05-28 CN104335012B 2017-09-08 M·范奥斯; S·G·巴鲍尔; B·A·洛; B·A·摩尔
发明公开了一种在显示屏被定时在电子设备上提供导航的方法。该方法在显示器被锁定时接收对开始导航的言语请求。该方法基于所接收的言语请求来标识从当前位置到目标的路线。当显示屏被锁定时,该方法在电子设备上提供从电子设备的当前位置到目标的导航指引。一些实施例提供一种用于处理言语搜索请求的方法。该方法接收导航相关的言语搜索请求并且基于所接收的请求准备搜索结果的顺序列表。该方法随后提供用以呈现来自顺序列表的搜索结果的可听信息。该方法以成批形式提供搜索结果,直到用户选择搜索结果、终止搜索或搜索项用尽。
120 一种基于Kinect的轨道列车驾驶员状态的实时监测和预警方法与系统 CN201710470384.7 2017-06-20 CN107126224A 2017-09-05 刘辉; 李燕飞
发明公开了一种基于Kinect的轨道列车驾驶员状态的实时监测和预警方法与系统,该方法通过对Kinect传感器进行巧妙的设置,综合利用Kinect传感器的各项检测功能,只使用一种Kinect传感器,实现了列车启动检测、驾驶员心率监测、疲劳监测、误判监测多种功能,利用Kinect传感器获取的彩色图像数据、深度图像数据、骨骼图像数据和语音数据进行数据处理;融合使用各项检测数据,结合轨道列车驾驶员语音信息、驾驶员手势信息、列车指令信号信息特征融合的方法,从技术方案上直接避免司机看错误判信号和指令的情况;该系统结构简单、操作方便,大大的降低了监测和预警系统的成本,且具有准确的监测和预警效果。
QQ群二维码
意见反馈