首页 / 专利库 / 人工智能 / 人工智能 / 自然语言处理 / 信号处理装置及相关产品

信号处理装置及相关产品

阅读:838发布:2020-05-19

专利汇可以提供信号处理装置及相关产品专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 信号 处理装置,包括:信号采集器、指令转换器和 图像处理 器。采用本发明 实施例 可以实现 输入信号 即可对图像进行处理的功能,节省了用户在图像处理之前学习图像处理 软件 的时间,提高了用户体验。,下面是信号处理装置及相关产品专利的具体信息内容。

1.一种信号处理装置,其特征在于,包括:
信号采集器,用于采集用户输入的信号;
指令转换器,用于根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域;
图像处理器,用于根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。
2.根据权利要求1所述的信号处理装置,其特征在于,所述指令转换器包括:
第一信号识别器,用于将信号通过信号识别技术转换成文本信息,所述信号识别技术为以下至少一种:语音识别技术、语义理解技术、图像识别技术、自然语言处理技术;
信号文本转换器,用于将文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述图像处理指令;
第一图像识别器,用于根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
3.根据权利要求1所述的信号处理装置,其特征在于,所述指令转换器包括:
第二信号识别器,用于将所述信号通过所述信号识别技术和所述目标信号指令转换模型转换成所述图像处理指令;
第二图像识别器,用于根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
4.根据权利要求1-3任一项所述的信号处理装置,其特征在于,所述信号处理装置还包括:
存储器,用于存储所述文本信息或者所述图像处理指令或者所述目标区域。
5.根据权利要求4所述的信号处理装置,其特征在于,所述图像处理器包括取指令模,用于在预设时间窗口内从所述存储器中获取M条图像处理指令;
处理模块,用于根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
6.根据权利要求5所述的信号处理装置,其特征在于,所述处理模块用于:
删除所述M条图像处理指令中功能相同的图像处理指令,得到N条图像处理指令,所述M为大于1的整数,所述N为小于所述M的整数;
根据所述N条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
7.根据权利要求1的信号处理装置,其特征在于,所述指令转换器用于:
对信号指令转换模型进行自适应训练,以得到所述目标信号指令转换模型。
8.根据权利要求7所述的信号处理装置,其特征在于,所述指令转换器还用于:
根据所述信号指令转换模型将所述信号换成预测指令;
确定所述预测指令与其对应的指令集合的相关系数;
根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
9.根据权利要求1所述的信号处理装置,其特征在于,所述信号处理装置还包括:
训练器,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
10.根据权利要求1所述的信号处理装置,其特征在于,所述图像处理器用于:
对图像处理模型进行自适应训练,以得到所述目标图像处理模型。
11.根据权利要求10所述的信号处理装置,其特征在于,所述图像处理器还用于:
根据所述图像处理模型对所述待处理图像进行处理,以得到预测图像;
确定所述预测图像与其对应的目标图像的相关系数;
根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
12.根据权利要求1所述的信号处理装置,其特征在于,所述训练器还用于:
根据所述图像处理模型对所述待处理图像进行处理,以得到预测图像;
确定所述预测图像与其对应的目标图像的相关系数;
根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
13.根据权利要求1所述的信号处理装置,其特征在于,所述采集用户输入的信号之前,所述信号处理装置还用于:
对信号指令转换模型进行自适应训练,以得到所述目标信号指令转换模型。
14.根据权利要求13所述的信号处理装置,其特征在于,所述信号处理装置具体用于根据所述信号指令转换模型将所述语音信号换成预测指令;
确定所述预测指令与其对应的指令集合的相关系数;
根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
15.根据权利要求1所述的信号处理装置,其特征在于,所述信号处理装置还用于:
对图像处理模型进行自适应训练,以得到所述目标图像处理模型。
16.根据权利要求15所述的信号处理装置,其特征在于,所述信号处理装置具体用于:
根据所述图像处理模型对所述待处理图像进行处理,以得到预测图像;
确定所述预测图像与其对应的目标图像的相关系数;
根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
17.根据权利要求1-16所述的信号处理装置,其特征在于,在所述将所述处理图像转化为输出信息方面,所述图像处理器具体用于:
获取转换指令,所述转换指令包含指定数据类型,所述指定数据类型包括以下一种类型:语音类型、图像类型、文本类型;
在所述指定数据类型为图像类型时,输出所述处理图像;
在所述指定数据类型为文本类型时,输出文本信息;
在所述指定数据类型为语音类型时,输出语音信息。
18.根据权利要求1-17任一项所述的信号处理装置,其特征在于,所述指令转换器还包括:
交互模块,用于发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令。
19.一种机器学习运算装置,其特征在于,所述机器学习运算装置包括一个或多个如权利要求1-18任一项所述的信号处理装置,用于从其他处理装置中获取待运算输入数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
当所述机器学习运算装置包含多个所述信号处理装置时,所述多个所述信号处理装置间可以通过特定的结构进行连接并传输数据;
其中,多个所述信号处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算;多个所述信号处理装置共享同一控制系统或拥有各自的控制系统;多个所述信号处理装置共享内存或者拥有各自的内存;多个所述信号处理装置的互联方式是任意互联拓扑。
20.一种组合处理装置,其特征在于,所述组合处理装置包括如权利要求19所述的机器学习运算装置,通用互联接口和其他处理装置;
所述机器学习运算装置与所述其他处理装置进行交互,共同完成用户指定的计算操作。
21.根据权利要求20所述的组合处理装置,其特征在于,还包括:存储装置,该存储装置分别与所述机器学习运算装置和所述其他处理装置连接,用于保存所述机器学习运算装置和所述其他处理装置的数据。
22.一种神经网络芯片,其特征在于,所述机器学习芯片包括如权利要求19所述的机器学习运算装置或如权利要求20所述的组合处理装置或如权利要求21所述的组合处理装置。
23.一种电子设备,其特征在于,所述电子设备包括如所述权利要求22所述的芯片。
24.一种板卡,其特征在于,所述板卡包括:存储器件、接口装置和控制器件以及如权利要求22所述的神经网络芯片;
其中,所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
所述存储器件,用于存储数据;
所述接口装置,用于实现所述芯片与外部设备之间的数据传输;
所述控制器件,用于对所述芯片的状态进行监控。
25.一种信号处理方法,其特征在于,包括:
采集用户输入的信号;
根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域;
根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。
26.根据权利要求25所述的信号处理方法,其特征在于,所述根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,包括:
将信号通过信号识别技术转换成文本信息,所述信号识别技术为以下至少一种:语音识别技术、语义理解技术、图像识别技术、自然语言处理技术;
将文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述图像处理指令;
根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
27.根据权利要求25所述的信号处理方法,其特征在于,所述根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,包括:
将所述信号通过所述信号识别技术和所述目标信号指令转换模型转换成所述图像处理指令;
根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
28.根据权利要求25-27任一项所述的信号处理方法,其特征在于,所述方法还包括:
存储所述文本信息或者所述图像处理指令或者所述目标区域。
29.根据权利要求28所述的信号处理方法,其特征在于,所述根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,包括:
在预设时间窗口内从所述存储器中获取M条图像处理指令;
根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
30.根据权利要求29所述的信号处理方法,其特征在于,所述根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理,包括:
删除所述M条图像处理指令中功能相同的图像处理指令,得到N条图像处理指令,所述M为大于1的整数,所述N为小于所述M的整数;
根据所述N条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。

说明书全文

信号处理装置及相关产品

技术领域

[0001] 本发明涉及图像处理领域,尤其涉及一种信号处理装置及相关产品。

背景技术

[0002] 用户在拍完照片后,为了展现更好的图像效果,会对通过电脑中的PS软件或者手机中的修图软件对图像进行处理。
[0003] 但是,在使用电脑中PS软件或者手机中的修图软件对图像处理之前,用户需要学习掌握软件的使用方法,并且在掌握软件的使用方法后,需要手动输入指令来控制电脑或者手机进行修图操作。这种方式对于用户来说,既耗费时间,并且用户体验差。

发明内容

[0004] 本发明实施例提供一种信号处理装置及相关产品,实现了输入信号即可对图像进行处理的功能,节省了用户在图像处理之前学习图像处理软件的时间,提高了用户体验。
[0005] 第一方面,本发明实施例提供一种信号处理装置,包括:
[0006] 信号采集器,用于采集用户输入的信号;
[0007] 指令转换器,用于根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域;
[0008] 图像处理器,用于根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。
[0009] 第二方面,本发明实施例还提供了一种机器学习运算装置,所述机器学习运算装置包括一个或多个如第一方面所述的信号处理装置,用于从其他处理装置中获取待运算输入数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;
[0010] 当所述机器学习运算装置包含多个所述信号处理装置时,所述多个所述信号处理装置间可以通过特定的结构进行连接并传输数据;
[0011] 其中,多个所述信号处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算;多个所述信号处理装置共享同一控制系统或拥有各自的控制系统;多个所述信号处理装置共享内存或者拥有各自的内存;多个所述信号处理装置的互联方式是任意互联拓扑。
[0012] 第三方面,本发明实施例还提供了一种组合处理装置,所述组合处理装置包括如第二方面所述的机器学习运算装置,通用互联接口和其他处理装置;
[0013] 所述机器学习运算装置与所述其他处理装置进行交互,共同完成用户指定的计算操作。
[0014] 第四方面,本发明实施例还提供了一种神经网络芯片,所述机器学习芯片包括如第二方面所述的机器学习运算装置或如第三方面所述的组合处理装置。
[0015] 第五方面,本发明实施例还提供了一种电子设备,所述电子设备包括如第四方面所述的芯片。
[0016] 第六方面,本发明实施例还提供了一种板卡,其特征在于,所述板卡包括:存储器件、接口装置和控制器件以及如第六方面所述的神经网络芯片;
[0017] 其中,所述神经网络芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
[0018] 所述存储器件,用于存储数据;
[0019] 所述接口装置,用于实现所述芯片与外部设备之间的数据传输;
[0020] 所述控制器件,用于对所述芯片的状态进行监控。
[0021] 第七方面,本发明实施例还提供了一种信号处理方法,包括:
[0022] 采集用户输入的信号;
[0023] 根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域;
[0024] 根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。
[0025] 第八方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第七方面中所描述的部分或全部步骤。
[0026] 第九方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第七方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0027] 可以看出,在本发明实施例的方案中,信号采集器采集用户输入的语音信号;指令转换器根据目标信号指令转换模型将所述语音信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域;图像处理器根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。与现有的图像处理技术相比,本发明通过语信号进行图像处理,节省了用户在进行图像处理前学习图像处理软件的时间,提高了用户体验。
[0028] 本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明
[0029] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030] 图1为本发明实施例提供的一种信号处理装置的结构示意图;
[0031] 图2为本发明实施例提供的另一种信号处理装置的局部结构示意图;
[0032] 图3为本发明实施例提供的另一种信号处理装置的局部结构示意图;
[0033] 图4A为本发明实施例提供的另一种信号处理装置的局部结构示意图;
[0034] 图4B为本发明实施例提供的一种信号处理演示示意图;
[0035] 图4C为本发明实施例提供的另一种信号处理演示示意图;
[0036] 图5A是本申请实施例提供的一种计算装置的结构示意图;
[0037] 图5B是本申请一个实施例提供的计算装置的结构图;
[0038] 图5C是本申请另一个实施例提供的计算装置的结构图;
[0039] 图5D是本申请实施例提供的主处理电路的结构图;
[0040] 图5E是本申请实施例提供的另一种计算装置的结构图;
[0041] 图5F是本申请实施例提供的树型模的结构示意图;
[0042] 图5G是本申请实施例提供的又一种计算装置的结构图;
[0043] 图5H是本申请实施例提供的还一种计算装置的结构图;
[0044] 图6A是本申请实施例提供的一种组合处理装置的结构图;
[0045] 图6B是本申请实施例提供的一种计算装置的结构示意图;
[0046] 图7A是本申请实施例提供的另一种组合处理装置的结构图;
[0047] 图7B是本申请实施例提供的一种板卡的结构示意图;
[0048] 图8为本发明实施例提供的一种电子设备的结构示意图;
[0049] 图9为本发明实施例提供的一种信号处理方法的流程示意图。

具体实施方式

[0050] 以下分别进行详细说明。
[0051] 本发明的说明书权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0052] 在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0053] 请参见图1,图1为本发明实施例提供的一种信号处理装置的结构示意图。如图1所示,该信号处理装置100包括:
[0054] 信号采集器1019,用于采集用户输入的信号。
[0055] 其中,上述信号包括但不限于语音信号、图像信号、文本信号、感应信号等。该信号采集装置可以只采集其中一种信号,也可以支持采集多种信号。
[0056] 可选地,上述信号处理装置100还包括信号过滤器,上述信号采集器101采集到上述信号后,上述信号过滤器对该输入的信号进行降噪处理,降低信号中无用数据的干扰。
[0057] 可选地,该信号采集器可为语音信号采集器,可以包括但不仅限于:语音传感器、麦克拾音器,或者,获取其他音频采集装置,在此不作限定;该信号采集器还可为图像采集器,可以包括但不仅限于:照相机、摄像机及其他图像采集装置,在此不作限定;该信号采集器也可为感应信号采集器,可以包括但不仅限于:触摸屏、触控板、体感传感器、声波传感器、脑电波传感器及其他感应信号采集装置。
[0058] 具体地,以上述步骤101中的信号为语音信号为例,上述信号采集器1019可在接收语音信号时,还接收环境声音信号。上述信号过滤器可根据上述环境声音信号对上述语音信号进行降噪处理。该环境声音信号对上述语音信号来说是噪声。进一步地,上述该信号采集器101可包括对麦克风阵列,既可用于采集上述语音信号和上述环境声音信号,又实现了降噪处理。
[0059] 具体地,以上述步骤101中的信号为图像信号为例,上述信号采集器1019可在接收图像信号时,图像信息中只有部分内容为有效信息,譬如手势、面部表情、动作趋势。上述信号过滤器用于过滤掉无用信息,仅仅提取出图像中的有用信息,如手势、面部表情、动作趋势。进一步地,上述该图像采集器101可包括体感传感器,可用于采集图像后提取出人的体感动作和指向进行定位,得到有用信息。
[0060] 具体地,以上述步骤101中的信号为文本信号为例,上述信号采集器1019可在接收文本信号时,文本信息中并非全部内容均为有效信息。上述文本信号过滤器用于过滤掉无用信息,提取文本信号的有用信息,具体地,例如,提取关键字。
[0061] 可选地,在一种可行的实施例中,上述信号处理装置还包括第一存储模块。上述信号采集器采集到上述信号后,上述信号处理装置将上述信号存储到第一存储模块中。
[0062] 指令转换器1029,用于根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域。
[0063] 可选地,上述指令转换器1029在根据语音识别技术、自然语言处理技术和图像识别技术等技术将所述信号转换成图像处理指令和目标区域之前,上述指令转换器1029从上述第一存储模块中获取上述步骤101中的信号。
[0064] 其中,如图2所示,所述指令转换器1029包括:
[0065] 第一信号识别器1021,用于将所述信号转换成文本信息。可选的,该识别器可包含一个或多个子识别器,如语音信号子识别器通过语音识别技术将语音信号转换成文本信息,图像信号子识别器通过图像识别技术将一幅图像或一组图像的有效信号转换成文本信息等;
[0066] 可选的,在将所述信号转换成文本信息的过程中还可以同时处理多种类型信号,如同时输入语音信号和图像信号,分别利用语音信号子识别器和图像信号子识别器对其进行识别。
[0067] 图像识别技术,即对输入的图像信号进行识别和分析,可包括但不限于以下算法:利用OTSU算法、Roberts算子、Sobel算子、Normalized Cuts算法进行图像分割、利用Bag of words(BoW)方法、Partsand structure方法、生成性(generative)方法与鉴别性(Discriminative)方法等方法进行目标识别和目标检测,利用核相关滤波(KDF)算法、DSST(Discriminative Scale Space Tracker)算法等进行目标跟踪。用以从一张或一组图像中提取出图像信号所表达的操作。
[0068] 举例说明下,上述图像信号处理一组图像的过程。具体地,假设利用摄像头采集多幅图像,利用图像信号子识别器,对采集到的图像进行分割,剔除无效信息,即将图像的前景和背景进行分割,剔除背景信息,获取前景信息,接着,确定一个或多个目标的位置及大小等相关信息,具体地,如进行利用边缘检测和分割技术,如:边缘检测算法:sobel边缘检测算法、laplace边缘检测算法等,又如分割算法:基于阈值的图像分割算法、基于边缘的图像分割算法、基于区域的边缘分割算法、基于图论的边缘分割算法、基于能量泛函的分割算法、基于小波变换的分割算法、基于神经网络的分割算法,从而,确定人脸、人手、人的骨骼架构的位置及范围;其次,对目标进行识别并提取特征,特征提取技术可包括SIFT、SURF等点检测包括HARRIS fast等,如果具有多个备选目标,则确定各备选目标备选的优先级;最后,筛选出有效目标,并利用目标追踪技术,如:相关滤波和深度学习方法,在此不做限定,追踪目标运动轨迹,得到该目标所表达的含义,如获取到人脸、人的骨骼架构基本没有变化,而人手从左边滑到右边,得到该有效信息是将待处理图像的目标区域从左边移动到右边,而后将有效的图像信息将其转化为文本信息。
[0069] 再举例说明下,上述文本信号处理一段文本的过程。假设利用文本信息采集器获取到了一段文本信息,利用文本信号子识别器,对采集到的文本进行切分,形成文本矢量。而后利用文本特征提取技术,文本特征提取技术可以包括以下至少一种:TF-IDF、词频方法、文档频次方法、互信息、期望交叉熵、二次信息熵、二次信息熵、x2统计量方法、文本证据权、遗传算法、主成分分析法、模拟退火算法、N—Gram算法等等,在此不做限定,筛选出有效文本信息。结合离线训练而成的文本匹配模型,将有效的采集文本信息转化成为可送入信号文本转换器的文本信息。
[0070] 再举例说明下,上述多种类型信号的处理过程。假设两个或以上信号采集器采集到信息,假设是语音信息和图像信息,那么将语音信息通过语音信号子识别器处理成为了语音信号对应的文本信息,将图像信息通过图像信号子识别器处理成为了图像信号对应的预设类型信息,预设类型信息可以为以下至少一种:文本信息、图像信息、语音信息、投影信息、振动信息等等,在此不作限定。
[0071] 信号文本转换器1022,用于将所述一条或多条文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述图像处理指令;
[0072] 第一图像识别器1023,用于根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
[0073] 进一步地,上述指令转换器1029还包括:
[0074] 获取模块1026,用于获取上述图像处理指令中的语义区域的粒度。
[0075] 举例说明上述语义区域,假设上述信号处理装置100根据语音信号确定对上述目标区域为人脸区域时,则上述语义区域为上述待处理图像中的人脸区域,上述信号处理装置以人脸为粒度,获取上述待处理图像中的多个人脸区域;当上述目标区域为背景,上述信号处理装置将上述待处理图像划分为背景区域和非背景区域;当上述目标区域为红颜色区域时,上述信号处理装置将上述待处理图像按照颜色划分为不同颜色的区域。
[0076] 可选的,上述指令转换器1029还包括交互模块,用于完成系统与用户之间的交互操作,可以通过发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令,可将该指令传输给图像处理器1039执行相应操作,交互信息可以为提示用户进行指定操作的指示信息,指定操作可以由用户自行设置或者系统默认,反馈信息可以由用户输入,输入方式可包括但不仅限于:语音输入、触控输入、肢体动作输入等等,在此不做限定。例如,交互模块用户判断目标区域和处理指令是否符合判断模型的预设要求,预设要求可以由用户自行设置,或者,系统默认。例如,要求头脚互换,则不符合常理。如果不符合,返回提示信息给用户,如询问用户是否确定执行该操作。其中,判断模型是通过离线训练得到的模型,也可以是用户自定义得到的模型。如收到确认的信息,则继续执行。用户确认的方式可以包括以下至少一种:可通过点击按钮、语音输入、图像输入等多种方式,在此不作限定。又如交互模块用于根据预设顺序或根据用户习惯,依次缩放待处理图像的一个局部区域和/或几个局部区域,便于进行更为细节的操作,具体地,如用户习惯为修改人像图像时,依次眉、眼、嘴的调整顺序,那么该装置检测到待处理图像为人像图像时,依次取眉、眼、嘴部分进行放大,便于用户对其进行操作。
[0077] 具体地,本发明中使用的语音识别技术包括但不限于采用人工神经网络(Artificial Neural Network,ANN)、隐尔科夫模型(Hidden Markov Model,HMM)等模型,上述第一信号识别器中的语音信号子识别器可根据上述语音识别技术处理上述语音信号;上述自然语言处理技术包括但不限于利用统计机器学习、ANN等方法,上述语义理解单元可根据上述自然语言处理技术提取出语义信息;上述图像识别技术包括但不限于利用基于边缘检测的方法、阈值分割方法、区域生长与分岭算法、灰度积分投影曲线分析、模板匹配、可变形模板、Hough变换、Snake算子、基于Gabor小波变换的弹性图匹配技术、主动形状模型和主动外观模型等方法等算法,上述图像信号子识别器可根据上述图像识别技术将上述待处理图像分割成不同的区域。
[0078] 上述自然语言处理技术,即让计算机能够理解输入的语音或者文本信息。包括但不限于最大匹配算法,word2vec算法,doc2vec算法,潜在语音索引算法,潜在狄利克雷分布算法,以及机器学习算法,包括支持向量机、神经网络、AdaBoost等算法。用以完成词法分析、语法分析、语义分析、情感倾向性分析等,得到输入信号中所表达的观点和意义。譬如,读取信号数据之后,对数据进行去噪音。而后对数据进行分词和标注,利用TF-IDF、word2vec等算法建立词袋模型。利用WLLR(Weighted Log Likelihood Ration)加权对数似然、WFO(Weighted Frequency and Odds)加权频率和可能性等算法对特征进行选择。得到输入信号的特征。根据该特征直接转换为相应的文本信息,或者根据该特征和预训练而成的模型得到相应的文本信息。譬如,以语义理解技术为例,利用语义树、主题模型、词向量等技术对输入信号的语义进行分析,得到输入信号所表达的主题和操作,便于后续选择合适的模型进行处理。
[0079] 在一种可行的实施例中,上述第一信号识别器1021将上述信号通过上述语音识别技术、图像识别技术、自然语言处理等转换成有效的文本信息,并将该文本信息保存到上述第一存储模块中。上述信号文本转换器1022从上述第一存储模块中获取上述文本信息,并将该文本信息通过自然语言处理技术和上述目标信号指令转换模型转换成图像处理指令,并将上述图像处理指令保存到上述第一存储模块中;上述第一图像识别器1023根据上述图像处理指令中的语义区域的粒度和图像识别技术对上述待处理图像进行区域划分,获取上述目标区域,并将上述划分结果和上述目标区域存储到上述第二存储模块中。
[0080] 在一种可行的实施例中,如图3所示,上述指令转换器1029也可以包括:
[0081] 第二信号识别器1025,用于根据语音识别技术、自然语言处理技术和上述目标信号指令转换模型将上述信号直接转化为上述图像处理指令,并将该图像处理指令保存到第一存储模块中;
[0082] 可选地,第二信号识别器1025包括一个或多个子识别器,如语音信号子识别器通过语音识别技术来识别语音信号,图像信号子识别器通过图像识别技术来识别一幅图像或多幅图像的有效信号。
[0083] 举例说明下,上述图像信号处理一组图像的过程。具体地,假设利用摄像头采集多幅图像,利用图像信号子识别器,对采集到的图像进行分割,剔除无效信息,即将图像的前景和背景进行分割,剔除背景信息,获取前景信息,接着,确定一个或多个目标的位置及大小等相关信息,具体地,如进行利用边缘检测技术,确定人脸、人手、人的骨骼架构的位置及范围;其次,对目标进行识别,如果具有多个备选目标,则确定各备选目标备选的优先级;最后,筛选出有效目标,并利用目标追踪技术,追踪目标运动轨迹,得到该目标所表达的含义,如获取到人脸、人的骨骼架构基本没有变化,而人手从左边滑到右边,得到该有效信息是将待处理图像的目标区域从左边移动到右边,而后将有效的图像信息将其转化为文本信息。
[0084] 再举例说明下,上述文本信号处理一段文本的过程。假设利用文本信息采集器获取到了一段文本信息,利用文本信号子识别器,对采集到的文本进行切分,形成文本矢量。而后利用文本特征提取技术,筛选出有效文本信息。结合离线训练而成的文本匹配模型,将有效的采集文本信息转化成为可送入信号文本转换器的文本信息。
[0085] 再举例说明下,上述多种类型信号的处理过程。假设两个或以上信号采集器采集到信息,假设是语音信息和图像信息,那么将语音信息通过语音信号子识别器处理成为了语音信号对应的文本信息,将图像信息通过图像信号子识别器处理成为了图像信号对应的文本信息。
[0086] 第二图像识别器1025,根据上述图像处理指令对上述待处理图像进行操作的语义区域的粒度,将该待处理图像按照该语义区域的粒度进行划分,获取目标区域,该目标区域为对上述待处理图像进行处理的区域,并将划分后的结果以及上述目标区域存储到第二存储模块中。
[0087] 可选地,在上述信号采集器1019接收上述信号和上述待处理图像之前,上述指令转换器1029对信号指令转换模型进行自适应训练,以得到上述目标信号指令转换模型。
[0088] 其中,上述对信号指令转换模型进行自适应训练是离线进行的或者是在线进行的。
[0089] 具体地,上述对信号指令转换模型进行自适应训练是离线进行的具体是上述指令转换器1029在其硬件基础上对上述信号指令转换模型进行自适应训练,以得到目标信号指令转换模型;上述对信号指令转换模型进行自适应训练是在线进行的具体是一个不同于上述信号转换器102的服务器对上述信号指令转换模型进行自适应训练,以得到目标信号指令转换模型。上述指令转换器1029在需要使用上述目标信号指令转换模型时,该指令转换器1029从上述云端服务器中获取该目标信号指令转换模型。
[0090] 可选地,上述对信号指令转换模型进行自适应训练是有监督的或者是监督的。
[0091] 具体地,上述对上述信号指令转换模型进行自适应训练是有监督的具体为:
[0092] 上述指令转换器1029根据信号指令转换模型将上述信号换成预测指令;然后确定上述预测指令与其对应的指令集合的相关系数,该指令集合为人工根据信号得到的指令的集合;上述指令转换器1029根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
[0093] 在一种可行的实施例中,上述信号处理装置100还包括:
[0094] 训练器1059,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
[0095] 举例说明,上述对信号指令转换模型进行自适应训练是有监督的具体包括:上述指令转换器1029或者训练器1059接收一段包含相关命令的语音信号,如改变图像的颜色、旋转图片等。每种命令对应一个指令集合。对用于自适应训练的输入的语音信号来说,对应的指令集合是已知的,上述指令转换器1029或者训练器1059以这些语音信号作为信号指令转换模型的输入数据,获取输出后的预测指令。上述指令转换器1029或者训练器1059计算上述预测指令与其对应的指令集合的相关系数,并根据该自适应地更新上述信号指令转换模型中的参数(如权值、偏置等等),以提高上述信号指令转换模型的性能,进而得到上述目标信号指令转换模型。
[0096] 又以图像信号为例,上述指令转换器1029或者训练器1059接收一段包含相关命令的图像信号,如通过手势指定图像中某物体,而后要求将其向右移动等。每种命令对应一个指令集合。对用于自适应训练的输入的图像信号来说,对应的指令集合是已知的,上述指令转换器1029或者训练器1059以这些图像信号作为信号指令转换模型的输入数据,获取输出后的预测指令。上述指令转换器1029或者训练器1059计算上述预测指令与其对应的指令集合的相关系数,并根据该自适应地更新上述信号指令转换模型中的参数(如权值、偏置等等),以提高上述信号指令转换模型的性能,进而得到上述目标信号指令转换模型。
[0097] 所述信号处理装置100还包括:
[0098] 存储器1049,用于存储所述文本信息或者所述图像处理指令或者所述目标区域。
[0099] 在一种可行的实施例中,上述存储器1049与上述第一存储模块和第二存储模块可以是同一个存储模块,还可以是不同的存储模块。
[0100] 图像处理器1039,用于根据所述图像处理指令和目标图像处理模型对所述待处理图像进行处理,得到处理图像,将所述处理图像转化为输出信息。
[0101] 可选地,在所述将所述处理图像转化为输出信息方面,所述图像处理器1039具体用于:
[0102] 获取转换指令,所述转换指令包含指定数据类型,所述指定数据类型包括以下一种类型:语音类型、图像类型、文本类型;
[0103] 在所述指定数据类型为图像类型时,输出所述处理图像;
[0104] 在所述指定数据类型为文本类型时,输出文本信息;
[0105] 在所述指定数据类型为语音类型时,输出语音信息。
[0106] 其中,上述指定数据类型可以包括但不仅限于:包括以下一种类型:语音类型、图像类型、文本类型,在此不作限定,指定数据类型可以由用户自行设置或者系统默认。在指定数据类型为图像类型时,直接输出处理图像,在指定数据类型为文本类型时,输出文本信息,在指定数据类型为语音类型时,则输出语音信息。
[0107] 其中,如图4A所示,所述图像处理器1039包括:
[0108] 取指令模块1031,用于在预设时间窗口内从所述存储模块中获取M条图像处理指令,所述M为大于1的整数;
[0109] 处理模块1032,用于根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
[0110] 可选地,所述处理模块1032用于:
[0111] 删除所述M条图像处理指令中,功能相同的图像处理指令,以得到N条图像处理指令,所述N为小于所述M的整数;
[0112] 根据所述N条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
[0113] 具体地,上述预设时间窗口可以理解成预设时长。在预设时长内上述获取单元1031从上述存储模块104中获取M条图像处理指令后,上述处理模块1032对上述M条图像处理指令进行两两比较,将该M条图像处理指令中功能相同的指令删除,得到N条图像处理指令。上述处理模块1032根据上述N条处理指令和上述目标图像处理模型对上述待处理图像进行处理。
[0114] 举例说明,上述处理模块1032对上述M条图像处理指令进行两两比较。当图像处理指令A和图像处理指令B一样时,上述处理模块1032删除上述图像处理指令A和B中开销最大的一条;当图像处理指令A和图像处理指令B不一样时,上述处理模块1032获取上述图像处理指令A和上述图像处理指令B的相似系数。当该相似系数大于相似阈值时,确定上述图像处理指令A和上述图像处理指令B功能相同,上述处理模块1032删除上述图像处理指令A和B中开销最大的一条;当上述相似系数小于上述相似阈值时,上述处理模块1032确定上述图像处理指令A和B的功能不同。该图像处理指令A和B为上述M条处理指令中的任意两条。
[0115] 具体地,针对上述图像处理器1039,其输入和输出均为图像。上述图像处理器1039可以通过包括但不限定于ANN和传统计算机视觉方法对上述待处理图像进行的处理包括但不局限于:美体(例如美腿,隆胸),换脸、美化脸,换物体(猫换狗、斑马变马,苹果换桔子等),换背景(后面的森林换成田野),去遮挡(例如人脸遮住了一个眼睛,重新把眼睛重构出来),风格转换(一秒钟变梵高画风),位姿转换(例如站着变坐着,正脸变侧脸)、非油画变油画、更换图像背景的颜色和更换图像中物体所处的季节背景、图像合成、图像融合、消除物体或阴影、图片着色、图片压缩、图片矢量化等。
[0116] 本发明实施例中,图像处理指令可以定义如下三类处理指令,具体地:逻辑处理指令、精确处理指令、模糊处理指令,当然还可以包括其他处理指令。图像处理指令可至少包括操作类型、操作区域,当然,图像处理指令还可以包括操作数据。操作类型可以包括以下至少一种:图像识别、图像分割、图像增强、图像复原、图像去噪、背景虚化、图像拼接、图像整合等,在此不作限定。
[0117] 逻辑处理指令,用于处理给定具有逻辑含义的操作需求,如把图中的足球移走,该操作包括对图中足球的区域的检测和定位,将足球的区域删除,以及将该区域和区域周围的内容进行融合。该逻辑处理指令中可包括操作类型,逻辑操作区域,逻辑操作数据。
[0118] 精确处理指令,用于处理给定精确数据的操作需求,如给定坐标范围,如以图中心点为原点,半径为10个像素点的圆形区域内,改变该区间的颜色为RGB各值分别为255、0、0。该精准处理指令中可包括操作类型,精确操作区域,精确操作数据。
[0119] 模糊处理指令,用于处理给出模糊数据的操作需求,如对“中心点附近”的区域进行操作。该模糊处理指令中可包括操作类型,模糊操作区域,模糊操作数据。
[0120] 其他处理指令,包括对数据输入输出、数据判断等相关操作指令。
[0121] 其中,上述操作类型可为编码的形式,通过某种编码方式定义而来,如依次按序编码的方式。操作类型包括但不限于移动,删除,替换,修改参数(如变色、亮度对比度),修改形状(缩小、放大、变形)等,具体而言,可包括改变操作区域的颜色,改变操作区域的亮度,改变操作区域的对比度等,删除操作区域的内容,替换操作区域的内容为其他内容,扩大/缩小/旋转操作区域的内容,虚化/雾化/马赛克化操作区域的内容,合成操作区域,拼接操作区域,对操作区域建模等,在此不作限定。
[0122] 其中,上述操作区域可为整幅图像,可以为图像中的部分区域,根据其给定的方式可包括上述逻辑区域、精确区域、模糊区域或者其他区域。逻辑区域可指为具有某种特定的逻辑含义的区域,包括指定物品(如足球、书桌、小狗等)、指定背景(如海、山等)、指定部分(如人脸、骨骼框架的翅膀等)等。这些逻辑区域采用机器学习等算法进行离线训练而得,并且可以通过在线训练的方式,为用户定制个性化方案。精确区域可指具有精确定位的区域,包括精确坐标及范围,精确要求及范围。譬如,以图中心点为原点,半径为10个像素点的圆形区域;图中所有颜色RGB值为(255,0,0)的位置等。模糊区域为给出一个指向但定位和范围略有模糊的区域,如图像左上角,红色系的地方等。该部分内容的定位和确定可以通过机器学习算法离线训练得到的选取模型,针对待处理图像的特征,智能选取待处理的范围。
[0123] 可选地,操作指令中还包括操作数据,包括逻辑操作数据、精确操作数据、模糊操作数据。逻辑操作数据具有某种特定的逻辑含义的数据,包括指定物品(如足球、书桌、小狗等)、指定背景(如海、山等)、指定部分(如人脸、骨骼框架、鸟的翅膀等)等。精确数据可包括精确的数值参数或者指向数据的精确地址,以逻辑指令类为例,逻辑指令:人脸换足球,操作类型:替换,操作区域:人脸区域,操作数据:足球(或指向最求图形的地址)。模糊数据可包括模糊的描述,如颜色“深一点”、亮度“暗一点”等。
[0124] 举例说明下,输入单张图像,输出单张图像。信号采集器,接收语音信号,并进行预处理,降低无效信息,如噪音等,将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令,图像处理单元接收收图像处理指令,根据指令利用图像识别技术对待处理图像进行定位和划分,得到待处理图像的目标区域,如果需要操作数据,则从存储单元中读取所需要的操作数据,送入图像处理单元。图像处理单元根据处理指令,利用操作数据对待处理图像的目标区域完成给定操作,操作完成,输出图像。
[0125] 再举例说明下,如图4B所示,对于输入多张图像的情况,图像依次以每次一张或多张进行处理,例如6张图像进行拼接,每次拼接2张。分别用图像1~6进行标记,[0126] A1、信号采集单元接收语音信号,并进行预处理,降低无效信息,如噪音等;
[0127] A2、将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令;
[0128] A3、图像处理单元接收图像处理指令,根据指令利用图像识别技术对一张或多张待处理图像进行定位和划分,得到各自对应的待处理的目标区域;
[0129] A4、如果需要操作数据,则从存储单元中读取所需要的操作数据,送入处理单元;
[0130] A5、图像处理单元根据处理指令,利用操作数据对待处理图像的目标区域完成给定操作;
[0131] A6、如果图像未完全处理完毕,将处理后的图像保存到存储单元中进行存储。
[0132] 进一步地,若读入新的一张或多张图像,则可以重复步骤A3~A6。直到全部图像处理完毕,读入各次的处理后的结果,根据图像处理指令,对各次的处理后的结果进行处理,得到最终的处理结果,输出图像。
[0133] 再举例说明下,如图4C所示,以图像合成为例,这里采用曝光合成的方式,有6幅不同曝光程度的图像,每次处理2幅图像。
[0134] B1、信号采集单元,接收语音信号,并进行预处理,降低无效信息,如噪音等;
[0135] B2、将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令;
[0136] B3、图像处理单元接收图像处理指令,根据指令利用图像识别技术对一张或多张待处理图像进行定位和划分,得到各自对应的待处理的目标区域;
[0137] B4、如果需要操作数据,则从存储单元中读取所需要的操作数据,送入图像处理单元;
[0138] B5、图像处理单元根据处理指令,利用操作数据对待处理图像的目标区域完成给定操作;
[0139] B6、如果图像未完全处理完毕,将处理后的图像保存到存储单元中进行存储。
[0140] 进一步地,若读入新的一张或多张图像,并将上一步的处理后的图像作为新图像一同处理,重复B3~B5,当全部图像处理完毕,B5得到的即为最终的处理结果,输出图像。
[0141] 可选地,对于输入一张或多张图像,可根据图像处理模型对图像进行处理,得到所需要的文本信息,并输出,从而,实现如下功能,例如:图像分类、图像识别、图像分割、图像描述等功能,在此不作限定。其中,图像处理模型可用于图像分类、图像识别、图像分割或者图像描述等一种或多种功能。
[0142] 举例说明下,输入图像,输出分类信息,具体如下:
[0143] C1、信号采集单元接收语音信号,并进行预处理,降低无效信息,如噪音等;
[0144] C2、将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令;
[0145] C3、图像处理单元接收图像处理指令,从存储单元读取预先存入的图像处理模型,利用图像处理模型对输入图像进行处理,得到分类结果;
[0146] C4、操作完成,将分类结果输出即可。
[0147] 再举例来说,输入图像,输出图像描述,具体如下:
[0148] D1、信号采集单元接收语音信号,并进行预处理,降低无效信息,如噪音等。
[0149] D2、将经过预处理后的语音信号送入指令转换单元,利用语音识别技术,对语音信号进行解析,并将其转换为预先定义的图像处理指令;
[0150] D3、图像处理单元接收图像处理指令,从存储单元读取预先存入的图像处理模型对输入图像进行划分,提取出一个或多个目标区域,通过对目标区域进行处理,得到完整的文本描述。
[0151] D4利用需要输出语音描述,则利用语音转换技术,将文本描述转换为语音,输出即可;否则可以直接输出。操作完成。
[0152] 再举例说明下,当然,输入的也可以不是语音信息,但输出的是图像信息,如输入文本/语音消息,或者,输入文本/语音消息和图像消息,将文本/语音消息转化为新图像,或者将文本/语音消息的内容对原图像消息进行添加或修改。
[0153] 输入语音消息,根据图像处理指令,利用语音识别技术将语音消息转换成文本消息(若输入文本消息,则可以直接进行后续处理),将文本消息按照指定或默认的图像规格、字体字号、背景颜色和花纹等要求进行处理,得到一幅新图像,输出即可,例如,将文本内容转换成图像的功能。可选地,输入的文本消息或者从语音消息转换而成的文本消息可先进行预处理,去除噪音、明显的错误等,可以提升后续处理精度
[0154] 输入语音消息,根据图像处理指令,利用语音识别技术将语音消息转换成文本消息(若输入文本消息,则可以直接进行后续处理),将文本消息按照指定或默认的字体字号、背景颜色和花纹等要求进行处理,并添加到原图像的指定为位置,输出即可,例如弹幕功能。可选地,输入的文本消息和刚从语音消息转换而成的文本消息可先进行预处理,去除噪音、明显的错误等,可以提升后续处理精度。
[0155] 输入文本信息,根据图像处理指令,对文本信息进行拆分。通过自然语音处理技术,分别对拆分后的文本消息进行处理并将其中的内容转化为对应的图像,例如,原本输入了图像,则在原图像中进行添加或修改,否则生成一幅新图像,而后根据转化的生成的图像进行拼接整合,得到与整段文字相对应的图像内容,输出即可。如果输入的是语音消息,可以将语音消息通过语音识别技术转化成为文本消息,也可以直接对语音消息进行理解分析,得到相对应的图像信息。
[0156] 可选地,在上述信号采集器1019接收上述信号之前,上述图像处理器1039对图像处理模型进行自适应训练,以得到上述目标图像处理模型。
[0157] 其中,上述对图像处理模型进行自适应训练是离线进行的或者是在线进行的。
[0158] 具体地,上述对图像处理模型进行自适应训练是离线进行的具体是上述图像处理器1039在其硬件的基础上对上述图像处理模型进行自适应训练,以得到目标信号指令转换模型;上述对图像处理模型进行自适应训练是在线进行的具体是一个不同于上述图像处理器1039的云端服务器对上述图像处理模型进行自适应训练,以得到目标图像处理模型。上述图像处理器1039在需要使用上述目标图像处理模型时,该图像处理器1039从上述云端服务器中获取该目标图像处理模型。
[0159] 可选地,上述对图像处理模型进行自适应训练是有监督的或者是监督的。
[0160] 具体地,上述对上述图像处理模型进行自适应训练是有监督的具体为:
[0161] 以语音信号为例,上述图像处理器1039根据图像处理模型将上述语音信号换成预测图像;然后确定上述预测图像与其对应的目标图像的相关系数,该目标为人工根据语音信号对待处理图像进行处理得到的图像;上述图像处理器1039根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
[0162] 以图像信号为例,上述图像处理器1039根据图像处理模型将上述图像信号换成预测图像;然后确定上述预测图像与其对应的目标图像的相关系数,该目标为人工根据语音信号对待处理图像进行处理得到的图像;上述图像处理器1039根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
[0163] 当然,本申请实施例中,对如何获得图像处理模型不做限定,可由上述离线训练或者在线训练而成,其训练算法可包括但不仅限于:神经网络算法、支持向量机算法、决策树算法等有监督、无监督、半监督等训练方式。
[0164] 以神经网络算法对有标记的数据进行离线训练图像分类模型为例,首先,依照指定规则或者随机对模型参数进行初始化。而后,输入多组有分类标签的训练数据,利用模型计算得的模型的计算结果。将计算结果和正确结果进行对比,得到误差值,利用反向传播算法将误差值反向传播回来,并在此过程中训练参数。反复执行该过程,直到模型对图像分类的错误率不大于某个给定阈值或者准确率不低于某个给定阈值或训练达到了指定迭代次数,得到图像处理模型。
[0165] 在一种可行的实施例中,上述信号处理装置100还包括:
[0166] 训练器1059,用于根据所述信号指令转换模型将所述信号换成预测指令;确定所述预测指令与其对应的指令集合的相关系数;根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
[0167] 举例说明,上述对图像处理模型进行自适应训练是有监督的具体包括:以语音信号为例,上述图像处理器1039或者训练器1059接收一段包含相关命令的语音信号,如改变图像的颜色、旋转图片等。每种命令对应一张目标图像。对用于自适应训练的输入的语音信号来说,对应的目标图像是已知的,上述图像处理器1039或者训练器1059以这些语音信号作为图像处理模型的输入数据,获取输出后的预测图像。上述图像处理器1039或者训练器1059计算上述预测图像与其对应的目标图像的相关系数,并根据该自适应地更新上述图像处理模型中的参数(如权值、偏置等等),以提高上述图像处理模型的性能,进而得到上述目标图像处理模型。
[0168] 以图像信号为例,上述图像处理器1039或者训练器1059接收一段包含相关命令的图像信号,如改变图像的颜色、旋转图片等。每种命令对应一张目标图像。对用于自适应训练的输入的语音信号来说,对应的目标图像是已知的,上述图像处理器1039或者训练器1059以这些图像信号作为图像处理模型的输入数据,获取输出后的预测图像。上述图像处理器1039或者训练器1059计算上述预测图像与其对应的目标图像的相关系数,并根据该自适应地更新上述图像处理模型中的参数(如权值、偏置等等),以提高上述图像处理模型的性能,进而得到上述目标图像处理模型。
[0169] 在一种可行的实施例中,所述信号处理装置100的指令转换器1029可以用于对指令转换器1029中的信号指令转换模型进行自适应训练,以得到目标信号指令转换模型:所述信号处理装置100的图像处理器1039可以用于对图像处理器1039中的图像处理模型进行自适应训练,以得到目标图像处理模型。
[0170] 在一种可行的实施例中,所述信号处理装置100还包括:
[0171] 训练其105,用于对指令转换器1029中的信号指令转换模型和图像处理器1039中的图像处理模型分别进行自适应训练,以得到目标信号指令转换模型和目标图像处理模型。
[0172] 上述训练器1059可以通过有监督的方法或者无监督的方法调整上述信号指令转换模型中或者上述图像处理模型中的结构与参数,以提高该信号指令转换模型或者图像处理模型的性能,最终得到目标信号指令转换模型或者目标图像处理模型。
[0173] 在本实施例中,信号处理装置100是以模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit,ASIC),执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。此外,以上信号采集器1019、指令转换器1029、图像处理器1039、存储模块104和训练器1059可通过图5A~图8所示的装置来实现。
[0174] 可选地,上述信号处理装置100的指令转换器1029或者图像处理器1039的处理模块1032为人工神经网络芯片,即上述指令转换器1029和上述图像处理器1039的处理模块1032可以是两块独立的人工神经网络芯片,其结构分别如图5A~图8所示。
[0175] 在本装置中,指令转换器1029和图像处理器1039既可以串行执行,也可以通过软流水的方式执行,即图像处理器1039在处理上一个图像时,指令转换器1029可以处理下一个图像,这样可以提高硬件的吞吐率,提高图像处理效率。
[0176] 参阅图5A,提供了一种计算装置,该计算装置用于执行机器学习计算,该计算装置包括:控制器单元11和运算单元12,其中,控制器单元11与运算单元12连接,该运算单元12包括:一个主处理电路和多个从处理电路;
[0177] 控制器单元11,用于获取输入数据以及计算指令;在一种可选方案中,具体的,获取输入数据以及计算指令方式可以通过数据输入输出单元得到,该数据输入输出单元具体可以为一个或多个数据I/O接口或I/O引脚。
[0178] 上述计算指令包括但不限于:正向运算指令或反向训练指令,或其他神经网络运算指令等等,例如卷积运算指令,本申请具体实施方式并不限制上述计算指令的具体表现形式。
[0179] 控制器单元11,还用于解析该计算指令得到多个运算指令,将该多个运算指令以及所述输入数据发送给所述主处理电路;
[0180] 主处理电路101,用于对所述输入数据执行前序处理以及与所述多个从处理电路之间传输数据以及运算指令;
[0181] 多个从处理电路102,用于依据从所述主处理电路传输的数据以及运算指令并行执行中间运算得到多个中间结果,并将多个中间结果传输给所述主处理电路;
[0182] 主处理电路101,用于对所述多个中间结果执行后续处理得到所述计算指令的计算结果。
[0183] 本申请提供的技术方案将运算单元设置成一主多从结构,对于正向运算的计算指令,其可以将依据正向运算的计算指令将数据进行拆分,这样通过多个从处理电路即能够对计算量较大的部分进行并行运算,从而提高运算速度,节省运算时间,进而降低功耗。
[0184] 可选的,上述机器学习计算具体可以包括:人工神经网络运算,上述输入数据具体可以包括:输入神经元数据和权值数据。上述计算结果具体可以为:人工神经网络运算的结果即输出神经元数据。
[0185] 对于神经网络中的运算可以为神经网络中的一层的运算,对于多层神经网络,其实现过程是,在正向运算中,当上一层人工神经网络执行完成之后,下一层的运算指令会将运算单元中计算出的输出神经元作为下一层的输入神经元进行运算(或者是对该输出神经元进行某些操作再作为下一层的输入神经元),同时,将权值也替换为下一层的权值;在反向运算中,当上一层人工神经网络的反向运算执行完成后,下一层运算指令会将运算单元中计算出的输入神经元梯度作为下一层的输出神经元梯度进行运算(或者是对该输入神经元梯度进行某些操作再作为下一层的输出神经元梯度),同时将权值替换为下一层的权值。
[0186] 上述机器学习计算还可以包括支持向量机运算,k-近邻(k-nn)运算,k-均值(k-means)运算,主成分分析运算等等。为了描述的方便,下面以人工神经网络运算为例来说明机器学习计算的具体方案。
[0187] 对于人工神经网络运算,如果该人工神经网络运算具有多层运算,多层运算的输入神经元和输出神经元并非是指整个神经网络的输入层中神经元和输出层中神经元,而是对于网络中任意相邻的两层,处于网络正向运算下层中的神经元即为输入神经元,处于网络正向运算上层中的神经元即为输出神经元。以卷积神经网络为例,设一个卷积神经网络有L层,K=1,2,...,L-1,对于第K层和第K+1层来说,我们将第K层称为输入层,其中的神经元为所述输入神经元,第K+1层称为输出层,其中的神经元为所述输出神经元。即除最顶层外,每一层都可以作为输入层,其下一层为对应的输出层。
[0188] 可选的,上述计算装置还可以包括:该存储单元10和直接内存访问单元50,存储单元10可以包括:寄存器、缓存中的一个或任意组合,具体的,所述缓存,用于存储所述计算指令;所述寄存器,用于存储所述输入数据和标量;所述缓存为高速暂存缓存。直接内存访问单元50用于从存储单元10读取或存储数据。
[0189] 可选的,该控制器单元包括:指令存储单元110、指令处理单元111和存储队列单元113;
[0190] 指令存储单元110,用于存储所述人工神经网络运算关联的计算指令;
[0191] 所述指令处理单元111,用于对所述计算指令解析得到多个运算指令;
[0192] 存储队列单元113,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。
[0193] 举例说明,在一个可选的技术方案中,主运算处理电路也可以包括一个控制器单元,该控制器单元可以包括主指令处理单元,具体用于将指令译码成微指令。当然在另一种可选方案中,从运算处理电路也可以包括另一个控制器单元,该另一个控制器单元包括从指令处理单元,具体用于接收并处理微指令。上述微指令可以为指令的下一级指令,该微指令可以通过对指令的拆分或解码后获得,能被进一步解码为各部件、各单元或各处理电路的控制信号
[0194] 在一种可选方案中,该计算指令的结构可以如下表所示。
[0195]操作码 寄存器或立即数 寄存器/立即数 ...
[0196] 上表中的省略号表示可以包括多个寄存器或立即数。
[0197] 在另一种可选方案中,该计算指令可以包括:一个或多个操作域以及一个操作码。该计算指令可以包括神经网络运算指令。以神经网络运算指令为例,如表1所示,其中,寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以为操作域。其中,每个寄存器号0、寄存器号1、寄存器号2、寄存器号3、寄存器号4可以是一个或者多个寄存器的号码。
[0198]
[0199] 上述寄存器可以为片外存储器,当然在实际应用中,也可以为片内存储器,用于存储数据,该数据具体可以为n维数据,n为大于等于1的整数,例如,n=1时,为1维数据,即向量,如n=2时,为2维数据,即矩阵,如n=3或3以上时,为多维张量。
[0200] 可选的,该控制器单元还可以包括:
[0201] 所述依赖关系处理单元108,用于在具有多个运算指令时,确定第一运算指令与所述第一运算指令之前的第零运算指令是否存在关联关系,如所述第一运算指令与所述第零运算指令存在关联关系,则将所述第一运算指令缓存在所述指令存储单元内,在所述第零运算指令执行完毕后,从所述指令存储单元提取所述第一运算指令传输至所述运算单元;
[0202] 所述确定该第一运算指令与第一运算指令之前的第零运算指令是否存在关联关系包括:
[0203] 依据所述第一运算指令提取所述第一运算指令中所需数据(例如矩阵)的第一存储地址区间,依据所述第零运算指令提取所述第零运算指令中所需矩阵的第零存储地址区间,如所述第一存储地址区间与所述第零存储地址区间具有重叠的区域,则确定所述第一运算指令与所述第零运算指令具有关联关系,如所述第一存储地址区间与所述第零存储地址区间不具有重叠的区域,则确定所述第一运算指令与所述第零运算指令不具有关联关系。
[0204] 在另一种可选实施例中,运算单元12如图5C所示,可以包括一个主处理电路101和多个从处理电路102。在一个实施例里,如图5C所示,多个从处理电路呈阵列分布;每个从处理电路与相邻的其他从处理电路连接,主处理电路连接所述多个从处理电路中的k个从处理电路,所述k个从处理电路为:第1行的n个从处理电路、第m行的n个从处理电路以及第1列的m个从处理电路,需要说明的是,如图5C所示的K个从处理电路仅包括第1行的n个从处理电路、第m行的n个从处理电路以及第1列的m个从处理电路,即该k个从处理电路为多个从处理电路中直接与主处理电路连接的从处理电路。
[0205] K个从处理电路,用于在所述主处理电路以及多个从处理电路之间的数据以及指令的转发。
[0206] 可选的,如图5D所示,该主处理电路还可以包括:转换处理电路110、激活处理电路111、加法处理电路112中的一种或任意组合;
[0207] 转换处理电路110,用于将主处理电路接收的数据块或中间结果执行第一数据结构与第二数据结构之间的互换(例如连续数据与离散数据的转换);或将主处理电路接收的数据块或中间结果执行第一数据类型与第二数据类型之间的互换(例如定点类型与浮点类型的转换);
[0208] 激活处理电路111,用于执行主处理电路内数据的激活运算;
[0209] 加法处理电路112,用于执行加法运算或累加运算。
[0210] 所述主处理电路,用于将确定所述输入神经元为广播数据,权值为分发数据,将分发数据分配成多个数据块,将所述多个数据块中的至少一个数据块以及多个运算指令中的至少一个运算指令发送给所述从处理电路;
[0211] 所述多个从处理电路,用于依据该运算指令对接收到的数据块执行运算得到中间结果,并将运算结果传输给所述主处理电路;
[0212] 所述主处理电路,用于将多个从处理电路发送的中间结果进行处理得到该计算指令的结果,将该计算指令的结果发送给所述控制器单元。
[0213] 所述从处理电路包括:乘法处理电路;
[0214] 所述乘法处理电路,用于对接收到的数据块执行乘积运算得到乘积结果;
[0215] 转发处理电路(可选的),用于将接收到的数据块或乘积结果转发。
[0216] 累加处理电路,所述累加处理电路,用于对该乘积结果执行累加运算得到该中间结果。
[0217] 另一个实施例里,该运算指令为矩阵乘以矩阵的指令、累加指令、激活指令等等计算指令。
[0218] 下面通过神经网络运算指令来说明如图5A所示的计算装置的具体计算方法。对于神经网络运算指令来说,其实际需要执行的公式可以为:s=s(∑wxi+b),其中,即将权值w乘以输入数据xi,进行求和,然后加上偏置b后做激活运算s(h),得到最终的输出结果s。
[0219] 在一种可选的实施方案中,如图5E所示,所述运算单元包括:树型模块40,所述树型模块包括:一个根端口401和多个支端口404,所述树型模块的根端口连接所述主处理电路,所述树型模块的多个支端口分别连接多个从处理电路中的一个从处理电路;
[0220] 上述树型模块具有收发功能,例如如图5E所示,该树型模块即为发送功能,如图6B所示,该树型模块即为接收功能。
[0221] 所述树型模块,用于转发所述主处理电路与所述多个从处理电路之间的数据块、权值以及运算指令。
[0222] 可选的,该树型模块为计算装置的可选择结果,其可以包括至少1层节点,该节点为具有转发功能的线结构,该节点本身可以不具有计算功能。如树型模块具有零层节点,即无需该树型模块。
[0223] 可选的,该树型模块可以为n叉树结构,例如,如图5F所示的二叉树结构,当然也可以为三叉树结构,该n可以为大于等于2的整数。本申请具体实施方式并不限制上述n的具体取值,上述层数也可以为2,从处理电路可以连接除倒数第二层节点以外的其他层的节点,例如可以连接如图5F所示的倒数第一层的节点。
[0224] 可选的,上述运算单元可以携带单独的缓存,如图5G所示,可以包括:神经元缓存单元,该神经元缓存单元63缓存该从处理电路的输入神经元向量数据和输出神经元值数据。
[0225] 如图5H所示,该运算单元还可以包括:权值缓存单元64,用于缓存该从处理电路在计算过程中需要的权值数据。
[0226] 在一种可选实施例中,运算单元12如图5B所示,可以包括分支处理电路103;其具体的连接结构如图5B所示,其中,
[0227] 主处理电路101与分支处理电路103(一个或多个)连接,分支处理电路103与一个或多个从处理电路102连接;
[0228] 分支处理电路103,用于执行转发主处理电路101与从处理电路102之间的数据或指令。
[0229] 在一种可选实施例中,以神经网络运算中的全连接运算为例,过程可以为:y=f(wx+b),其中,x为输入神经元矩阵,w为权值矩阵,b为偏置标量,f为激活函数,具体可以为:sigmoid函数,tanh、relu、softmax函数中的任意一个。这里假设为二叉树结构,具有8个从处理电路,其实现的方法可以为:
[0230] 控制器单元从存储单元内获取输入神经元矩阵x,权值矩阵w以及全连接运算指令,将输入神经元矩阵x,权值矩阵w以及全连接运算指令传输给主处理电路;
[0231] 主处理电路确定该输入神经元矩阵x为广播数据,确定权值矩阵w为分发数据,将权值矩阵w拆分成8个子矩阵,然后将8个子矩阵通过树型模块分发给8个从处理电路,将输入神经元矩阵x广播给8个从处理电路,
[0232] 从处理电路并行执行8个子矩阵与输入神经元矩阵x的乘法运算和累加运算得到8个中间结果,将8个中间结果发送给主处理电路;
[0233] 主处理电路,用于将8个中间结果排序得到wx的运算结果,将该运算结果执行偏置b的运算后执行激活操作得到最终结果y,将最终结果y发送至控制器单元,控制器单元将该最终结果y输出或存储至存储单元内。
[0234] 如图5A所示的计算装置执行神经网络正向运算指令的方法具体可以为:
[0235] 控制器单元从指令存储单元内提取神经网络正向运算指令、神经网络运算指令对应的操作域以及至少一个操作码,控制器单元将该操作域传输至数据访问单元,将该至少一个操作码发送至运算单元。
[0236] 控制器单元从存储单元内提取该操作域对应的权值w和偏置b(当b为0时,不需要提取偏置b),将权值w和偏置b传输至运算单元的主处理电路,控制器单元从存储单元内提取输入数据Xi,将该输入数据Xi发送至主处理电路。
[0237] 主处理电路依据该至少一个操作码确定为乘法运算,确定输入数据Xi为广播数据,确定权值数据为分发数据,将权值w拆分成n个数据块;
[0238] 控制器单元的指令处理单元依据该至少一个操作码确定乘法指令、偏置指令和累加指令,将乘法指令、偏置指令和累加指令发送至主处理电路,主处理电路将该乘法指令、输入数据Xi以广播的方式发送给多个从处理电路,将该n个数据块分发给该多个从处理电路(例如具有n个从处理电路,那么每个从处理电路发送一个数据块);多个从处理电路,用于依据该乘法指令将该输入数据Xi与接收到的数据块执行乘法运算得到中间结果,将该中间结果发送至主处理电路,该主处理电路依据该累加指令将多个从处理电路发送的中间结果执行累加运算得到累加结果,依据该偏置指令将该累加结果执行加偏置b得到最终结果,将该最终结果发送至该控制器单元。
[0239] 另外,加法运算和乘法运算的顺序可以调换。
[0240] 本申请提供的技术方案通过一个指令即神经网络运算指令即实现了神经网络的乘法运算以及偏置运算,在神经网络计算的中间结果均无需存储或提取,减少了中间数据的存储以及提取操作,所以其具有减少对应的操作步骤,提高神经网络的计算效果的优点。
[0241] 本申请还揭露了一个机器学习运算装置,其包括一个或多个在本申请中提到的计算装置,用于从其他处理装置中获取待运算数据和控制信息,执行指定的机器学习运算,执行结果通过I/O接口传递给外围设备。外围设备譬如摄像头,显示器,鼠标键盘,网卡,wifi接口,服务器。当包含一个以上计算装置时,计算装置间可以通过特定的结构进行链接并传输数据,譬如,通过PCIE总线进行互联并传输数据,以支持更大规模的机器学习的运算。此时,可以共享同一控制系统,也可以有各自独立的控制系统;可以共享内存,也可以每个加速器有各自的内存。此外,其互联方式可以是任意互联拓扑。
[0242] 该机器学习运算装置具有较高的兼容性,可通过PCIE接口与各种类型的服务器相连接。
[0243] 本申请还揭露了一个组合处理装置,其包括上述的机器学习运算装置,通用互联接口,和其他处理装置。机器学习运算装置与其他处理装置进行交互,共同完成用户指定的操作。图6A为组合处理装置的示意图。
[0244] 其他处理装置,包括中央处理器CPU、图形处理器GPU、神经网络处理器等通用/专用处理器中的一种或以上的处理器类型。其他处理装置所包括的处理器数量不做限制。其他处理装置作为机器学习运算装置与外部数据和控制的接口,包括数据搬运,完成对本机器学习运算装置的开启、停止等基本控制;其他处理装置也可以和机器学习运算装置协作共同完成运算任务。
[0245] 通用互联接口,用于在所述机器学习运算装置与其他处理装置间传输数据和控制指令。该机器学习运算装置从其他处理装置中获取所需的输入数据,写入机器学习运算装置片上的存储装置;可以从其他处理装置中获取控制指令,写入机器学习运算装置片上的控制缓存;也可以读取机器学习运算装置的存储模块中的数据并传输给其他处理装置。
[0246] 可选的,该结构如图7A所示,还可以包括存储装置,存储装置分别与所述机器学习运算装置和所述其他处理装置连接。存储装置用于保存在所述机器学习运算装置和所述其他处理装置的数据,尤其适用于所需要运算的数据在本机器学习运算装置或其他处理装置的内部存储中无法全部保存的数据。
[0247] 该组合处理装置可以作为手机、机器人、无人机、视频监控设备等设备的SOC片上系统,有效降低控制部分的核心面积,提高处理速度,降低整体功耗。此情况时,该组合处理装置的通用互联接口与设备的某些部件相连接。某些部件譬如摄像头,显示器,鼠标,键盘,网卡,wifi接口。
[0248] 在一些实施例里,还申请了一种芯片,其包括了上述机器学习运算装置或组合处理装置。
[0249] 在一些实施例里,申请了一种芯片封装结构,其包括了上述芯片。
[0250] 在一些实施例里,申请了一种板卡,其包括了上述芯片封装结构。参阅图7B,图7B提供了一种板卡,上述板卡除了包括上述芯片389以外,还可以包括其他的配套部件,该配套部件包括但不限于:存储器件390、接口装置391和控制器件392;
[0251] 所述存储器件390与所述芯片封装结构内的芯片通过总线连接,用于存储数据。所述存储器件可以包括多组存储单元393。每一组所述存储单元与所述芯片通过总线连接。可以理解,每一组所述存储单元可以是DDR SDRAM(英文:Double Data Rate SDRAM,双倍速率同步动态随机存储器)。
[0252] DDR不需要提高时钟频率就能加倍提高SDRAM的速度。DDR允许在时钟脉冲的上升沿和下降沿读出数据。DDR的速度是标准SDRAM的两倍。在一个实施例中,所述存储装置可以包括4组所述存储单元。每一组所述存储单元可以包括多个DDR4颗粒(芯片)。在一个实施例中,所述芯片内部可以包括4个72位DDR4控制器,上述72位DDR4控制器中64bit用于传输数据,8bit用于ECC校验。可以理解,当每一组所述存储单元中采用DDR4-3200颗粒时,数据传输的理论带宽可达到25600MB/s。
[0253] 在一个实施例中,每一组所述存储单元包括多个并联设置的双倍速率同步动态随机存储器。DDR在一个时钟周期内可以传输两次数据。在所述芯片中设置控制DDR的控制器,用于对每个所述存储单元的数据传输与数据存储的控制。
[0254] 所述接口装置与所述芯片封装结构内的芯片电连接。所述接口装置用于实现所述芯片与外部设备(例如服务器或计算机)之间的数据传输。例如在一个实施例中,所述接口装置可以为标准PCIE接口。比如,待处理的数据由服务器通过标准PCIE接口传递至所述芯片,实现数据转移。可选的,当采用PCIE 3.0X 16接口传输时,理论带宽可达到16000MB/s。在另一个实施例中,所述接口装置还可以是其他的接口,本申请并不限制上述其他的接口的具体表现形式,所述接口单元能够实现转接功能即可。另外,所述芯片的计算结果仍由所述接口装置传送回外部设备(例如服务器)。
[0255] 所述控制器件与所述芯片电连接。所述控制器件用于对所述芯片的状态进行监控。具体的,所述芯片与所述控制器件可以通过SPI接口电连接。所述控制器件可以包括单片机(Micro Controller Unit,MCU)。如所述芯片可以包括多个处理芯片、多个处理核或多个处理电路,可以带动多个负载。因此,所述芯片可以处于多负载和轻负载等不同的工作状态。通过所述控制装置可以实现对所述芯片中多个处理芯片、多个处理和或多个处理电路的工作状态的调控。
[0256] 在一些实施例里,申请了一种电子设备,其包括了上述板卡。
[0257] 电子设备包括数据处理装置、机器人、电脑、打印机扫描仪平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。
[0258] 所述交通工具包括飞机、轮船和/或车辆;所述家用电器包括电视、空调微波炉、箱、电饭煲、加湿器洗衣机、电灯、燃气灶、油烟机;所述医疗设备包括核磁共振仪、B超仪和/或心电图仪。
[0259] 如图8所示,信号采集器用于接收信号,并将信号和待处理图像作为输入数据传递给板卡内部的芯片。
[0260] 可选地,上述图像处理芯片可为人工神经网络处理芯片。
[0261] 可选地,信号采集器为麦克风或者多阵列麦克风。
[0262] 其中板卡内部的芯片的包括同上述所示的实施例,用于得到对应的输出数据(即处理后的图像),并将其传输至交互界面中。
[0263] 其中交互界面接收上述芯片(可以看成人工神经网络处理器)的输出数据,并将其转化为合适形式的反馈信息显示给用户。
[0264] 其中控制器单元接收用户的操作或命令,并控制整个信号处理装置的运作。
[0265] 可选地,上述电子设备可为数据处理装置、机器人、电脑、平板电脑、智能终端、手机、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储或者可穿戴设备。
[0266] 参见图9,图9为本发明实施例提供的一种信号处理方法的流程示意图。如图9所示,该方法包括:
[0267] 901、信号处理装置采集用户输入的信号。
[0268] 902、所述信号处理装置根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,所述目标区域为待处理图像的处理区域。
[0269] 在一种可行的实施例中,所述根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,包括:
[0270] 将所述信号通过语音识别技术、图像识别技术、自然语言处理技术等转换成文本信息;
[0271] 将所述文本信息通过自然语言处理技术和所述目标信号指令转换模型转换成所述图像处理指令;
[0272] 用于根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
[0273] 在一种可行的实施例中,所述根据目标信号指令转换模型将所述信号转换成图像处理指令和目标区域,包括:
[0274] 将所述信号通过语音识别技术、语义理解技术、图像识别技术、自然语言处理技术和所述信号指令转换模型转换成所述图像处理指令;
[0275] 根据所述图像处理指令中的语义区域的粒度和图像识别技术对所述待处理图像进行区域划分,获取所述目标区域。
[0276] 在一种可行的实施例中,所述方法还包括:
[0277] 存储所述文本信息或者所述图像处理指令或者所述目标区域。
[0278] 903、所述信号处理装置根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,得到处理图像,将所述处理图像转化为输出信息。
[0279] 在一种可行的实施例中,所述根据所述图像处理指令和目标图像处理模型对所述目标区域进行处理,包括:
[0280] 在预设时间窗口内从所述存储模块中获取M条图像处理指令,所述M为大于1的整数;
[0281] 根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
[0282] 在一种可行的实施例中,所述根据所述M条图像处理指令和所述目标图像处理模型对所述目标区域进行处理,包括:
[0283] 删除所述M条图像处理指令中,功能相同的图像处理指令,以得到N条图像处理指令,所述N为小于所述M的整数;
[0284] 根据所述N条图像处理指令和所述目标图像处理模型对所述目标区域进行处理。
[0285] 在一种可行的实施例中,所述接收信号和待处理图像之前,所述方法还包括:
[0286] 对信号指令转换模型进行自适应训练,以得到目标信号指令转换模型。
[0287] 在一种可行的实施例中,所述对所述信号指令转换模型进行自适应训练是离线进行的或者是离线进行的。
[0288] 在一种可行的实施例中,所述对所述信号指令转换模型进行自适应训练是有监督的或者是无监督的。
[0289] 在一种可行的实施例中,所述对信号指令转换模型进行自适应训练,以得到目标信号指令转换模型,包括:
[0290] 根据所述信号指令转换模型将所述信号换成预测指令;
[0291] 确定所述预测指令与其对应的指令集合的相关系数;
[0292] 根据所述预测指令与其对应的指令集合的相关系数优化所述信号指令转换模型,以得到所述目标信号指令转换模型。
[0293] 在一种可行的实施例中,所述采集用户输入的信号之前,所述方法还包括:
[0294] 对图像处理模型进行自适应训练,以得到目标图像处理模型。
[0295] 在一种可行的实施例中,所述对所述图像处理模型进行自适应训练是离线进行的或者是离线进行的。
[0296] 在一种可行的实施例中,所述对所述图像处理模型进行自适应训练是有监督或者无监督的。
[0297] 在一种可行的实施例中,所述对图像处理模型进行自适应训练,以得到目标图像处理模型,包括:
[0298] 根据所述图像处理模型对所述待处理图像进行处理,以得到预测图像;
[0299] 确定所述预测图像与其对应的目标图像的相关系数;
[0300] 根据所述预测图像与其对应的目标图像的相关系数优化所述图像处理模型,以得到所述目标图像处理模型。
[0301] 在一种可行的实施例中,所述将所述处理图像转化为输出信息,包括:
[0302] 获取转换指令,所述转换指令包含指定数据类型,所述指定数据类型包括以下一种类型:语音类型、图像类型、文本类型;
[0303] 在所述指定数据类型为图像类型时,输出所述处理图像;
[0304] 在所述指定数据类型为文本类型时,输出文本信息;
[0305] 在所述指定数据类型为语音类型时,输出语音信息。
[0306] 在一种可行的实施例中,所述方法还包括:
[0307] 发送交互信息给用户,接收用户反馈信息,并依据该反馈信息生成相应的指令。
[0308] 需要说明的是,图9所示的方法的各个步骤的具体实现过程可参见上述信号处理装置的具体实现过程,在此不再叙述。
[0309] 本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
[0310] 本发明实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
[0311] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0312] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0313] 在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
[0314] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0315] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元可以采用硬件的形式实现。
[0316] 以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本发明的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈