将口述想法变换为视觉表示专利检索-许可空中管制专利检索查询-专利查询网

将口述想法变换为视觉表示

阅读：1052发布：2020-05-31

专利汇可以提供将口述想法变换为视觉表示专利检索，专利查询，专利分析的服务。并且公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。对口述想法进行变换可以包括接收用户的口述想法的音频输入，并且将该音频输入转换为所述口述想法的文本。该系统可以使用词语频率来从所述文本中识别多个主题，并且可以通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图，并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。该系统可以通过使用主题形状表示所述多个主题的相关主题来生成对所述多个主题的主题图的视觉显示，所述主题形状可以由所确定的关系来连接并且由所分配的权重来确定大小。，下面是将口述想法变换为视觉表示专利的具体信息内容。

权利要求

1.一种将口述想法变换为对在所述口述想法中发现的相关主题的视觉表示的方法，包括：
在计算设备处接收用户的口述想法的音频输入；
将所述音频输入转换为所述口述想法的文本；
使用词语频率从所述文本中识别多个主题；
通过以下操作来在所述计算设备处创建所述多个主题的主题图：确定所述多个主题中的主题之间的关系，以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重；以及
通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示，其中，所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。
2.根据权利要求1所述的方法，还包括：
基于所述主题形状的大小和所确定的关系向所述主题形状中的每个主题形状分配大纲参数；以及
基于所述大纲参数来生成大纲，其中，所述大纲参数包括标题和副标题。
3.根据权利要求1所述的方法，其中，识别所述多个主题还包括：
定义针对在所述文本中包括的词语的评价系统；以及
使用所述词语频率和所分配的评价来形成词语聚类，其中，所述词语聚类定义主旨领域。
4.根据权利要求1所述的方法，其中，确定所述多个主题中的主题之间的关系包括：
将所述文本分组成与所述多个主题中的每个主题相关联的文本群组；并且确定所述文本群组中的每个文本群组之间的关系。
5.根据权利要求1所述的方法，其中，至少基于所确定的关系来向所述多个主题和实体中的每个分配所述权重包括：
针对所述多个主题中的每个主题将所述文本分组成文本群组；
计算每个文本群组的总文本百分比；以及
基于每个文本群组的所述总文本百分比来向每个文本群组分配权重。
6.一种用于变换口述想法的系统，包括：
用户输入接口；
处理系统；
一个或多个存储介质；
存储在所述一个或多个存储介质中的至少一个存储介质上的应用，所述应用当由所述处理系统执行时，指导所述处理系统进行以下操作：
在计算设备处接收用户的口述想法的音频输入；
将所述音频输入转换为所述口述想法的文本；
使用词语频率从所述文本中识别多个主题；
通过以下操作来在所述计算设备处创建所述多个主题的主题图：确定所述多个主题中的主题之间的关系，以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重；以及
通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示，其中，所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。
7.根据权利要求6所述的系统，其中，所述应用还指导所述处理系统进行以下操作：
基于所述主题形状的大小和所确定的关系向所述主题形状中的每个主题形状分配大纲参数；以及
基于所述大纲参数来生成大纲，其中，所述大纲参数包括标题和副标题。
8.根据权利要求6所述的系统，其中，识别所述多个主题还包括：
定义针对在所述文本中包括的词语的评价系统；以及
使用所述词语频率和所分配的评价来形成词语聚类，其中，所述词语聚类定义主旨领域。
9.根据权利要求6所述的系统，其中，至少基于所确定的关系来向所述多个主题中的每个主题分配所述权重包括：
将所述文本分组成与所述多个主题中的每个主题相关联的文本群组；并且确定所述文本群组中的每个文本群组之间的关系。
10.根据权利要求6所述的系统，其中，至少基于所确定的关系来向所述多个主题中的每个主题分配所述权重包括确定所述多个主题的层级。
11.具有存储在其上的指令的一个或多个计算机可读存储介质，所述指令当由处理系统执行时，指导所述处理系统至少进行以下操作：
在计算设备处接收用户的口述想法的音频输入；
将所述音频输入转换为所述口述想法的文本；
使用词语频率从所述文本中识别多个主题；
通过以下操作来在所述计算设备处创建所述多个主题的主题图：确定所述多个主题中的主题之间的关系，以及至少基于所确定的关系来向所述多个主题中的每个主题分配权重；以及
通过使用主题形状表示所述多个主题中的相关主题来在所述计算设备处生成对所述多个主题的所述主题图的视觉显示，其中，所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。
12.根据权利要求11所述的介质，其中，所述指令还指导所述处理系统至少进行以下操作：
基于所述主题形状的大小和所确定的关系向所述主题形状中的每个主题形状分配大纲参数；以及
基于所述大纲参数来生成大纲，其中，所述大纲参数包括标题和副标题。
13.根据权利要求11所述的系统，其中，识别所述多个主题还包括：
定义针对在所述文本中包括的词语的评价系统；以及
使用所述词语频率和所分配的评价来形成词语聚类，其中，所述词语聚类定义主旨领域。
14.根据权利要求11所述的系统，其中，至少基于所确定的关系来向所述多个主题中的每个主题分配所述权重包括：
将所述文本分组成与所述多个主题中的每个主题相关联的文本群组；并且确定所述文本群组中的每个文本群组之间的关系。
15.根据权利要求11所述的系统，其中，所述指令还指导所述处理系统至少进行以下操作：
针对所述多个主题中的每个主题将所述文本分组成文本群组；
计算每个文本群组的总文本百分比；以及
基于每个文本群组的所述总文本百分比来向每个文本群组分配权重。

说明书全文

将口述想法变换为视觉表示

背景技术

[0001] 头脑风暴是指人们可以用来为了创作内容(例如，写文章)而产生想法的一种方法。在头脑风暴的过程期间，人们将他们所有的想法都写到纸上而并不担心如何将它们组合在一起。

[0002] 然而，头脑风暴对于具有诸如书写障碍和阅读障碍之类的某些缺陷的人来说会是一个困难的过程。书写障碍是指书写能力的缺陷；而阅读障碍则是指阅读失常，其特征在于尽管拥有正常智力但在阅读方面存在困难。一些拥有书写障碍和阅读障碍的人拥有想法，但是确难以将它们从头脑中取出并表达于纸面上，也无法将它们组织为关键主题。他们会发现大声说出他们的想法会更加自然。将经组织的想法写在纸上对于他们构成障碍，这妨碍了他们容易地进行自我表达。发明内容

[0003] 公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。

[0004] 将口述想法变换为在所述口述想法中发现的相关主题的视觉表示可以包括接收用户的口述想法的音频输入以及将该音频输入转换为所述口述想法的文本。接着，该系统能够使用词语频率来从文本中识别多个主题，并且能够通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图，并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。接着，该系统能够通过使用主题形状表示所述多个主题中的相关主题来生成对所述多个主题的主题图的视觉显示。所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。在一些情况下，该系统能够基于所述主题形状的大小和所确定的关系来向所述主题形状中的每个主题形状分配大纲参数，并且基于该大纲参数来生成大纲。

[0005] 提供了该发明内容以用简化的形式引入对在以下的具体实施方式中进一步描述的概念的选择。应当理解的是，该发明内容不旨在标识所要求保护主题的关键特征或必要特征，也不旨在用于限制所要求保护的主题的范围。附图说明

[0006] 图1图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。

[0007] 图2图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。

[0008] 图3A-3E图示了将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的一些示例场景。

[0009] 图4图示了示例计算系统的组件。

具体实施方式

[0010] 公开了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的应用和服务。

[0011] 尽管引用了“应用”，但是应当理解的是，应用可以具有不同的功能范围。也就是说，应用可以是独立应用或者另一个产品的插件或特征。应用可以是本地的或者在线被提供或者作为服务。

[0012] 主题是词语或词语的分布，并且可以对应于实体的方面或者实体本身。实体可以是指人、地方、东西、事件、任务、或概念。主题充当相关信息的主体或类别。表达(例如，句子、短句、或语段)的主题可以被用于实体歧义消除(例如，使用隐含狄利克雷分布(LDA)及其层级变化形式)。实体歧义消除是指从文本中识别实体并且利用几个实体类型标签中的一个对其进行标记。在一些情况下，维基百科(Wikipedia)可以被用作大规模实体歧义消除的综合参考目录。在其他情况下，可以使用其他公共和/或私有的语料库来促进实体歧义消除。

[0013] 实体可以从用户口述的想法中被识别并且被用作相关主题和/或被用来确定相关主题。

[0014] 将口述想法变换为在所述口述想法中发现的相关主题的视觉表示可以包括接收用户的口述想法的音频输入以及将该音频输入转换为所述口述想法的文本。接着，该系统能够使用词语频率来从文本中识别多个主题，并且能够通过确定所述多个主题中的主题之间的关系来创建所述多个主题的主题图，并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重。接着，该系统能够通过使用主题形状表示所述多个主题中的相关主题来生成对所述多个主题的主题图的视觉显示。所述主题形状由所确定的关系来连接并且由所分配的权重来确定大小。在一些情况下，该系统能够基于所述主题形状的大小和所确定的关系来向所述主题形状中的每个主题形状分配大纲参数。该大纲参数表示大纲的组织层级，例如标题或副标题。该系统接着可以基于该大纲参数来生成大纲。

[0015] 所公开的应用和服务允许用户向计算设备中讲话，同时该系统基于用户已经以自由形式的口头语言所讨论的想法来为他们创建结构(主题图的视觉显示)。有利的是，这有助于人们使用口头的“大声说话”方法来收集想法。这对于认为将他们的想法大声说出来要比将它们键入或书写更加舒适的人们来说是特别有帮助的。

[0016] 在用户说话时，该系统基于用户向系统中说出的想法来创建对主题图的视觉显示。该主题图可以单独从用户的音频输入来生成，而不要求用户将主要的主题直接输入到系统中。有利的是，该系统可以从接收自用户的音频输入来确定主要主题以及子主题。

[0017] 图1图示了用于将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的示例过程。参考图1，执行过程100的计算设备例如可以被实施为关于图4所描述的系统400，并且可以被用来访问诸如口述想法变换应用(“变换应用”)之类的应用以及网络上的诸如话音到文本服务之类的宽泛的服务。

[0018] 用户计算设备可以是但不限于个人计算机(例如，台式计算机)、膝上型计算机、个人数字助理(PDA)、视频游戏设备、移动电话(或智能电话)、平板计算机、板式计算机、终端、可穿戴设备，等等。应当意识到的是，用户计算设备可以是为其用户提供加载并执行软件程序的能力以及输入音频的能力的任意类型的计算系统，并且可以如关于系统400所描述的那样被实施。

[0019] 变换应用可以被存储在用户计算设备上(例如，客户端侧应用)或者使用web浏览器(例如，标准互联网浏览器)作为(例如，在服务器上运行或者在云端托管的)基于web的变换应用被访问，并且该应用的界面可以在web浏览器内向用户显示。因此，该应用可以是客户端侧应用和/或非客户端侧(例如，基于web的)应用。在一些情况下，该变换应用可以是诸如内容创建应用之类的应用的特征。

[0020] 往来于计算设备的通信可以在一些情况下经由应用编程接口(API)来实行。API是由程序代码组件或硬件组件(下文被称为“API实现组件”)所实现的接口，其允许不同的程序代码组件或硬件组件(下文被称为“API调用组件”)访问并使用由API实现组件所提供的一个或多个功能、方法、过程、数据结构、类、和/或其他服务。API可以定义在API调用组件与API实现组件之间传递的一个或多个参数。API通常是用于使得两个或更多个应用能够互相通信的一组程序指令和标准，并且一般地通过互联网被实现为一组超文本传输协议(HTTP)请求消息以及根据REST(表述性状态传输)或SOAP(简单对象访问协议)架构的响应消息的指定格式或结构。

[0021] 所述网络可以是但不限于蜂窝(例如，无线电话)网络、互联网、局域网(LAN)、广域网(WAN)、Wi-Fi网络，或者其组合。这样的网络可以涉及网络部件的连接，所述网络部件例如集线器、桥接器、路由器、交换机、服务器、和网关。例如，该网络可以包括一个或多个连接的网络(例如，多网络环境)，包括诸如互联网之类的公共网络和/或诸如安全企业私有网络之类的私有网络。如本领域技术人员将会理解的，针对网络的访问可以经由一个或多个有线或无线接入网络(未示出)来提供。同样如本领域技术人员将会理解的，通信网络可以采用若干种不同的形式并且可以使用若干种不同的通信协议。

[0022] 为了开始过程100，该系统可以接收用户所讲出的想法的音频输入(105)。用户可以通过用户界面(UI)来与运行想法变换应用或者具有口述想法变换特征的内容创建应用的计算设备进行交互以录入音频输入。

[0023] 该计算设备被配置为例如通过键盘、鼠标、轨迹板、触摸板、触摸屏、麦克风、相机、目光跟踪器、或其他输入设备接收来自用户的输入。该UI使得用户能够与在用户计算设备上显示或者通过其显示的诸如变换应用之类的各种应用进行交互。通常而言，该UI被配置为使得用户能够容易地与应用的功能交互。例如，用户可以在讨论用于内容创建的想法(实体)的同时向计算设备的麦克风中讲话。

[0024] 通过该变换应用，用户能够生成他们所讲出想法的视觉表示而不必执行与计算设备的非口头交互。实际上，该变换应用不要求与例如键盘、鼠标、轨迹板、触摸板、触摸屏的用户交互。该系统允许用户使用口头的“大声说话”方式来生成想法。

[0025] 该系统接着可以将该音频输入转换为口述想法的文本(110)。在一些情况下，该系统可以在用户讲话时将音频输入动态地转换为文本。在其他情况下，该系统可以在用户已经完成讲话之后将音频输入转换为文本。该系统可以在本地将音频输入转换为文本或者将该音频输入发送至话音到文本服务以便被转换。

[0026] 通过该话音到文本转换，获得词语和实体的一个或多个集合并且可以对每个集合或各个集合单独地执行分析。如将要更加详细地讨论的，该转换允许该系统分析文本以生成主题图的视觉显示。

[0027] 该系统可以在接收到来自话音到文本转换操作的文本单元时自动地执行操作115、120和125。该文本单元可以基于任何合适的因素。不需要对文本中的命令进行解释或解析。

[0028] 一旦音频输入已经被转换为口述想法的文本(110)，该系统就可以使用词语频率来识别多个主题(115)。该系统接着可以例如通过确定多个主题中的主题之间的关系(121)来创建所述多个主题的主题图(120)，并且至少基于所确定的关系来向所述多个主题中的每个主题分配权重(122)。

[0029] 该系统接着可以例如通过使用主题形状表示所述多个主题中的相关主题(126)以生成所述多个主题的主题图的视觉显示。所述主题形状由所确定的关系来连接(127)并且由所分配的权重来确定大小(128)。

[0030] 所述多个主题可以是从用户的口述想法中讨论的实体中识别的关键主题和实体。所述多个主题可以通过查看某些词语在整个文本中被使用的频率而被识别。该系统不需要查看非必要的或者在讲话时常用的词语的词语频率，诸如“the”、“of”、“and”、“a”和“it”。
为了识别多个主题，可以基于词语频率来给予词语权重。接着，具有高于权重阈值的权重的词语可以被识别为主题。

[0031] 在一些情况下，该系统可以定义针对在文本中所包括的词语的评价系统以识别多个主题。例如，具有最高评价的词语可以被识别为主题。

[0032] 在一些情况下，该系统可以向某些类型的词语分配权重以使得它们与其他词语更加相关。该系统可以使用词语频率和所识别的相关词语来形成词语聚类(cluster)。例如，文本中的词语(例如，实体)围绕某些主旨领域彼此相关。因此，这些聚类可以在多个主题内定义更大的概念和主旨领域。

[0033] 当该系统已经识别出多个主题时，该系统能够确定每个主题之间的联系以及每个主题的重要性。主题之间的联系是基于所确定的关系的，并且每个主题的重要性是由所分配的权重来定义的。

[0034] 多个主题之间的关系可以以多种方式来定义。例如，该系统可以通过分析主题的描述之间的链接来识别主题的关系。多个主题之间的关系可以识别出所述多个主题中的每个主题之间的联系并且可以用于进一步分析文本。

[0035] 基于所确定的多个主题的关系，该系统可以向每个主题分配权重。所分配的权重可以标识出该主题的重要性。例如，向一个主题分配的权重越高，则该主题就越重要。该系统例如可以识别口述想法的主要主题和子主题。该系统可以通过分析有多少不同主题与单个主题相关并且向该主题分配权重来标识主要主题。最高权重的主题可以被识别为主要主题。有利地，所描述的发明为用户提供了一种使用他们的自然思考方式(大声说出来)来洞察他们的想法并且释放创造性的方式。该系统能够在用户不直接将主要想法提供至该系统的情况下识别出用户的口述想法的主要主题以及相关主题。

[0036] 在一些情况下，该系统可以确定音频输入中用了多长时间来解释或描述一个主题。该系统可以使用这一信息来帮助向每个主题分配权重。例如，解释主题所花费的时间越多，该主题就越重要并且因此被分配的权重就越高。

[0037] 通过确定主题的关系并且分配权重，该系统能够辨识出主题的层级。该层级可以是在识别最重要的主题时所使用的因素。

[0038] 主题图中的每个主题可以由主题形状所表示。所述主题形状可以包括宽泛的形状，例如但不限于气泡、圆形、正方形、和矩形。主题形状可以由所确定的关系来连接并且由所分配的权重来确定大小。例如，如果在两个主题之间存在所确定的关系，则这两个主题的主题形状将会被连接。所述主题形状例如可以由线条或任何其他连接符所连接。

[0039] 主题形状的大小可以由所分配的权重来确定。例如，最大的主题权重可以包括最高权重的主题。在该情况下，最大的主题形状将包括最重要的主题。

[0040] 在一些情况下，所述多个主题可以不由主题形状所表示。在该情况下，主题图可以包括主题的(多个)词语。如同主题形状那样，所述(多个)词语可以基于所确定的关系来连接并且基于所分配的权重来确定大小。

[0041] 主题图的视觉显示可以被动态地生成。该系统可以在用户讲话时动态地生成主题图的视觉显示。因此，该主题图可以在用户讲话时发展和改变。例如，用户可以通过讲较不重要的主题来开始输入音频。当该用户讲话时，这些较不重要的主题将被包括在主题图的视觉显示中。接着，随着用户花费更多时间讲述更加重要的主题，对该主题图的视觉显示可以改变以将更加重要的主题示出为与较不重要的主题相比更大的主题形状。在一些情况下，表示较不重要的主题的一个或多个主题形状可以从该主题图的视觉显示中被移除。

[0042] 在一些情况下，主题图的视觉显示可以在用户完成讲话之后被生成。在该情况下，该系统可以分析所有经转换的文本并且输出主题图的完整视觉显示。该用户可以在主题图的视觉显示已经被生成之后选择包括另外的音频输入。在该情况下，主题图的视觉显示可以基于所述另外的音频输入而改变。

[0043] 在一个示例中，在用户开始输入音频时，可以显示几个主题。被显示的主题可以由主题形状来表示或者可以在没有主题形状的情况下被显示。流入，该系统可以显示用户正在讲出的所有词语或者可以仅显示所识别的主题而不生成主题图。在用户保持说话时，该系统可以确定关系并向主题分配权重，并且动态地生成主题图的视觉显示。

[0044] 在一些情况下，除了主题图的视觉显示之外或者作为替代，可以基于主题图生成并显示大纲。该大纲可以以各种方式被生成。例如，该系统可以针对多个主题中的每个主题提供标识符或大纲参数。所述标识符或大纲参数可以包括数字、标记等。在一些情况下，该系统可以使用所分配的权重作为标识符或大纲参数。例如，该系统可以基于所确定的层级来向每个主题分配一个数字。具有最高数字的主题可以是最重要的主题并且因此是该大纲的主要主题。接着，具有低于该主要主题的数字的主题就成为子主题。

[0045] 所生成的大纲可以基于建立大纲的规则而被生成。例如，所生成的大纲可以显示与主题句、主要思想、段落概要、解释第一子主题的段落、解释第二子主题的段落、结论段落、和结束句相关的信息。所生成的大纲可以例如被传递至内容创建应用中的文档。

[0046] 图2图示了用于将口述想法变换为在所述口述想法中发现的相关主题和实体的视觉表示的示例过程。参考图2，执行用于将口述想法变换为相关主题的视觉表示的过程(例如，关于图1所描述的过程100)的计算设备例如可以被实施为关于图4所描述的系统400，并且可以用于通过网络来访问诸如口述想法变换应用(“变换应用”)之类的应用以及诸如话音到文本服务之类的宽泛的服务。

[0047] 该过程可以在框202处开始，其中，该系统接收来自用户的音频输入。该音频输入可以是用户的口述想法。在框204处，音频输入可以被转换为文本。在一些情况下，该音频输入被发送(206)至话音到文本服务，例如话音到文本服务208。在一些情况下，该系统在用户已经完成讲话之后将音频输入发送至话音到文本服务208。在其他情况下，该系统在用户讲话时将音频输入在多个单元中发送至话音到文本服务208。话音到文本服务208将该音频输入转换为文本并且将所转换的文本发送(210)回该系统。话音到文本服务208可以但并不限于来自诸如BING翻译之类的口述应用或者翻译应用。

[0048] 在框212处，可以确定多个主题和实体。在一些情况下，该系统将所转换的文本发送(214)至实体服务216和/或主题服务218。实体服务216和主题服务218可以是不同的服务或者是相同的服务。实体服务216可以执行实体分析以从所转换文本中识别一个或多个实体，并且主题服务218可以执行主题分析以从所转换文本中识别一个或多个主题。实体服务216和/或主题服务218接着可以将(多个)主题和(多个)实体发送(220)回该系统。实体服务
216和/或主题服务218可以发送包含有关所识别的主题和实体的信息的一个或多个分包。
所述信息可以包括所识别的实体和所述实体与之相关的所识别的主题，以及与所识别的主题和实体相关联的文本群组。在一些情况下，该分组将包含所识别的主题、与该主题相关联的一个或多个实体，以及与所述主题和所述一个或多个实体相关联的文本群组。在一些情况下，主题可以具有与该主题相关的多个实体。

[0049] 一旦系统已经接收了所识别的主题和实体，该系统就能够在框222处在本地执行频率分析和关系确定。频率分析和关系确定可以由先前所描述的任何方法来执行。在一些情况下，该系统可以向所识别的主题中的每个主题分配权重以及主题形状参数。在一些情况下，在该系统接收到更多主题和实体信息时，所分配的权重可以改变。主题形状参数可以与所分配的权重相关联。主题形状参数可以定义表示每个相关主题和实体的主题形状的大小。所分配的权重越大，主题形状参数就越大，并且因此主题形状的大小就越大。

[0050] 在一些情况下，确定主题之间的关系包括将所转换的文本分组为与每个主题相关联的文本群组。接着，该系统可以确定每个文本群组之间的关系。所述关系可以通过例如针对相关词语分析所述文本群组来确定。

[0051] 在一些情况下，可以通过将所转换的文本分组为与每个主题相关联的文本群组并且接着确定每个文本群组的词语计数以及所有所转换文本的总词语计数来向每个主题分配权重。接着，该系统可以确定每个群组中的文本与文本总量相比的百分比。百分比越高，则所分配的权重就越高。

[0052] 在框224处，该系统可以使用来自频率分析和关系确定的结果来为所述主题创建主题图。该系统还可以通过使用主题形状表示相关主题中的每个来生成针对所述主题和实体所创建的主题图的视觉显示。所述主题形状可以由所确定的关系来连接并且由所分配的权重来确定大小。

[0053] 在一些情况下，该系统可以基于主题形状的大小和所确定的关系来向每个主题形状分配大纲参数。所述大纲参数将确定主题形状是主要主题/标题还是子主题/子标题。该系统可以基于所述大纲参数来生成大纲。

[0054] 图3A-3E图示了将口述想法变换为在所述口述想法中发现的相关主题的视觉表示的一些示例场景。参考图3A，用户可以在他们的计算设备(例如被实施为关于图4所描述的系统400)上打开诸如变换应用300之类的应用。该计算设备可以是任何计算设备，例如但不限于膝上型计算机、台式计算机、平板计算机、个人数字助理、智能电话、智能电视、游戏机、可穿戴设备，等等。

[0055] 一旦用户已经打开了变换应用300，该用户就可以被呈现以欢迎页面，例如欢迎页面302。在该示例中，变换应用300被命名为“Mind Bubbles(思想泡泡)”。为了开始将口述想法变换为视觉显示的过程，该用户可以选择欢迎页面302上的开始命令，例如，开始命令304。该用户可以以各种方式来选择该开始命令。例如，该用户可以使用手指或触笔敲击开始命令302，使用鼠标点击开始命令302，或者说出词语“开始”。在用户已经选择了开始命令
302之后，该用户接着可以开始大声说出想法。

[0056] 参考图3B，在用户开始大声讲话时，应用300能够在本地或者经由话音到文本服务将口述想法(音频输入)转换为文本。接着，通过先前所讨论的方法中的任何方法，应用300可以生成主题图的视觉显示。例如，用户可能正在写有关气候变化的文章。在该情况下，用户可以开始大声说出想要在该文章中包括什么内容。所述口述想法例如可以包括气候变化是什么，气候变化何时开始，以及气候变化的因素。用户接着可以开始讲关于厄尔尼诺现象。例如，用户可以讲厄尔尼诺现象是什么，厄尔尼诺现象何时发生，以及厄尔尼诺现象的影响是什么。该系统可以从文本中识别多个主题。在该示例中，所述主题例如可以包括气候变化和厄尔尼诺现象。

[0057] 在用户讲话时，应用300生成主题图305的视觉显示。主题图305a包括几个主题形状(例如，主要主题形状307和子主题形状309，以及子主题形状310a-310c)以表示每个所识别的主题。主要主题形状307表示主题“气候变化”并且是最重要且最大的主题。因此，“气候变化”是主要主题。子主题形状309表示主题“厄尔尼诺现象”并且是中等大小的主题形状。子主题形状309通过连接符线312连接至主要主题形状307。因此，厄尔尼诺现象涉及到主要主题“气候变化”并且是其子主题。子主题形状310a、子主题形状310b、和子主题形状310c全部是与子主题形状309相关的子主题，并且通过连接符线314连接至子主题形状309。子主题形状310a表示主题“定义”，通过连接符线314a连接至子主题309，并且是指关于厄尔尼诺现象的定义是什么的口述想法。子主题形状310b表示主题“发生”，通过连接符线314b连接至子主题309，并且是指关于厄尔尼诺现象何时发生的口述想法。子主题形状310c表示主题“影响”，通过连接符线314a连接至子主题309，并且是指关于厄尔尼诺现象的影响是什么的口述想法。主题图305a的每个主题形状仅具有一种关系，其是由连接每个主题形状的一条连接符线所定义的。

[0058] 参考图3C，在用户继续讲话时，主题图305a动态地改变并且继续发展成主题图305b。例如，用户可以继续讲气候变化的定义是什么。因此，应用300可以识别出气候变化的定义是与主要主题“气候变化”307相关的子主题。应用300接着显示子主题形状316，其表示主题“定义”，其中连接符线318示出了与主要主题307的关系。

[0059] 用户还可以包括二氧化碳如何与气候变化有关的口述想法。例如，用户可以讨论是什么导致了二氧化碳、温室效应是什么，以及作为温室气体还包括哪些其他气体。在用户讨论这些口述想法时，应用300可以从口述想法的文本中识别出主题。在该示例中，所述主题包括二氧化碳、二氧化碳的成因、温室效应、以及其他温室气体。

[0060] 应用300可以动态地更新主题图305b以包括所识别主题的视觉表示。例如，应用300可以将主题“二氧化碳”识别为与主要主题307相关的更重要的主题。因此，应用300将二氧化碳的主题形状(例如，子主题形状320)的大小设置为比诸如二氧化碳的成因、温室效应、以及其他温室气体之类的较不重要的所识别的主题更大的主题形状。主题图305b示出了子主题形状320通过连接符线322而具有与主要主题形状307的关系。

[0061] 在该情况下，应用300将其余的所识别主题识别为具有相同的重要性。因此，应用300利用相同大小的主题形状来表示每个主题。子主题形状324a表示主题“其他温室气体”，并且通过连接符线326a连接至子主题320。子主题形状324b表示主题“成因”，并且通过连接符线326b连接至子主题320。另外，应用300已经将主题“温室效应”识别为与主题“成因”相关。因此，子主题形状328表示主题“温室效应”，并且通过连接符线330连接至子主题324b。

[0062] 参考图3D，一旦应用300已经生成了主题图305b的视觉显示，用户就可以选择令应用300基于主题图305b生成大纲(例如，大纲350)。在该示例中，主题图305b连同大纲350一起被显示。在一些情况下，大纲350可以在没有主题图305b的情况下被显示。用户接着可以编辑大纲350以添加另外的信息。

[0063] 如先前所讨论的，大纲350可以基于通用大纲规则而被生成。在该情况下，主要主题352是基于主要主题形状307的。子主题I 354a和子主题II 354b分别是基于子主题形状309和子主题形状320的。其余主题用于进一步描述主要主题352、子主题I 354a、和子主题II 354b。描述主要主题352的概念356a是基于子主题形状316的。描述子主题I 354a的概念
356b、概念356c、和概念356d分别是基于子主题形状310a、子主题形状310b、和子主题形状
310c的。描述子主题II 354b的概念356e和概念356f分别是基于子主题形状324a和子主题形状324b的。另外，描述概念356e的概念356是基于子主题形状328的。

[0064] 参考图3E，用户可以在相同的UI创建文档并且显示主题图。这允许用户例如在参考基于讨论气候变化的用户的口述想法所生成的主题图305b的同时撰写有关气候变化的论文375，而并不需要打开不同的应用。在一些情况下，主题图305b可以在独立于文档的窗口中被显示，以允许用户将主题图305b在UI周围移动。

[0065] 图4图示了可以在本文所描述的某些实施例中使用的计算设备的组件。参考图4，系统400可以表示计算设备，例如但不限于个人计算机、阅读器、移动设备、个人数字助理、可穿戴计算机、智能电话、平板计算机、膝上计算机(笔记本或上网本)、游戏设备或游戏机、娱乐设备、混合计算机、台式计算机、交互式白板、或智能电视。由此，关于系统400所描述的更多或更少的部件可以被整合以实施特定的计算设备。

[0066] 系统400包括一个或多个处理器的处理系统405以根据存储在存储系统415上的软件410的指令来转换或操控数据。处理系统405的处理器的示例包括通用中央处理器、专用处理器和逻辑设备，以及任意其他类型的处理设备，它们的组合或变型。处理系统405可以连同诸如网络连接组件、传感器、视频显示组件的一个或多个其他组件一起作为片上系统(SoC)或者被包括在所述SoC之中。

[0067] 软件410可以包括操作系统以及诸如口述想法变换应用420之类的应用程序。设备操作系统总体上控制和协调计算设备中的各个组件的功能，以为应用提供与如网络接口的较低层接口进行连接的更为容易的方式。操作系统的非限制性示例包括来自微软公司的来自苹果公司的 iOSTM，来自谷歌公司的 OS，以及来自Canonical的Ubuntu的各种Linux OS。

[0068] 应当注意的是，操作系统可以原生地在计算设备上实施以及在原生设备操作系统(OS)的顶端运行的软件虚拟层上实施。尽管在图4中并未描绘，但是虚拟化OS层可以被认为是操作系统空间内额外的、嵌套的群组，其中每个群组包含OS、应用程序、和API。

[0069] 存储系统415可以包括能够由处理系统405读取以及能够存储包括内容创建应用420的软件410的任何计算机可读存储介质。

[0070] 存储系统415可以包括以用于存储信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质，所述信息例如计算机可读指令、数据结构、程序模块、或其他数据。存储系统415的存储介质的示例包括随机存取存储器、只读存储器、磁盘、光盘、CD、DVD、闪速存储器、盒式磁带、磁带、磁盘存储或其他磁性存储设备、或者任何其他合适的存储介质。存储介质在任何情况下都不是暂时性传播信号。

[0071] 存储系统415可以被实现为单个存储设备，但是也可以跨处于同一位置或相对于彼此而分布的多个存储设备或子系统来实现。存储系统415可以包括额外的元件，例如能够与处理系统405进行通信的控制器。

[0072] 通常而言，软件在被加载到处理系统405中并被执行时，将计算系统400总体上从通用计算系统转换为被定制为获取并处理信息以便促成如本文针对每种实施方式所描述的口述想法变换的专用计算系统。实际上，对存储系统415上的软件进行编码可以转换存储系统415的物理结构。该物理结构的具体转换可以取决于本说明书中不同实施方式中的各种因素。这样的因素的示例可以包括但不限于用来实现存储系统的存储介质415的技术以及该计算机存储介质是被表征为主存储还是副存储。

[0073] 所述系统可以还包括用户接口系统430，所述用户接口系统430包括使得在用户与系统400之间能够进行通信的输入/输出(I/O)设备和组件。用户接口系统430可以包括输入设备，例如鼠标、轨迹板、键盘、用于接收来自于用户的触摸手势的触摸设备、用于检测用户的非触摸手势和其他运动的运动输入设备、用于检测话音的麦克风、以及可以接收用户输入的其他类型的输入设备以及它们相关联的处理元件。

[0074] 用户接口系统430还可以包括输出设备，例如显示屏、扬声器、针对触觉反馈的触觉设备、以及其他类型的输出设备。在某些情况下，输入和输出设备可以组合在单个设备中，例如描绘图像并且接收来自用户的触摸手势输入的触摸屏显示器。触摸屏(其可以与显示器相关联或者形成显示器的一部分)是被配置为检测触摸的呈现和位置的输入设备。触摸屏可以是电阻式触摸屏、电容式触摸屏、表面声波触摸屏、红外触摸屏、光学成像触摸屏、分散信号触摸屏、声学脉冲识别触摸屏，或者可以利用任何其他触摸屏技术。在一些实施例中，触摸屏是作为透明层被包含在显示器顶层的，以使得用户能够使用一个或多个触摸来与呈现在所述显示器上的对象或其他信息进行交互。

[0075] 视觉输出可以以多种方式在显示器(未示出)上描绘，呈现图形用户界面元素、文本、图像、视频、通知、虚拟按钮、虚拟键盘、或者可以以视觉形式描绘的任何其他类型的信息。

[0076] 用户接口系统430还可以包括在各种用户输入和输出设备的支持下由OS所执行的用户接口软件和相关联的软件(例如，针对图形芯片和输入设备的)。相关联的软件在使用所定义机制将用户接口硬件事件传输至应用时对OS进行辅助。包括用户接口软件的用户接口系统430可以支持图形用户界面、自然用户界面，或者任意其他类型的用户界面。例如，在本文中所描述的内容创建应用420的画布界面可以通过用户接口系统430来呈现。

[0077] 通信接口440可以包括允许通过一个或多个通信网络(未示出)与其他计算系统进行通信的通信连接和设备。共同允许系统间通信的连接和设备的示例可以包括网络接口卡、天线、功率放大器、RF电路、收发器、以及其他通信电路。所述连接和设备可以通过通信介质(例如金属、玻璃、空气，或者任何其他合适的通信介质)进行通信以与其他计算系统或系统的网络交换通信。来往于通信接口的传输是由OS控制的，其在必要时向应用通知通信事件。

[0078] 应当理解的是，本文所描述的示例和实施例仅是出于说明的目的，并且鉴于此的各种修改和变化将被建议给本领域技术人员并且要被包括在本身的精神和界限之内。

[0079] 尽管已经以特定于结构特征和/或动作的语言对主题进行了描述，但是应当理解的是，在所附权利要求中所定义的主题不一定限于在上文中所描述的具体特征或动作。相反，在上文中所描述的具体特征和动作被公开为实施权利要求的示例并且其他的等同特征和动作旨在处于权利要求的范围之内。

标题	发布/更新时间	阅读量
基于对群组、团队和站点的分类的策略	2020-05-08	545
一种反应堆压力容器顶盖贯穿件定位方法	2020-05-08	712
一种浮球式ROV对接与释放装置	2020-05-11	522
用于电子设备的柔性热管道	2020-05-08	260
具有被配置成传送经同步的信号的多个操作部分的触控笔	2020-05-08	621
一种电力系统云服务的网络安全防护系统、装置及方法	2020-05-11	343
请求响应方法、装置、设备和存储介质	2020-05-11	868
一种含双吡唑环的化合物及其中间体的制备方法	2020-05-08	30
在支持免许可频带的无线通信系统中由基站发送下行链路信号的方法以及支持该方法的装置	2020-05-11	434
一种促伤口快速愈合的抗菌性医用敷料及其制备方法	2020-05-08	674

将口述想法变换为视觉表示

将口述想法变换为视觉表示

背景技术

具体实施方式

该功能需要专业版企业版VIP权限，您可以：