一种剧本数据处理方法、装置及应用其的计算机设备专利检索-情感计算人工智能专利检索查询-专利查询网

一种剧本 数据处理方法、装置及应用其的计算机设备

阅读：1029发布：2020-11-16

专利汇可以提供一种剧本数据处理方法、装置及应用其的计算机设备专利检索，专利查询，专利分析的服务。并且本发明提供了一种剧本数据处理方法、装置及应用其的计算机设备，其中，该方法包括：接收包括剧本内容以及与剧本相关信息的剧本数据；根据预设置的数据库对剧本内容进行结构解析；根据数据库以及对剧本内容结构解析的结果对剧本数据进行质量分析；以及将对剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对剧本数据进行评估。通过本发明，可以对影视剧本的质量进行客观高效地评判，进而能够给出优化改进建议。，下面是一种剧本数据处理方法、装置及应用其的计算机设备专利的具体信息内容。

权利要求

1.一种剧本数据处理方法，其特征在于，所述方法包括：
接收剧本数据，其中，所述剧本数据包括剧本内容以及与剧本相关的信息；
根据预设置的数据库对所述剧本内容进行结构解析；
根据所述数据库以及对所述剧本内容结构解析的结果对所述剧本数据进行质量分析；
以及
将对所述剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对所述剧本数据进行评估。
2.根据权利要求1所述的剧本数据处理方法，其特征在于，对所述剧本内容进行结构解析包括对以下至少之一进行解析：内容结构、人物、场景、道具；
其中，对所述内容结构进行解析包括：根据所述数据库中的与内容结构相关的信息对以下至少之一进行解析：集数、每集中的场景以及故事情节发展线索；
对所述人物进行解析包括：根据所述数据库中的与人物相关的信息对以下至少之一进行解析：人物关系、人物特征、人物互动以及人物对白。
3.根据权利要求2所述的剧本数据处理方法，其特征在于，对所述剧本数据进行质量分析包括对以下至少之一进行分析：编剧能力、剧本题材、剧情以及人物，其中，根据所述数据库中的与所述编剧的作品数量、作品质量和作品类型相关的信息对所述编剧能力进行分析，
根据所述数据库中的与剧本题材类型、剧本主题以及目标受众相关的信息对所述剧本题材进行分析，
根据对所述内容结构和所述场景的解析结果对所述剧情进行分析，对所述剧情进行分析包括对以下至少之一进行分析：剧情矛盾冲突、剧情情感体验、剧情悬念吸引、剧情幽默性、剧情曲折性、剧情合理性、情节布局合理性，
根据对所述人物的解析结果对所述人物进行分析，对所述人物进行分析包括对以下至少之一进行分析：人物特征显著性、人物对立冲突显著性、人物情感互动丰富性、人物命运完整性、人物命运曲折性、人物关系戏剧性、人物对白幽默性、人物对白经典性、人物对白精炼性和人物布局合理性。
4.根据权利要求3所述的剧本数据处理方法，其特征在于，对所述剧本数据进行质量分析还包括：
根据所述剧本内容的结构解析结果对商业进行分析；
根据分析结果确定剧本植入广告机会以及所述植入广告的拍摄难度。
5.一种剧本数据处理装置，其特征在于，所述装置包括：
剧本数据接收模块，用于接收剧本数据，其中，所述剧本数据包括剧本内容以及与剧本相关的信息；
结构解析模块，用于根据预设置的数据库对所述剧本内容进行结构解析；
质量分析模块，用于根据所述数据库以及对所述剧本内容结构解析的结果对所述剧本数据进行质量分析；以及
评估模块，用于将对所述剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对所述剧本数据进行评估。
6.根据权利要求5所述的剧本数据处理装置，其特征在于，所述结构解析模块包括：
内容结构解析子模块，用于根据所述数据库中的与内容结构相关的信息对以下至少之一进行解析：集数、每集中的场景以及故事情节发展线索；
人物解析子模块，用于根据所述数据库中的与人物相关的信息对以下至少之一进行解析：人物关系、人物特征、人物互动以及人物对白；
场景解析子模块，用于根据所述数据库中的与场景相关的信息对所述剧本内容中的场景进行解析；
道具解析子模块，用于根据所述数据库中的与道具相关的信息对所述剧本内容中的道具进行解析。
7.根据权利要求6所述的剧本数据处理装置，其特征在于，所述质量分析模块包括：
编剧能力分析子模块，用于根据所述数据库中的与所述编剧的作品数量、作品质量和作品类型相关的信息对所述编剧能力进行分析；
剧本题材分析子模块，用于根据所述数据库中的与剧本题材类型、剧本主题以及目标受众相关的信息对所述剧本题材进行分析；
剧情分析子模块，用于根据所述内容结构解析子模块和所述场景解析子模块的解析结果对以下至少之一进行分析：剧情矛盾冲突、剧情情感体验、剧情悬念吸引、剧情幽默性、剧情曲折性、剧情合理性、情节布局合理性，
人物分析子模块，用于根据所述人物解析子模块的解析结果对以下至少之一进行分析：人物特征显著性、人物对立冲突显著性、人物情感互动丰富性、人物命运完整性、人物命运曲折性、人物关系戏剧性、人物对白幽默性、人物对白经典性、人物对白精炼性和人物布局合理性。
8.根据权利要求7所述的剧本数据处理装置，其特征在于，所述质量分析模块还包括：
商业分析子模块，用于根据所述剧本内容的结构解析结果对商业进行分析，并根据分析结果确定剧本植入广告机会以及所述植入广告的拍摄难度。
9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法。
10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至4中任一项所述方法的计算机程序。

说明书全文

一种剧本数据处理方法、装置及应用其的计算机设备

技术领域

[0001] 本发明涉及大数据处理领域，具体涉及一种剧本数据处理方法、装置及应用其的计算机设备。

背景技术

[0002] 影视剧本对影视项目的成功起着至关重要的作用，所谓剧本乃一剧之本，好的剧本是成功的一半，而差的剧本，无论后面的导演、演员与制作多么出色也难以成为好的影视作品。因此，在一个影视项目策划的初期，对剧本的分析评估是非常重要的，在剧本阶段把好关，对影视项目的投资风险就能更早的得到管控，对项目风险规避付出的代价也会最小。然而，传统的剧本评估主要靠人工经验，对评估人的要求较高，评估的工作量也比较大，效率也比较低，且由于评估人的主观性，难以获得客观一致的评估结果。

发明内容

[0003] 有鉴于此，本发明提供了一种剧本数据处理方法、装置及应用其的计算机设备，以解决上述提及的至少一个问题。

[0004] 根据本发明的一方面，提供了一种剧本数据处理方法，该方法包括：接收剧本数据，其中，剧本数据包括剧本内容以及与剧本相关的信息；根据预设置的数据库对剧本内容进行结构解析；根据数据库以及对剧本内容结构解析的结果对剧本数据进行质量分析；以及将对剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对剧本数据进行评估。

[0005] 根据本发明的另一方面，提供了一种剧本数据处理装置，该装置包括：剧本数据接收模块，用于接收剧本数据，其中，剧本数据包括剧本内容以及与剧本相关的信息；结构解析模块，用于根据预设置的数据库对剧本内容进行结构解析；质量分析模块，用于根据数据库以及对剧本内容结构解析的结果对剧本数据进行质量分析；以及评估模块，用于将对剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对剧本数据进行评估。

[0006] 根据本发明的还一方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述的方法。

[0007] 根据本发明的又一方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有执行上法的计算机程序。

[0008] 通过本发明提供的技术方案，可以对影视剧本的质量进行客观高效地评判，进而能够给出优化改进建议。附图说明

[0009] 通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

[0010] 图1是根据本发明实施例的剧本数据处理装置的结构框图；

[0011] 图2是根据本发明实施例的剧本数据处理系统的结构框图；

[0012] 图3是根据本发明实施例的结构解析模块的结构框图；

[0013] 图4是根据本发明实施例的质量分析模块的结构框图；

[0014] 图5是根据本发明实施例的质量分析模块的另一结构框图；

[0015] 图6是根据本发明实施例的剧本数据处理方法的流程图。

具体实施方式

[0016] 以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。

[0017] 在本发明实施例中，提供了一种剧本数据处理装置。图1是该装置的结构示意图，如图1所示，该装置包括：剧本数据接收模块101、结构解析模块102、质量分析模块103以及评估模块104。

[0018] 在该装置中，剧本数据接收模块101接收包括剧本内容以及与剧本相关的信息的剧本数据，结构解析模块102根据预设置的数据库对剧本内容进行结构解析，质量分析模块103根据数据库以及对剧本内容结构解析的结果对剧本数据进行质量分析，评估模块104将对剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对剧本数据进行评估。

[0019] 该装置基于预设置的数据库，能够对影视剧本进行解析、分析以及评估，相比于现有技术，该装置能够对影视剧本的质量进行客观高效地评判，进而能够给出优化改进建议。

[0020] 上述预设置的数据库，对剧本解析、剧本分析所需的信息数据提供支持。该数据库可以包括：影视剧信息库、影视剧收视\票房信息库、影视受众信息库、IP信息库、影视植入广告信息库、剧本知识库等。其中，剧本知识库又包含：影视类型信息库、关键词信息库、场所\环境信息库、道具信息库、动作\情感信息库、人物关系信息库等。

[0021] 图2是根据本发明实施例的系统结构框图。

[0022] 如图2所示，剧本数据接收模块101接收剧本与剧本相关的信息，如编剧、剧名、类型、人物名称等。

[0023] 结构解析模块102，利用文本检索、文本分类等文本挖掘技术，在影视数据库105的剧本知识库的支持下，实现对剧本分集、分场景、分人物等维度的信息结构化解析，为剧本的分析评估做好分析素材的结构化准备。

[0024] 质量分析模块103，基于本发明实施例的剧本评估分析方案，通过相关的数据分析算法，实现编剧能力分析、剧本题材分析、剧情分析以及人物分析功能。

[0025] 评估模块104，基于质量分析模块103的分析结果，对剧本评估的各项要素进行自动打分，实现分项评估，并在分项评估基础上进行综合评估，同时提出改进建议。另外，也可以实现对剧选角建议，植入广告建议，最后生成剧本评估报告。

[0026] 以下结合图3、图4分别详细描述结构解析模块102和质量分析模块103。

[0027] 如图3所示，该结构解析模块102包括：内容结构解析子模块1021、人物解析子模块1022、场景解析子模块1023以及道具解析子模块1024。

[0028] 内容结构解析子模块1021，用于根据剧本知识库中的与内容结构相关的信息对集数、每集中的场景以及故事情节发展线索等进行解析。

[0029] 具体地，内容结构解析子模块1021解析剧本有多少集，每集多少个场景，每个场景多少描述文字；纵向分多少条故事线索，横向分多少个发展阶段。通过文本匹配统计算法基于分集数和分集场景标注，实现分集、分场景统计，基于故事摘要描述和故事关键情节关键词检索实现线索分析统计。

[0030] 人物解析子模块1022，用于根据数据库中的与人物相关的信息对人物关系、人物特征、人物互动以及人物对白等进行解析。

[0031] 具体地，人物解析子模块1022基于剧本知识库词典中人物关系、人物性格特征描述相关的关键词，检索剧本解析出人物关系与人物特征。利用数据可视化展示工具，基于人物关系解析出人物关系图谱，基于人物特征解析出人物特征关键词云图。人物解析子模块1022通过在同一场景中同时出现的人物，解析人物之前互动的关系与频次，可以用线条连接有互动关系的每两个人物，线条的粗细代表了互动的频次，这样可以描画出人物互动图谱。人物解析子模块1022还可以基于人物名称与标点符号，解析出各人物的对白、话语长度、用词特征和语言特征等，也可以采用文本分类算法对人物语言特征关键词进行分类标识。

[0032] 场景解析子模块1023，用于根据数据库中的与场景相关的信息对剧本内容中的场景进行解析。

[0033] 场景解析子模块1023可以通过文本挖掘技术，实现对如下场景描述类型的标注：

[0034] 场景类型包括：冲突戏、动作戏、情感戏、爱情戏、笑点戏、悬念戏等；

[0035] 场景情节点包括：主场戏、过场戏、剧情小翻转和剧情大翻转；

[0036] 场景时间包括：白天和夜晚；

[0037] 场景场合包括：室内、室外以及各类场所；

[0038] 主角处境包括：顺境和逆境。

[0039] 基于场景解析子模块1023的解析结果，可实现对各类场景的出现占比统计。

[0040] 在实际操作中，可以采用文本挖掘的文本分类算法实现场景分类。在剧本知识库中构建与场景相关描述关键词的词典，主要包含各场景中出现的动作、情态等相关的关键词。基于该词典，可采用向量空间模型(VSM)算法，或贝叶斯文本分类模型等文本分类算法实现对场景的智能分类标识。

[0041] 道具解析子模块1024，用于根据数据库中的与道具相关的信息对剧本内容中的道具进行解析。

[0042] 具体而言，道具解析子模块1024基于剧本知识库词典中与道具相关的关键词，检索剧本中出现的各类物品(包括车辆)类型，以及剧中出现的动物类型。

[0043] 如上所述，结构解析模块102基于剧本知识库的关键词词典，利用文本检索、文本分类等文本挖掘算法技术实现对剧本的解析，并基于解析后的结构化内容实现对剧本要素的统计，以方便后续的剧本分析。

[0044] 图4是上述质量分析模块103的结构框图。如图4所示，该质量分析模块103包括：编剧能力分析子模块1031、剧本题材分析子模块1032、剧情分析子模块1033以及人物分析子模块1034。

[0045] 编剧能力分析子模块1031，用于根据数据库中的与编剧的作品数量、作品质量和作品类型相关的信息对编剧能力进行分析。

[0046] 编剧能力分析子模块1031实现对剧本编剧的资历、能力的分析判断。因为有经验的编剧相对更容易创作出好的作品，因此编剧历史完成作品的数量与质量会是剧本评估的参考因素之一。

[0047] 在具体实施过程中，可以通过如下公式对编剧能力进行分析：

[0048] bScore＝min{0.5×N，1.5}+(6/ar×0.5+rtr×0.5)+min{ct×0.5，1}[0049] 其中，N表示编剧已创作并播出的作品数量，每增加一部可得0.5分，但最高1.5分；ar表示编剧作品的平均收视率或票房，归一化划分为6个层级，最高的为第1级；rtr表示编剧作品在预定时期内(例如，最近两年内)的收视率或票房变化趋势，当趋势为上升时，rtr＝1，当趋势为下降时，rtr＝-1；ct表示编剧已创作并播出的与剧本同类型剧的数量，min{}表示取最小值操作。

[0050] 剧本题材分析子模块1032，用于根据数据库中的与剧本题材类型、剧本主题以及目标受众相关的信息对剧本题材进行分析。

[0051] 具体地，剧本题材分析子模块1032主要从剧本的题材类型、名字、主题、受众等方面分析剧本的市场接受度，因为适合市场需求的剧本才可能会有好的收视与票房。

[0052] 通过市场饱和度、市场接受度两个指标，来评判题材类型与主题市场的接受度。市场饱和度代表同类型、同主题剧的市场数量变化趋势，如在下降说明市场饱和度较高；市场接受度，可以通过市场最近同类型、同主题剧的收视或票房情况来判断，如收视或票房情况较好，说明市场接受度较高。同类型剧通过剧的类型分类可在影视剧信息库中检索。同主题剧可以通过主题关键词的文本挖掘，及文本相似性算法来识别。比较常用的文本相似性算法是余弦相似性(cosine)比较，通过把两个剧本的主题关键词构成向量进行计算得到。

[0053] 题材如根据现有的IP(如知名小说)剧改编，则获得额外的加分；题材的目标受众明确，与目标受众人群兴趣重合度高也会获得额外加分。

[0054] 在具体操作中，通过如下公式对剧本题材进行分析：

[0055] tScore＝(6/ar1×0.5+tr1×0.5+tr2×0.5)+

[0056] (6/ar2×0.5+tr3×0.5+tr4×0.5)+ip+nAu×cAu

[0057] 其中，ar1表示与剧本题材同类型剧在预定时期内的平均收视率或票房，ar2表示与剧本题材同主题剧在预定时期内的平均收视率或票房，tr1表示同类型剧在预定时期内的数量变化趋势，tr2表示同类型剧在预定时期内的收视或票房变化趋势，tr3表示同主题剧在预定时期内的数量变化趋势，tr4表示同主题剧在预定时期内的收视或票房变化趋势，ip表示改编的原小说(IP)的影响指数，nAu表示目标受众的规模，cAu表示与目标受众的重合度。这里的预定时期内可以是最近两年内。

[0058] 剧情分析子模块1033，用于根据内容结构解析子模块和场景解析子模块的解析结果对如下进行分析：剧情矛盾冲突、剧情情感体验、剧情悬念吸引、剧情幽默性、剧情曲折性、剧情合理性以及情节布局合理性。其中：

[0059] 根据剧情矛盾冲突显著性p1和剧情矛盾发展平衡性d1对剧情矛盾冲突进行分析，其中，剧情矛盾冲突显著性p1反映了矛盾冲突戏的场景数占比，剧情矛盾发展平衡性d1反映了矛盾冲突戏在各集分布的平衡性；

[0060] 根据剧情情感体验丰富性p2和剧情情感发展平衡性d2对剧情情感体验进行分析，其中，剧情情感体验丰富性p2反映了情感爱情戏的场景数占比，剧情情感发展平衡性d2反映了情感爱情戏在各集分布的平衡性；

[0061] 根据剧情悬念设置丰富性p3和剧情情感发展平衡性d3对剧情悬念吸引进行分析，其中，剧情悬念设置丰富性p3反映了悬念戏的场景数占比，剧情悬念发展平衡性d3反映了悬念戏在各集分布的平衡性；

[0062] 根据剧情小翻转数量m1和剧情大翻转数量m2对剧情曲折性进行分析；具体地，根据m1、m2以及m1/m2来分析剧情曲折性；

[0063] 根据主场戏数量z1和过场戏数量z2对剧情合理性进行分析；具体地，根据z1、z2以及z2/z1来分析剧情合理性；

[0064] 根据集数js、平均每集场景数cj、平均每个场景字数zs、故事线索数量xs、故事发展阶段数量jd对情节布局合理性进行分析。

[0065] 在具体实施过程中，可以采用逻辑回归(Logistic Regression，LR)模型算法，以历史剧剧本信息、收视或票房数据等作为训练样本，得出评估模型，对剧本的剧情分析进行评估。例如，可以通过如下公式对剧情进行分析：

[0066] sScore＝θ1×p1+θ2×d1+θ3×p2+θ4×d2+θ5×p3+θ6×d3+θ7×p4+θ8×m1+θ9×m2+θ10×m1/m2+θ11×z1+θ12×z2+θ13×z2/z1+θ14×js+θ15×cj+θ16×zs+θ17×xs+θ18×jd，[0067] 其中，θn表示权重系数，可以通过算法训练得到，具体数值可以根据实际操作而定，

[0068] p1＝场景类型标识为“冲突戏、动作戏”的场景数/总场景数，

[0069] d1＝场景类型标识为“冲突戏、动作戏”的场景出现集数/总集数，[0070] p2＝场景类型标识为“情感戏、爱情戏”的场景数/总场景数，

[0071] d2＝场景类型标识为“情感戏、爱情戏”的场景出现集数/总集数，[0072] p3＝场景类型标识为“悬念戏”的场景数/总场景数，

[0073] d3＝场景类型标识为“悬念戏”的场景出现集数/总集数，

[0074] p4＝场景类型标识为“笑点戏”的场景数/总场景数。

[0075] 人物分析子模块1034，用于根据人物解析子模块的解析结果对如下进行分析：人物特征显著性、人物对立冲突显著性、人物情感互动丰富性、人物命运完整性、人物命运曲折性、人物关系戏剧性、人物对白幽默性、人物对白经典性、人物对白精炼性和人物布局合理性，其中：

[0076] 根据主要人物平均特征词数c1、次要人物平均特征词数c2以及人物特征词平均差异数cd对人物特征显著性sC1进行分析；

[0077] 根据对立人物同时出现场景数与总场景数对人物对立冲突显著性sC2进行分析；

[0078] 根据情感戏对手人物同时出现场景数与总场景数对人物情感互动丰富性sC3进行分析；

[0079] 根据各人物出场集数与总集数对人物命运完整性sC4进行分析；

[0080] 根据逆境场景数与顺境场景数对人物命运曲折性sC5进行分析；

[0081] 根据人物关键逆转场景数与总场景数对人物关系戏剧性sC6进行分析；

[0082] 根据搞笑点对白数与总对白数对人物对白幽默性sC7进行分析；

[0083] 根据经典对白语录数与总对白数对人物对白经典性sC8进行分析；

[0084] 根据平均对白长度对人物对白精炼性sC9进行分析；

[0085] 根据主要人物个数g1、次要人物个数g2、主要人物平均出场次数t1、次数人物平均出场次数t2、主要人物平均互动人数h1以及次要人物平均互动人数h2对人物布局合理性进行分析。

[0086] 人物分析子模块1034实现对人物塑造的丰满性、人物互动与对白的精彩性等进行评估。基于结构解析模块102对人物关系、人物特征、人物互动以及人物对白等的解析来实现。

[0087] 在实际操作中，可以采用逻辑回归模型算法，以历史剧剧本信息、收视或票房数据等作为训练样本，得出评估模型。对剧本的人物分析进行评估。例如，可以通过如下公式对对人物进行分析：

[0088] cScore＝a1×sC1+a2×sC2+a3×sC3+a4×sC4+a5×sC5+a6×sC6+a7×sC7+[0089] a8×sC8+a9×sC9+a10×g1+a11×g2+a12×t1+a13×t2+a14×h1+a15×h2

[0090] 其中，αn表示权重系数，可以通过算法训练得到，具体数值可以根据实际操作而定，

[0091] sC1＝1×C1+0.5×c2+0.5×cd，

[0092] sC2＝对立人物同时出现场景数/总场景数，

[0093] sC3＝情感戏对手人物同时出现场景数/总场景数，

[0094] sC4＝avg(各人物出场集数/总集数)，

[0095] sC5＝逆境场景数/顺境场景数，

[0096] sC6＝人物关键逆转场景数/总场景数，

[0097] sC7＝搞笑点对白数/总对白数，

[0098] sC8＝经典对白语录数/总对白数，

[0099] sC9＝平均对白长度。

[0100] 在一个实施例中，如图5所示，质量分析模块103还包括商业分析子模块1035，用于根据剧本内容的结构解析结果对商业进行分析，并根据分析结果确定剧本植入广告机会以及植入广告的拍摄难度。

[0101] 商业分析子模块1035基于结构解析模块102的场景要素解析和道具解析实现对剧本植入广告机会，及拍摄难度系数的评估。

[0102] 植入广告机会可以通过如下公式来确定：

[0103] sb＝min{0.5×b，2}

[0104] 其中，b表示在剧本内容中检索到的可植入广告的商品类别关键词的数量。

[0105] 具体地，可以根据场所、道具、场景要素等描述关键词进行检索，每检索出一个可植入广告的商品类别关键词，则增加0.5分，最高得分为2分。

[0106] 拍摄难度系数取决于对场景描述中涉及的场所、道具、动物、动作特技、天气\季节等实现的难度。例如，场所涉及国外或故宫等难以轻易获得的拍摄地，道具涉及飞机等代价较高昂的物品，动物如狮子等，动作特技如飞车等，天气类型多、季节跨度大等，都会增加拍摄难度。

[0107] 通过如下公式确定植入广告的拍摄难度系数sn：

[0108] sn＝max{-0.5×n，-3}

[0109] 其中，n表示在剧本内容中检索到的拍摄难度因素关键词的数量。具体地，可以根据场所、道具、动物、动作特技、天气\季节等因素进行检索，每检索出一个难度因素关键词减0.5分，最低得分为-3分。

[0110] 如上所述，通过上述的质量分析过程，可以得到对剧本的分项评估。

[0111] 综合分析各项评估得分，采用综合加权算法，可以得到剧本的综合评分：

[0112] aScore＝β1×bScore+β2×tScore+β3×sScore+β4×cScore+β5×sb+β6×sn[0113] 其中，βn表示权重系数，可以通过算法训练和人工经验优化得到，具体数值可以根据实际操作而定。

[0114] 评估模块104可以将以上各项分析结论进行数据可视化展示，自动生成图文分析报告。

[0115] 通过将综合评分、分项评分分别与优秀剧及同类优秀剧的各项评分进行对比，得出该剧本得分较低、需要完善的项，进而提出剧本的改进建议。

[0116] 针对改进后的剧本，通过人物特征关键词，及人物角色年龄、性别、职业、身份等描述，在历史影视剧库中可以通过文本类似分析挖掘算法，找到最匹配的同类角色，并据此推荐出适合角色的演员。

[0117] 基于相似的发明构思，本发明实施例还提供了一种剧本数据处理方法，可以应用于上述的剧本数据处理装置。

[0118] 图6是剧本数据处理方法的流程图，如图6所示，该方法包括：

[0119] 步骤601，接收剧本数据，该剧本数据包括剧本内容以及与剧本相关的信息；

[0120] 步骤602，根据预设置的数据库对剧本内容进行结构解析；

[0121] 步骤603，根据数据库以及对剧本内容结构解析的结果对剧本数据进行质量分析；以及

[0122] 步骤604，将对剧本数据质量分析的结果与对预定剧本质量分析的结果进行对比，并根据对比结果对剧本数据进行评估。

[0123] 通过对影视剧本进行解析、分析和评估，可以对影视剧本的质量进行客观高效地评判，进而给出优化改进建议。

[0124] 在步骤602中，对剧本内容进行结构解析可以包括对内容结构、人物、场景以及道具进行解析。

[0125] 其中，对内容结构进行解析包括：根据数据库中的与内容结构相关的信息对以下至少之一进行解析：集数、每集中的场景以及故事情节发展线索；对人物进行解析包括：根据数据库中的与人物相关的信息对以下至少之一进行解析：人物关系、人物特征、人物互动以及人物对白。

[0126] 在步骤603中，对剧本数据进行质量分析可以包括对编剧能力、剧本题材、剧情以及人物进行分析。其中：

[0127] (1)编剧能力分析

[0128] 根据数据库中的与编剧的作品数量、作品质量和作品类型相关的信息对编剧能力进行分析。

[0129] 在实际操作中，可以通过如下公式对编剧能力进行分析：

[0130] bScore＝min{0.5×N，1.5}+(6/ar×0.5+rtr×0.5)+min{ct×0.5，1}[0131] 其中，N表示编剧已创作并播出的作品数量，ar表示编剧作品的平均收视率，rtr表示编剧作品在预定时期内的收视变化趋势，当趋势为上升时，rtr＝1，当趋势为下降时，rtr＝-1，ct表示编剧已创作并播出的与剧本同类型剧的数量，min{}表示取最小值操作。

[0132] (2)剧本题材分析

[0133] 根据数据库中的与剧本题材类型、剧本主题以及目标受众相关的信息对剧本题材进行分析。

[0134] 在实际操作中，可以通过如下公式对剧本题材进行分析：

[0135] tScore＝(6/ar1×0.5+tr1×0.5+tr2×0.5)+

[0136] (6/ar2×0.5+tr3×0.5+tr4×0.5)+ip+nAu×cAu

[0137] 其中，ar1表示与剧本题材同类型剧在预定时期内的平均收视率，ar2表示与剧本题材同主题剧在预定时期内的平均收视率，tr1表示同类型剧在预定时期内的数量变化趋势，tr2表示同类型剧在预定时期内的收视变化趋势，tr3表示同主题剧在预定时期内的数量变化趋势，tr4表示同主题剧在预定时期内的收视变化趋势，ip表示改编的原IP的影响指数，nAu表示目标受众的规模，cAu表示与目标受众的重合度。这里的预定时期可以是最近两年。

[0138] (3)剧情分析

[0139] 根据对内容结构和场景的解析结果对如下进行分析：剧情矛盾冲突、剧情情感体验、剧情悬念吸引、剧情幽默性、剧情曲折性、剧情合理性、情节布局合理性。

[0140] 其中，根据剧情矛盾冲突显著性p1和剧情矛盾发展平衡性d1对剧情矛盾冲突进行分析，根据剧情情感体验丰富性p2和剧情情感发展平衡性d2对剧情情感体验进行分析，根据剧情悬念设置丰富性p3和剧情情感发展平衡性d3对剧情悬念吸引进行分析，根据剧情小翻转数量m1和剧情大翻转数量m2对剧情曲折性进行分析，根据主场戏数量z1和过场戏数量z2对剧情合理性进行分析，根据集数js、平均每集场景数cj、平均每个场景字数zs、故事线索数量xs、故事发展阶段数量jd对情节布局合理性进行分析。

[0141] 在实际操作中，可以通过如下公式对剧情进行分析：

[0142] sScore＝θ1×p1+θ2×d1+θ3×p2+θ4×d2+θ5×p3+θ6×d3+θ7×p4+θ8×m1+θ9×m2+θ10×m1/m2+θ11×z1+θ12×z2+θ13×z2/z1+θ14×js+θ15×cj+θ16×zs+θ17×xs+θ18×jd，[0143] 其中，θn表示权重系数，可以通过算法训练得到，具体数值可以根据实际操作而定；

[0144] p1表示剧情为矛盾冲突的场景数与总场景数的比值，d1表示含有剧情为矛盾冲突场景的集数与总集数的比值，p2表示剧情为情感的场景数与总场景数的比值，d2表示含有剧情为情感的集数与总集数的比值，p3表示剧情为悬念的场景数与总场景数的比值，d3表示含有剧情为悬念的集数与总集数的比值，p4表示剧情为幽默的场景数与总场景数的比值。

[0145] (4)人物分析

[0146] 根据对人物的解析结果对如下进行分析：人物特征显著性、人物对立冲突显著性、人物情感互动丰富性、人物命运完整性、人物命运曲折性、人物关系戏剧性、人物对白幽默性、人物对白经典性、人物对白精炼性和人物布局合理性。

[0147] 其中，根据主要人物平均特征词数c1、次要人物平均特征词数c2以及人物特征词平均差异数cd对人物特征显著性sC1进行分析；根据对立人物同时出现场景数e2与总场景数f对人物对立冲突显著性sC2进行分析；根据情感戏对手人物同时出现场景数e3与总场景数f对人物情感互动丰富性sC3进行分析；根据各人物出场集数e4与总集数k对人物命运完整性sC4进行分析；根据逆境场景数e5与顺境场景数p对人物命运曲折性sC5进行分析；根据人物关键逆转场景数e6与总场景数f对人物关系戏剧性sC6进行分析；根据搞笑点对白数e7与总对白数g对人物对白幽默性sC7进行分析；根据经典对白语录数e8与总对白数g对人物对白经典性sC8进行分析；根据平均对白长度对人物对白精炼性sC9进行分析；根据主要人物个数g1、次要人物个数g2、主要人物平均出场次数t1、次数人物平均出场次数t2、主要人物平均互动人数h1以及次要人物平均互动人数h2对人物布局合理性进行分析。

[0148] 在实际操作中，可以通过如下公式对人物进行分析：

[0149] cScore＝a1×sC1+a2×sC2+a3×sC3+a4×sC4+a5×sC5+a6×sC6+a7×sC7+[0150] a8×sC8+a9×sC9+a10×g1+a11×g2+a12×t1+a13×t2+a14×h1+a15×h2

[0151] 其中，αn表示权重系数，可以通过算法训练得到，具体数值可以根据实际操作而定；

[0152] sC1＝1×c1+0.5×c2+0.5×cd，sC2＝e2/f，sC3＝e3/f，sC4＝avg(e4/f)，sC5＝e5/p，sC6＝e6/f，sC7＝e7/g，sC8＝e8/g，sC9表示平均对白长度，avg()表示取均值操作。

[0153] 在一个实施例中，步骤603的对剧本数据进行质量分析还可以包括：根据剧本内容的结构解析结果对商业进行分析；根据分析结果确定剧本植入广告机会以及植入广告的拍摄难度。

[0154] 在实际操作中，可以通过如下公式确定植入广告机会sb：

[0155] sb＝min{0.5×b，2}

[0156] 其中，b表示在剧本内容中检索到的可植入广告的商品类别关键词的数量。

[0157] 可以通过如下公式确定植入广告的拍摄难度系数sn：

[0158] sn＝max{-0.5×n，-3}

[0159] 其中，n表示在剧本内容中检索到的拍摄难度因素关键词的数量，max{}表示取最大值操作。

[0160] 由于该方法解决问题的原理与剧本数据处理装置相似，因此该方法的实施可以参见剧本数据处理装置的实施，重复之处不再赘述。

[0161] 本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述的方法。

[0162] 本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有执行上述方法的计算机程序。

[0163] 相比于传统的人工剧本评估方案，本发明实施例提供的方案基于大数据技术与人工智能算法，可以实现对影视剧本的自动解析、自动分析以及自动评分，能够对影视剧本的质量进行客观高效地评判，从而能够给出优化改进建议。

[0164] 显然，本领域技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算机系统来实现，它们可以集中在单个计算机上，或者分布在多个计算装置所组成的网络上，可选地，他们可以用计算机装置可执行的程序代码来实现，从而可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件的结合。

[0165] 以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

标题	发布/更新时间	阅读量
基于虚拟现实的孤独症早期筛查评估系统及方法	2020-05-08	174
一种基于VR技术的记忆提升检测方法及系统	2020-05-08	330
提取用户画像的方法、装置、计算机设备和存储介质	2020-05-08	265
数据分析方法、设备及存储介质	2020-05-08	55
一种面向电网电磁环境的网络舆情及风险信息监测系统、电子设备	2020-05-12	696
一种文本情感测量方法和装置	2020-05-11	210
与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法	2020-05-08	422
一种利用上下文和方面记忆信息的情感分类方法	2020-05-08	107
一种基于隐喻主题挖掘的景区评价知识库构建方法	2020-05-11	369
一种基于情感识别的老人陪护机器人子系统	2020-05-08	589

一种剧本数据处理方法、装置及应用其的计算机设备

一种剧本数据处理方法、装置及应用其的计算机设备

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：