首页 / 专利库 / 数学与统计 / 解析法 / 文本分析 / 一种数字电视互动应用页面标记语言解析方法

一种数字电视互动应用页面标记语言解析方法

阅读:77发布:2024-02-14

专利汇可以提供一种数字电视互动应用页面标记语言解析方法专利检索,专利查询,专利分析的服务。并且本 发明 实施例 公开了一种 数字电视 互动应用页面 标记语言 解析方法,包括:从网络上获取数字电视交互服务标记语言HSML文档,分析出文档中具有独立意义的各个标记元素Token,并根据所定义的语法规则,得出语法结构,建立用于表达标记元素之间相互关系的结构树DOM树,再从上到下遍历DOM树,根据每个标记元素所蕴含的 语义概念 调用相应的处理。通过实施本发明实施例,能够对遵循HSML标准的页面的进行有效的正确的解析,同时能够支持动态的javascript脚本语言和w3c制定的DOM标准,增强信息与用户之间的交互性、操作的灵活性等。,下面是一种数字电视互动应用页面标记语言解析方法专利的具体信息内容。

1.一种数字电视互动应用页面标记语言解析方法,其特征在于,包括:
从网络上获取数字电视交互服务标记语言HSML文档,分析出文档中具有独立意义的各个标记元素Token,并根据所定义的语法规则,得出语法结构,建立用于表达标记元素之间相互关系的结构树DOM树,再从上到下遍历DOM树,根据每个标记元素所蕴含的语义概念调用相应的处理函数对标记进行处理,最后由图形处理模对处理之后的结果进行渲染呈现。
2.如权利要求1所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述方法具体包括:
文件下载模块通过http协议、https协议或者ftp协议从网络上获取一个HSML文件,该文件遵循HSML标准;
将HSML文档交给HSML页面解析模块进行解析,对HTML文件进行词法分析、语法分析和语义分析;
经过HSML文档解析模块后,由DOM树构建模块按照w3c提供的DOM规范的要求形成棵DOM树;
JavaScript与DOM对象接口绑定模块将DOM对象在javaseript解释引擎上实现绑定;
在形成DOM树后,页面布局模块为排每个可显示DOM结点形成一个Render结点,为Render结点形成一棵Render树并对Rendcr树进行排版;
由页面渲染与呈现模块进行输出。
3.如权利要求2所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述对HTML文件进行词法分析具体包括:
词法分析是从给定的输入串中提取词素,并产生与之对应的标记;词法分析会跳过注释以及空格,并将分析出的词素插入符号表,同时还会分析标记里存在的语法错误。
4.如权利要求3所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述对HTML文件进行语法分析具体包括:
语法分析读入词法分析阶段所识别出的符号,根据文档类型定义DTD文档所定义的语法规则,识别出各个语法结构并建立相应的内部表示,同时还检查语法的正确性,给出相应的出错信息;
经过语法分析之后,得到标记元素之间的嵌套关系,形成一棵以HSML标记为根节点的语法树;语法树中的每个节点可以采用统一的数据结构存储,用标记名称来标识节点,节点包含了标记的属性和文本内容,同时还包含该节点的孩子节点和兄弟节点的地址信息,根据分析出的语法树,很容易生成HSML文档的DOM树。
5.如权利要求4所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述对HTML文件进行语义分析具体包括:
在HSML文档的解析过程中,语义分析是从HTML根节点开始,自顶向下递归地处理语法树,实现标记处理和渲染显示功能,包括根据标记的含义进行相应的处理操作,对文档中存在的渲染控制描述和脚本进行解析和处理,调用布局管理器和图形界面接口对需要显示的标记元素进行渲染和呈现。
6.如权利要求5所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述由DOM树构建模块按照w3c提供的DOM规范的要求形成棵DOM树具体包括:
DOM在对HSML文档解释时将HTML文档看作一棵树,作为树的根,而HSML文档中的其他结点则看作树中的结点,结点既可作为父结点,其下包含自己的子结点,也可作为其他结点的子结点,更可与同一层的结点成为兄弟结点。
7.如权利要求6所述的数字电视互动应用页面标记语言解析方法,其特征在于,所述JavaScript与DOM对象接口绑定模块将DOM对象在javaseript解释引擎上实现绑定包括:
当HSML解析器在HSML页面中遇到