首页 / 专利库 / 电脑零配件 / 计算机系统 / 一种基于WAQM的网站无障碍检测最佳抽样方法

一种基于WAQM的网站无障碍检测最佳抽样方法

阅读:12发布:2023-03-26

专利汇可以提供一种基于WAQM的网站无障碍检测最佳抽样方法专利检索,专利查询,专利分析的服务。并且一种基于WAQM的 网站 无障碍检测最佳抽样方法,在 计算机系统 上进行以下步骤:将待检测网站中的所有网页按照不同的深度进行分组,具有同一深度的网页聚在一组;构造网站抽样误差的期望模型;给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;对样本中的每个网页,利用机器和人工检测得到网页的无障碍得分;根据无障碍衡量标准,利用抽样的网页无障碍得分估算出整个网站的无障碍得分。本方法的优点在于:可以大幅度降低抽样误差,使抽样 算法 选取的样本网页能更好的反映整个网站的无障碍状况。,下面是一种基于WAQM的网站无障碍检测最佳抽样方法专利的具体信息内容。

1.一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:
1)将待检测网站中的所有网页按照不同的深度化分成d+1组,具有同一深度的网页聚在一组,其中d是该网站的最大深度,首页的深度为0;
2)构造网站的抽样误差的期望模型;
3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;
4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;
5)对样本中的每个网页,利用机器和人工检测得到网页的无障碍得分;
6)根据无障碍衡量标准,利用抽样样本中的网页无障碍得分估算出整个网站的无障碍得分。
2.如权利要求1所述的网站无障碍检测方法,其特征在于:步骤2中所述的构造抽样误差的期望模型,步骤如下:
21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数,首页深度设为0;
22)假设一个网站最大的深度为d(d≥0),那么可以将该网站的所有n个网页按照深度分成(d+1)层,具有同一深度的网页聚类在一层,每层网页的个数分别为n0,n1,n2,n3,…nd,且
23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数分别为n′0,n1′,n2′,…nd′,则在第i(0≤i≤d)层,该层所有网页分数的平均值为ui,该层抽样网页的平均分数为ui′,那么第i层网页的抽样误差的期望为E[errori]=E[|ui-u′i|]  (公式1);
24)根据WAQM标准,计算整个网站共(d+1 )层的抽样误差的期望,即
其中ni表示第i层网页的总个数,wi表示第i层网
页的权重,一般wi取值为wi=e-i;
25)最小化网站的抽样误差期望,即
3.如权利要求1所述的网站无障碍检测方法,其特征在于:步骤3所述的根据最小化网站的抽样误差的期望,得出每层抽样网页数目,具体步骤是:
31)最小化网站的抽样误差期望和最小化
是等同的,将公式(4)作为最终优化函数;
32)每个网页的得分为pi,由于所有网页都是独立的,服从IID分布,假设方差都为σi=D(pi)(0≤i≤d),可以做如下变化得到:
33)将公式(5)带入公式(4),可以得到转化后的优化函数
34)针对公式(6),可以将其看成以下组合优化问题,其中每层的抽样数目n0′,n1′,n2′,…nd′是需要求解的参数,定义N′={n0′,n1′,n2′,…nd′},那么可以得到∑n′i=r*∑ni
35)针对该组合优化问题提出一个贪婪算法,步骤如下:
a.初始为每层的抽样个数n0′n1′,n2′,…nd′都为1;
b.计算每层分别添加1个抽样个数后的期望误差;
c.将计算后期望误差最小对应层的抽样个数加1,其他层不变;
d.重复b,c步骤,直到达到抽样总数。

说明书全文

一种基于WAQM的网站无障碍检测最佳抽样方法

技术领域

[0001] 本发明涉及面向网站无障碍检测的抽样方法的技术领域,特别是基于WAQM的网站无障碍检测抽样方法。

背景技术

[0002] 根据第二次全国残疾人抽样调查,我国各类残疾人数为8296万,涉及2.6亿家庭人口。越来越多的残疾人使用互联网获取信息、娱乐、结识朋友,互联网已经成为残疾人日常生活的重要元素。由于残疾人的自身缺陷和大部分网站对残疾人是障碍的,残疾人在互联网信息服务获取、利用和交互等方面存在巨大的困难。因此,如何有效地发现对于残疾人有障碍的网页和快速评估一个网站的无障碍程度成为了信息无障碍领域的重要研究课题。
[0003] 在实际的检测过程中,由于网站无障碍检测不能完全实现机器自动检测,部分检测需要人工的干预;同时网站一般具有海量的网页,为了减少工人检测开销,对网站进行抽样后检测是必须的。
[0004] 目前在网站无障碍检测领域涉及的抽样算法都是泛化的,即抽样算法没有针对具体的无障碍衡量标准进行优化。但是已有的研究表明,在无障碍检测中,一个抽样算法造成的抽样误差很大程度依赖于所选择无障碍衡量标准;有些数据表明在抽样比率很大时,有的抽样算法仍然会造成20%的抽样误差,这说明了该抽样算法和该无障碍标准不匹配,即使选择了很大的样本,带来的抽样误差依然很大。

发明内容

[0005] 本发明要克服现有技术的上述缺点,提出一种基于WAQM的网站无障碍检测最佳抽样方法
[0006] 为了降低网站无障碍检测中的抽样误差,我们提出了针对无障碍衡量标准的抽样算法。由于WAQM是目前无障碍领域常用的衡量标准,我们提出了一个针对WAQM的最优化抽样算法,该算法大大降低了抽样误差,提高了抽样质量,使抽样算法的选取的网页更好的代表了整个网站的无障碍状况。
[0007] 本发明所述的一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:
[0008] 1)将待检测网站中的所有网页按照不同的深度化分成(d+1)组,具有同一深度的网页聚在一组,其中d是该网站的最大深度,首页的深度为0;
[0009] 2)构造网站的抽样误差的期望模型;
[0010] 3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;
[0011] 4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;
[0012] 5)利用机器和人工检测得到抽样样本中的每个网页无障碍得分;
[0013] 6)根据相关标准,利用网页无障碍得分计算出整个网站的无障碍得分。
[0014] 步骤2中所述的构造抽样误差模型,具体步骤如下:
[0015] 21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数,首页深度设为0;
[0016] 22)假设一个网站最大的深度为d(d≥0),那么可以将该网站的所有n个网页按照深度分成(d+1)层,具有同一深度的网页聚类在一层,每层网页的个数分别为n0,n1,n2,n3,…nd,且
[0017] 23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数分别为n0′n1′,n2′,…nd′,则在第i(0≤i≤d)层,该层所有网页分数的平均值为ui,该层抽样网页的平均分数为ui′,那么第i层网页的抽样误差的期望为E[errori]=E[|ui-u′i|]  (公式1);
[0018] 24)根据WAQM标准,计算整个网站共(d+1)层的抽样误差的期望,即其中ni表示第i层网页的总个数,wi表示第i层网
页的权重,一般wi取值为wi=e-i;
[0019] 25)最小化网站的抽样误差的期望,即
[0020] 步骤3所述的最小化网站的抽样误差的期望,得出每层抽样网页数目,具体是:
[0021] 31)最小化网站的抽样误差的期望和最小化是等同的,将公式(4)作为最终优化函数;
[0022] 32)每个网页的得分为pi,由于所有网页都是独立的,服从IID分布,假设方差都为σi(0≤i≤d),可以做如下变化:
[0023]
[0024]
[0025] 33)将公式(5)带入公式(4),可以得到转化后的优化函数
[0026] 34)针对公式(6),可以将其看做成以下的组合优化问题,其中每层的抽样数目n0′,n1′,n2′,…nd′是需要求解的参数,定义N′={n0′,n1′,n2',…nd′},那么可以得到:
[0027]
[0028]
[0029] ∑n′i=r*∑ni
[0030] 35)针对该组合优化问题提出一个贪婪算法,步骤如下:
[0031] a.初始为每层的抽样个数n0′n1',n2',…nd'都为1;
[0032] b.计算每层分别添加1个抽样个数后的期望误差;
[0033] c.将计算后期望误差最小对应层的抽样个数加1,其他层不变;
[0034] d.重复b,c步骤,直到达到抽样总数。
[0035] 本发明提出了基于WAQM的网站无障碍检测最佳抽样方法,其 优点在于:该抽样方法可以确定每层的抽样个数,更大程度的减少抽样误差,提高了抽样质量,减少了人工代价,可以用在网站无障碍检测中,选取更能代表整个网站的无障碍状况的网页。附图说明
[0036] 图1是本发明的方法流程图

具体实施方式

[0037] 参照附图,进一步说明本发明:
[0038] 为了降低无障碍检测中的抽样误差,本发明了一种基于WAQM的网站无障碍检测最佳抽样方法,在计算机系统上进行以下步骤:
[0039] 1)将待检测网站中的所有网页按照不同的深度化分成(d+1)组,具有同一深度的网页聚在一组,其中d是该网站的最大深度,首页的深度为0;
[0040] 2)构造网站的抽样误差的期望模型;
[0041] 3)给定抽样比率r,通过最小化抽样误差的期望,计算出每层抽样网页数目;
[0042] 4)根据每层网页抽样数目,在每层中随机选择规定数目的网页组成抽样样本;
[0043] 5)利用机器和人工检测得到抽样样本中的每个网页无障碍得分;
[0044] 6)根据无障碍衡量标准,利用网页无障碍得分计算出整个网站的无障碍得分。
[0045] 步骤2中所述的构造抽样误差模型,具体步骤如下:
[0046] 21)首先定义网页深度为从该网站的首页跳转该网页的最小跳数, 首页深度设为0;
[0047] 22)假设一个网站最大的深度为d(d≥0),那么可以将该网站的所有n个网页按照深度分成(d+1)层,具有同一深度的网页聚类在一层,每层网页的个数分别为n0,n1,n2,n3,…nd,且
[0048] 23)计算每层网页的抽样误差的期望。假设抽样算法得到的每层网页个数分别为n0′n1′,n2′,…nd′,则在第i(0≤i≤d)层,该层所有网页分数的平均值为ui,该层抽样网页的平均分数为ui′,那么第i层网页的抽样误差的期望为E[errori]=E[|ui-u'i|]  (公式1);
[0049] 24)根据WAQM标准,计算整个网站共(d+1)层的抽样误差的期望,即其中ni表示第i层网页的总个数,wi表示第i层网
页的权重,一般wi取值为wi=e-i;
[0050] 25)最小化网站的抽样误差期望,即
[0051] 步骤3中提到的最小化网站的抽样误差,得出每层抽样网页数目,具体是:
[0052] 31)最小化网站的抽样误差期望和最小化是等同的,将公式(4)作为最终优化函数;
[0053] 32)每个网页的得分为pi,由于所有网页都是独立的,服从IID分布,假设方差都为σi(0≤i≤d),可以做如下变化:
[0054]
[0055]
[0056] 33)将公式(5)带入公式(4),可以得到转化后的优化函数
[0057] 34)针对公式(6),可以将其看成以下组合优化问题,其中每层的抽样数目n0′n1′,n2′,…nd′是需要被求解的,定义N′={n0′,n1′,n2′,…nd′},那么可以得到[0058]
[0059]
[0060] ∑n′i=r*∑ni
[0061] 35)针对该组合优化问题提出一个贪婪算法,步骤如下:
[0062] a.初始为每层的抽样个数n0′n1′,n2′,…nd′都为1;
[0063] b.计算每层分别添加1个抽样个数后的期望误差;
[0064] c.将计算后期望误差最小对应层的抽样个数加1,其他层不变;
[0065] d.重复b,c步骤,直到达到抽样总数。
[0066] 本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈