WebAIM-考虑到Web可访问性

WebAIM百万
前1000000个主页的可访问性分析

介绍

2019年2月,WebAIM使用Wave独立API(使用其他工具收集现场技术参数)。虽然这项研究只关注自动检测的问题,这一结果描绘了一幅相当惨淡的画面,显示了残疾人士目前的网络可访问性状态。

样品

站点查找

看看你的主页在我们的研究中排名如何。在下面输入一个域(减去“www.”),以获取数据库中任何站点的详细信息。


“前”百万个网站主要是利用雄伟的百万名单具有最多引用子网的域。因为不是所有的域都有主页,域名列表补充了来自开放页面排名倡议那还不在宏伟的百万名单上。

返回错误的主页(404,不包括在内。包含少于10个HTML元素的页面也被拒绝,这些页面往往是占位符或空文档,而不是传达内容的主页。

分析了730个顶级域名的主页,使用.com(521316),org(76489),最常见的是.NET(39757)。对6010个不同的edu主页进行了分析。

方法

Wave可访问性引擎用于分析呈现的主页(即,应用脚本和样式后所有页面的DOM)。Wave引擎使用启发式和逻辑来检测网页内容中与最终用户可访问性问题和Web内容可访问性准则(WCAG)一致性失败一致的模式。所有自动化工具,包括波,在可访问性问题的检测方面受到限制,只有大约25%的可能的一致性故障可以自动检测。没有可检测的错误并不表示站点是可访问的或兼容的。万博体育官网网址尽管有这些限制,本报告中的数据提供了Web不可访问状态的有意义的表示。

为什么只有主页?

我们选择只关注主页作为Web访问的一般度量标准。主页通常是网站上访问量最大的页面,是网站其余内容的网关。主页不仅受到开发人员的关注,但研究表明,在主页上检测到的问题与其他网站页面之间存在相关性。未来的研究可能会探索主页以外的其他页面。

误差和误差密度

错误是可访问性问题,可通过wave自动检测,具有显著的最终用户影响,可能是wcag 2一致性失败。在100万个主页中检测到59653607个不同的可访问性错误,平均每页59.6个错误.

收集了所有主页的错误密度(错误数除以页面元素数)。分析了782481056个不同的HTML元素,这意味着每个主页平均有782个元素。这导致大约7.6%的主页元素具有可检测的可访问性错误。残障用户希望在他们参与的每13个元素中的1个元素上遇到可检测到的错误。.

注意!

误差密度是一个有趣的度量,在站点查找.然而,页面元素的显著增加(

S和 S例如)可能导致较低的误差密度(建议更好的可访问性)。实际上,许多新的可访问性错误也可能被引入。因此,我们选择在本报告中关注平均可检测错误数(最终用户屏障),而不是错误密度(这些错误在页面元素中的稀释程度)。

基于流行度等级的错误计数和错误密度没有显著变化。与示例中最不受欢迎的站点的主页相比,最受欢迎的域的主页的错误和元素只稍微多一些。

wcag一致性

97.8%的主页可以检测到WCAG 2失败!这些只是自动检测到的错误,与WCAG一致性故障保持一致,具有较高的可靠性。因为自动检测的错误构成了所有可能的wcag故障的一小部分,这意味着最常访问的网站主页的实际wcag 2 a/a a一致性级别非常低,可能低于1%。

最常见的wcag 2故障类型
wcag失败类型 首页 %的主页
低对比度文本 八十五万二千八百六十八 85.3%
缺少图像的可选文本 六十七万九千九百六十四 68%
空链接 五十八万一千四百零八 58.1%
缺少表单输入标签 五十二万八千四百八十二 52.8%
缺少文档语言 三十二万九千六百一十二 33.1%
空按钮 二十五万零三百六十七 25%

尽管失败很普遍,常见错误的类型相对较少。简单地解决这些类型的问题将对Web可访问性产生显著的积极影响。

低对比度

低对比度文本,低于wcag 2 AA阈值,是否检测到最常见的可访问性问题。绝大多数(85.3%)的主页分析有检测到wcag对比失败。仅在包含文本的元素上检测到对比度错误。平均而言,主页有36个不同的文本实例,对比度不足。所有主页HTML元素的4.6%(这是所有元素,不仅是可见元素和文本)的对比度不够。

图像和可选文本

样本中有36713043张图像,平均每页36.7张图片。33.6%的图像丢失(平均每页12.3张)可选文字(不算)ALT =“)18.5%的图片(平均每页6.7张)与缺失或空的可选文本链接。导致了一个可选的文本问题和一个缺乏任何描述的链接。16%的页面有图像,没有中高音属性。

16.8%被分配为可选文本的图像有问题(如alt=“image”,“图形”“空白”,文件名,等)或重复的可选文本(与相邻文本或相邻图像的可选文本相同的可选文本)。

如果我们假设这个百万页的示例表示更广泛的网页的可访问性,这些数据表明,残疾用户遇到的大约一半的图像最终会有不合适的可选文本。这个,然而,假设所有其他图像都是真实的相等的可选文本,当然不是这样。作为一个例子,已提供450万张非链接图像(占所有图像的12.2%)。ALT =“-很可能这些图像中的许多都应该被指定为可选文本。

朗迪斯

2218页(样本的0.2%)有朗迪斯属性存在。然而,12051年的49.7%朗迪斯遇到的属性值无效,例如空值,无效的URL,图像文件名,等。

表格标注

所识别的340万个表单输入中有59%未标记。(或者通过唱名标注,或咏叹调)存在未标记的窗体控件这是一个更广泛的错误页面的强烈指标,其中至少有一个表单标签丢失,平均比没有任何标签错误的页面多出近30个错误。

标题

共检测到18910980个标题。这些分解为170万

S(9.1%),590万

S(31.4%),650万

S(34.5%),320万

S(16.7%),110万

S(5.7%),和500万
S(2.6%)。

有908784例跳过了标题级别(例如,跳出

)-每20个标题中就有一个结构不正确。跳过的标题出现在362659个主页上(占所有页面的36.3%)。148573个主页(14.9%)根本没有标题。

区域

62.4%的主页至少定义了一个区域。这包括带有ARIA标志的页面(例如,用HTML定义的导航区域

咏叹调

在100万个主页中,60.1%的主页上有Aria。检测到2230万个具有aria属性的页面元素。ARIA属性的数量超过了现有图像的数量和标题的数量。包含aria的主页平均每个都有38.3个aria属性。19%的ARIA属性是唱名标注咏叹调,或咏叹调描述.注:这些数字不包括ARIA标志性角色。

带有aria的主页平均比没有aria的主页多11.2个可检测错误。ARIA属性数量的增加也与错误增加有适度的相关性。换言之,使用的咏叹调越多,可检测的误差越高。这并不一定意味着Aria引入了这些错误(这些页面可能更复杂)。但是当aria出现时,页面通常会有更多的错误,更重要的是,随着咏叹调的使用。

文档类型

74.1%的主页具有有效的HTML5 doctype。具有有效HTML5 doctype的页面具有显著更多的页面元素(平均为844对844)。605)和误差(平均61.9对53.3)比其他类型的。1130个独特的文档类型(其中大部分,显然,在示例中遇到)。

顶级域名

分析来自不同顶级域(TLD)的页面的可访问性差异。.com(n=521316)或.net(n=39757)的页面平均比其他域的页面多出几个错误。带.org的页面(n=76489)另一方面,与其他领域相比,公平性显著提高(平均47.4个错误)(60.6个错误)。

来自下列高度常见顶级域的页面(按该TLD中主页的数量排序)的错误明显少于对应域:

  • de(德国)
  • .uk(英国)
  • JP(日本)
  • .nl(荷兰)
  • .edu(美国教育机构)
  • Au(澳大利亚)
  • Ca(加拿大)

来自以下高度常见的顶级域的页面的错误明显多于它们的对应域:

  • 汝(俄罗斯)
  • CN(中国)
  • PL(波兰)
  • Br(巴西)
  • 它(意大利)
  • ES(西班牙)

带.edu(37.1个错误)的主页,.us(36.6个错误)和.gov(30.5个错误)这些公司都隶属于美国实体,所有常见(n>2000)域的平均可访问性错误数最低。

技术

收集并分析了一百万个主页上使用的1195种不同类型技术的数据。下面列出了在5000多个主页上检测到的技术(样本的0.5%)。下面的分类表显示了技术名称,有这种技术的主页的数量,这些页面上出现的平均错误数,在使用该技术的页面上检测到的平均错误数与那些没有。技术从“最佳”到“最差”。

作为一个例子,第一个表表明,Squarespace CMS上的主页的错误(几乎是不使用该技术的页面的一半)减少了45.4%。使用WordPress的页面在可访问性错误方面几乎没有差异,博客上的页面出错率(是其他页面的3倍多)是237%。需要注意的是,附加误差与某项技术的对应关系不能自动归因于该项技术。

内容管理系统

细胞质雄性不育 #主页的百分比 AVG误差的平方 %误差的减少/增加
平方间隙 10036(1%) 三十二点七 45.4%
威克斯 5612(0.6%) 三十五点三 40.9%
哇哇地 5502(0.6%) 四十一 31.4%
要素 8269(0.8%) 四十九 17.9%
逐浪 28401(2.8%) 四十九点六 17.2%
TyPO3 7483(0.7%) 五十六点二 5.9%
猪跑 32217(3.2%) 五十七点八 3.1%
文字出版社 312026(31.2%) 五十九点九 0.6%
火箭 9502(1%) 六十九点五 16.7%
1厘米 7028(0.7%) 九十一点五 53.9%
博客作者 19806(2%) 一百九十二 237%

CMS选择对可访问性的影响具有广泛的多样性。

JavaScript框架

框架 #主页的百分比 AVG误差的平方 %误差的减少/增加
框架 27033(2.7%) 五十二点三 12.6%
吐温马克斯 25802(2.6%) 五十八点三 2.3%
胡子 11803(1.2%) 六十五点五 9.9%
JokOut.js 7046(0.7%) 六十五点六 10%
反应 31960(3.2%) 六十五点五 10.1%
背骨 22678(2.3%) 六十九点三 16.6%
角度的 14939(1.5%) 七十点九 19.2%
必需品 21168(2.1%) 七十一点一 19.7%
车把 15307(1.5%) 七十三点五 23.6%
VUE JS 6639(0.7%) 七十三点七 23.7%
原型 14376(1.4%) 七十四点二 24.8%

除了mootools和tweenmax,采用这些框架中的任何一个都与附加的可访问性错误保持一致。这并不一定意味着框架导致了这些错误,但确实表明,使用这些框架的主页比不使用这些框架的主页有更多的错误。

JavaScript库

图书馆 #主页的百分比 AVG误差的平方 %误差的减少/增加
仄普托 7708(0.8%) 四十四 26.4%
悠悠 20136(2%) 五十二点七 11.9%
jQuery迁移 313391(31.3%) 六十一点七 5.1%
现代主义 197260(19.7%) 六十三点二 7.5%
闪烁 8598(0.9%) 六十四点九 8.8%
音响经理 5671(0.6%) 六十四点九 8.8%
漂亮照片 32684(3.3%) 六十五点四 10%
灯箱 53171(5.3%) 六十五点八 10.9%
道场 7111(0.7%) 六十六点四 11.5%
哈默 22961(2.3%) 六十七点四 13.3%
落叶 17219(1.7%) 六十八点二 14.7%
选择2 22194(2.2%) 七十四 24.7%
杰克尤伊 187057(18.7%) 七十一点四 25.3%
软盒 50554(5.1%) 七十三点八 25.3%
刺猬属 8825(0.9%) 七十五 25.9%
不足之处 27457(2.7%) 七十四点七 26.1%
JS 35028(3.5%) 七十五点六 28%
光滑的 39866(4%) 七十九点八 35.7%
指纹识别系统 8864(0.9%) 八十一点八 37.6%
JQuery 774058(77.4%) 六十四 43.3%
懒散的JS 15884(1.6%) 一百九十二点八 235.3%

前一百万个主页的绝大多数都使用jquery。使用jquery的主页比不使用jquery的主页平均多出19.2个错误。jquery的存在相当于近1500万个检测到的错误,或者超过我们检测到的所有可访问性错误的25%。使用jquery的页面更有可能出现可选文本和对比度错误,但更可能有空按钮(是原来的2.4倍)。缺少表单标签(几乎是表单标签的3倍)空链接(是非jquery页面的3.4倍)。有趣的是,使用jquery的页面识别文档语言的可能性是不使用jquery的页面的两倍。使用jquery的页面比其他页面(平均605个元素)复杂得多(平均844个元素)。

Web框架

Web框架 #主页的百分比 AVG误差的平方 %误差的减少/增加
微软ASP.NET 89444(8.9%) 五十二点七 12.6%
祖鲁基金会 25390(2.5%) 六十二点三 4.5%
密码点火器 5962(0.6%) 六十三点一 5.9%
引导程序 223165(22.3%) 六十四点三 10.3%
动画动画 51423(5.1%) 六十七 13.1%
拉韦尔 6285(0.6%) 七十五点八 27.3%

与不使用引导程序的页面相比,使用流行引导程序框架的示例中的主页具有130万个可访问性错误。我们无法从这些数据中知道引导程序是否引入了这些错误,但是,当存在引导时,错误会增加,这是一个很强的对应关系。

广告网络

广告网络 #主页的百分比 AVG误差的平方 %误差的减少/增加
顺从 12291(1.2%) 六十五点八 10.5%
附属物 16192(1.6%) 九十二点一 55.8%
氰化物 5514(0.6%) 九十二点八 56%
克里蒂奥 21468(2.1%) 九十三点一 58%
投标前 18682(1.9%) 九十四点四 60%
双击 66918(6.7%) 九十六点二 68.6%
谷歌广告 125462(12.5%) 一百点九 87.8%
维格林 8466(0.8%) 一百二十八点一 116.8%

使用这些流行广告系统的页面平均比没有使用的页面有更多的错误。使用非常常见的Google Adsense系统的主页平均有47.2个错误,将近两倍,比其他页面多!

其他技术

其他常见技术也会导致页面出现更多错误。有recaptcha的页面平均比没有的页面多出14.9个错误。使用谷歌地图的网页平均还有13.9个错误,那些使用php的用户平均多出7.6个错误,而那些拥有Java的人平均会有4.7以上的错误。

有趣的事实

关于这项研究,还有几个有趣的事实: