菜单 关闭

异常值和用户性能的运气

通过 雅各布·尼尔森3月6日,二千零六

总结:6%的任务尝试非常缓慢,并且构成了测量用户性能的异常值。这些可悲的事件是由设计师可以而且应该消除的坏运气造成的。manbetx官方网站手机版


一般来说,我提倡定性的用户测试:A少数用户就足够了发现大多数设计缺陷。manbetx官方网站手机版定量测试有它的位置,然而,我们最近一直在进行大型测试,原因有两个:

  • 我们正在测试数百个用户,以便为我们的眼睛跟踪研究.为了确定男性和女性对网页的看法是否不同,例如,我们必须测试许多使用相同网站的人。这是因为用户到处乱跑,我们需要测试无数的男人和女人,为每一页获得足够数量的样本。
  • 我们正在为几个客户运行大规模的可用性基准,以便他们能够随着时间的推移跟踪他们的设计改进。manbetx官方网站手机版这些研究非常昂贵,不推荐用于小型项目。对于大型项目,然而,它们是一个很好的长期管理工具。

有了这些新数据,我可以随意使用,我忍不住分析了1520个网站和内部网的用户任务执行时间测量值。

可用性服从正态分布吗?

几乎所有的统计分析都假设数据遵循正态分布(著名的钟形曲线)。大多数人相信这一点,因为很多现象都是如此。但是让我们检查一下。

评估数据集分布的一种方法是绘制分位数散点图。在QQ情节中,我们将每个观测的经验值绘制在X-轴及其假设值Y轴,假设整个集合是正态分布的。我们画一条直线来表示一个具有相同经验值和假设值的案例。

如果我们绘制的数据点非常接近直线,我们得出结论,经验值与假设值非常接近。换言之,观测数据与理论预测一致,所以数据集遵循正态分布。

任何远离直线的数据点都代表了现实世界和理论世界有本质区别的情况——换句话说,数据不服从正态分布。

我从我们最近的定量可用性研究中绘制了70个QQ图,它们看起来都一样,无论是来自网站还是内部网的研究。以下是两个典型示例:

两个散点图,显示了用户在x轴上的经验性能和y轴上正态分布的相应分位数。
两种用户研究的QQ图:基于内容的杂志网站测试(纽约杂志,以及基于交易的电子商务网站的测试(Kiehl,在右边)。
每个点代表一个用户的任务时间。X轴表示测量的性能,Y轴表示理论上匹配的正态分布。

(注意:因为我的分析不包括在任务中失败的用户,图表只显示成功使用站点的人员。所有70项研究都衡量了任务完成的时间——见前面关于可用性定义其他主要质量属性。)

虽然这些点并不完全在直线上,他们很接近。有一些异常值,但可以肯定的是用户确实遵循正态分布.离政府工作足够近-或更接近重点,对于实际开发项目中需要的任何分析都足够接近。

快速性能的异常值

每个QQ图左下角的离群值显示为实数。蓝点.这些用户很快,但没有理论预测的那么快.事实上,在左侧QQ图中,下面有两个点X轴,表示否定Y价值观。理论预测这两个用户在开始之前就已经完成了他们的任务,这显然是不可能的。

在可用性测试中,对于测量的任务时间有一个明确的底线效应:人们不能比某个最小值更快,不管他们如何高效地使用一个网站。下载页面和在鼠标和键盘之间移动您的手需要一定的时间。即使是最快的打字员也需要时间输入搜索引擎查询;最快的读者仍然需要时间来阅读,不管他们能多快地在页面上找到显著的信息。

我分析的所有研究都包括一些快速异常值。这些快速(但速度不够快)的用户很容易解释,然而,我认为它们不应该影响我们对网络可用性的思考。

低性能异常值

右上角的离群值显示为实数红点.这些用户比最慢的预测用户慢得多.

1520例,87个是异常值,任务时间非常慢。这意味着6%的用户是慢异常值.这是太多人忽视。当然,首先,你应该改善94%的非离群用户的用户体验,但也值得将一些可用性资源分配到6%的速度。

对这些离群值最明显的解释就是,有几个人几乎不擅长使用网络,每次测试时,它们都会显示为慢异常值。但这个假设是错误的.一旦我们招募人进行研究,我们要求他们做很多事情,所以我们知道慢异常值是如何执行其他几个任务的。一般来说,在某些任务上速度极慢的同一用户在其他任务上速度极快。

有60个不同的用户负责87个慢异常值,平均每个异常值为1.5。考虑到用户在整个分析研究中平均接受了6.7个任务的测试,这些用户平均有5.2个“正常”任务,是他们的外围任务的3.5倍。

这个话题显然需要更多的研究,并能写出好几篇毕业论文。现在,我最好的结论是慢异常值是由坏运气引起的。而不是由相关用户的持久属性。

祝用户性能好运

在倒霉之前,让我们承认网络上也有好运。人们有时在一个网站上“不受欢迎地”走运,只需比预期更少的点击就能得到他们想要的东西。也许吧,例如,他们想买些恰好是当天主页特色促销活动的东西。在其他情况下,有些用户乐于回避那些会给其他人带来严重困难和挫折的严重可用性错误。

以下是一个来自测试禁用的用户尝试使用美国国税局的网站税务机关)。一位盲人用户想知道她是否可以扣除捐赠给高中乐队的钱。

因为美国国税局的页面很长而且很强大,用户决定让她的屏幕阅读器设备读取页面上的链接列表。此外,因为用户在寻找有关“捐赠”的税收规则,她命令屏幕阅读器阅读以“D”开头的链接。美国国税局使用的是“扣除”一词而不是“捐赠”,这是用户在使用“捐赠”一词的简单页面或网站搜索中永远不会发现的。因为这两个词都以“d”开头,而这个人使用的是屏幕阅读器,她很容易就把“演绎”作为正确的联系。一个快乐的结果,但纯粹是因为运气好。

(这里有一些附加的可用性注释。第一,通过使用术语“演绎”而不是“捐赠”,网站选择面向系统的语言来描述用户的行为。据推测该网站应该支持。第二,使用屏幕阅读器快捷方式是一种专家行为;你不应该把它作为长页的借口,这伤害了经验不足的屏幕阅读器用户。最后,“读取链接”功能是避免使用标签(如“单击此处”或“更多”)链接的指导原则之一,这些标签在上下文中没有意义。)

用户性能不佳

大多数网站和内部网用户都太熟悉坏运气了。典型示例包括:

  • 点击错误的链接永远迷失在错误的地方。
  • 使用错误的词.与上面的“好运”例子相比,用户可以浪费大量的时间来搜索一个站点,而不是用它自己的首选术语。
  • 公司与多个网站经常让用户转到错误的站点,但是用户没有意识到这个错误。
  • 用户需要的链接或信息刚刚从屏幕上滚动所以用户永远不会看到它。(我讨论了其他滚动问题,包括最近关于在哪些条件下滚动多少用户的调查结果,在我的研讨会上Web可用性的基本准则
  • 弹出窗口分散用户注意力就在他们要把事情做好的时候。
  • 注册打嗝让用户绕道走足够长的时间,他们购买东西的尝试注定要失败,即使他们成功地找到了他们想要的,并把它安全地放在购物车里。
  • 多个小问题-其中任何一个都可以很容易地被孤立地处理——连续发生,从而使用户脱轨。

当然,这些问题中没有一个是真正的“运气”,在某种“不自然”的事情发生的迷信意义上。事实上,它们都很小,但设计的可用性存在真正的缺陷。manbetx官方网站手机版把这些缺点定性为坏运气的是,在极少数情况下,他们谴责用户的不幸。如果事情有点不一样-比如,一个用户进一步向下滚动了一行-他或她可能会有好运和非常愉快的用户体验。

鉴于慢异常值占Web使用量的6%,简单地把它们注销是不可接受的。尽管数据显示,大多数用户在下一个在线任务中都会避免倒霉,你不能只说“下次好运”;如果你这样做了,他们的下一次用户体验可能会出现在其他人的网站上。

人们离开网站伤害他们-他们不知道这只是运气不好,下次会更好。因此,你有责任找出坏运气的根源,并从你的网站上根除它们。