这篇文章是一个跟进树测试第1部分:菜单标签和类别的快速,迭代评估

树测试评估类别和标签信息架构。我们最近解释了这个过程设计树形测试;一旦你计划好了你的学习,下一步就是收集数据并解释结果。不像自言自语可用性测试,大多数树测试作为未拨出的研究运行并仅产生定量结果。此方法允许您快速收集来自大量用户的数据,但需要一种不同的方法来提取洞察力。您不能只坐在一天的测试和击退记录中,而是需要进行系统分析以识别数据趋势并评估其意义。

收集数据

学习参与者。就像可用性测试一样,必须有一个好的树测试研究招募代表用户作为研究参与者,特别是对于具有专门的目标受众的产品。不要招募大学生来测试一个关于人寿保险的网站。

由于树测试允许您轻松收集来自一大群用户的数据,旨在至少50个用户,允许用户行为中的趋势出现并最大限度地减少提供劣质数据的任何未受驱动的参与者的影响。如果您计划测试两棵树木并比较他们的性能,您将需要两倍的参与者,因为比较需要受试者之间的研究设计(即,不同的人测试每个版本)。

每个参与者任务。确保每个参与者执行只要10个任务(或更少)。尽管树木测试任务可以快速完成,但让人们连续执行30个任务仍然不是一个好主意。一旦有人点击了相同的菜单15次,它们就会与刚刚登陆网站的普通用户一样,他们完全从未见过菜单。如果您需要测试超过10个任务,请招募更多用户,并使用树测试工具的随机化功能为每个参与者分配10个任务。

飞行员考试最后,邀请少数用户完成学习并在将其发送到整个组之前审核他们的回复。试点测试可以通过您的任务措辞提前泄露任何意外问题以纠正它们。

树测试指标

一旦结果存在,各种指标都会捕获用户如何理解(或误解)您的类别。TreejackUserzoom.,两个最常见的树木测试工具,每个都使用略有不同的风格来呈现这些指标,但两者都为您的研究中的每个任务提供了这些定量措施:

成功率:找到该任务的正确类别的用户的百分比

直率:立即前往正确类别的用户的百分比,而无需回溯或尝试任何其他类别

时间:从任务开始到结束时所经过的平均时间量

路径措施:

  • 每个类别的选择频率
  • 首先点击:大多数人首先选择的类别
  • 目的地:这是大多数人指定的最终答案

根据研究中的树和任务的类型,这些指标中的一些可能比其他指标更有用,预测信息架构在现实生活中的表现如何。

成功率

为了计算成功率,您必须为每个任务分配至少一个“正确”答案。该任务的成功率表示在树中找到正确位置的用户的百分比,并将其标识为完成该任务的正确位置。任何选定其他最终位置的试验都被报告为失败。例如,如果被要求查找有关新墨西哥州库的信息,则为100个参与者中的67个选定了正确的位置,该任务的成功率为67%。

树测试任务的示例成功率
树测试工具计算每个任务的成功率,为其定义“正确”答案。Userzoom的此屏幕截图表示67%的用户为任务找到了正确的位置您在哪里可以找到新墨西哥州图书馆的指示和时间

表面上看,成功率似乎很简单:越高越好。但是要基于这个度量标准采取行动,首先需要一个适当的参考框架来确定对于整个树和特定任务来说“好的”成功率是多少。

请记住,通过其本质,树测试消除了许多有用的设计元素,例如搜索功能,辅助导航选项(如相关链接)以及来自视觉设计或内容的任何上下文提示。用户只看到剥离的导航菜单本身。

在树测试中显示的用户界面示例
树测试显示参与者只有类别标签的任务说明和剥离菜单,因为您可以从Userzoom树测试中看到此任务。用户无法访问搜索功能,内容,布局,下拉菜单,或任何其他上下文来帮助解释菜单选项。

由于树测试是如此基本的,成功率通常远低于定期定量可用性研究。树测试的67%的成功率可以很容易地成为最终设计的90%成功率。(但是,只有当该设计的其余部分执行很好地执行这种增加,才会发生这种情况;一个糟糕的搜索实施或设计不良的菜单也可以降低树木测试中观察到的水平以下的成功率。)

而不是预计实现100%的成功率,而是使用更现实的参考框架来评估每个任务的成功率是可接受的,考虑到:

  • 该任务对整体用户体验的重要性
  • 与其他类似任务(例如,在层次结构中以相同级别为目标内容的任务)相比,每个任务的成功率如何

例如,考虑下表中的两项任务及其各自的成功率。食品邮票任务的成功率远低于其他任务,但此结果部分是部分原因,因为用户必须钻取三个更多级别以找到正确的答案。

任务 正确答案(s) 成功率
你在哪里
找到方向
和小时
为了新墨西哥
国家图书馆?

公民

>教育

>库

新墨西哥州>图书馆

67%
找到规则
确定
谁有资格
对于食品券
在新墨西哥州。

公民

>健康和健康

>一般的健康和福利

>人类服务部门

>寻找帮助

>粮食援助

>补充营养援助计划

43%

比较这两个成功率,而不是比较这两个成功率,而不是比较:

  • 食品券任务的成功率与另一任务的成功率相比,该任务的目标内容也在6层以下;或
  • 食品券的成功率在两种不同的树木上进行了不同的标签 - 其中使用该术语的树木粮食援助还有一项食品券。

指导和时间

除了衡量有多少用户到达正确的地方,还有重要的是考虑他们在途中挣扎多少。两个常见的树木测试指标信号:时间,这表示用户找到正确答案需要多长时间,并且直接,它记录有多少用户立即找到了正确的答案,而无需回溯或更改类别。直接导航有时也被称为“快乐之路”,因为它意味着顺畅的互动,最少的混乱或弯路。

如果用户在最终找到正确答案之前必须追溯他们的步骤并尝试多个地方,那么高成功率的任务仍然可能是糟糕的用户体验。例如,考虑一下这个关于学费成本的任务。即使有74个用户最终找到了正确的答案,但只有50%的人选择了直接途径。半数成功的用户在定位之前必须至少返回一次他们的步骤——尽管这些信息实际上在树中的3个不同位置都是可用的。

示例树测试结果显示成功率和直接性
这项任务由TreeJack研究结果表明,即使所有用户的74%都在找到学费金额时,也是那些人的一半人拍摄了间接路径,不得不至少回避一次。

所花费的时间和直接程度都表明了一项任务对用户来说有多容易。对于经常由新手或临时用户完成的任务,直接性尤其重要,因为他们无法从过去的经验中学习和记住位置。

路径:首先点击到达最终目的地

成功率和指导告诉你类别是否可找到;详细的路径分析可以帮助你弄清楚如何改善类别这不起作用。

第一次点击任务是分类用户首先选择它们开始该任务时。在树测试中,第一次单击始终是顶级类别,因为在选择父类别之前,否都不会看到子类别。

第一次单击至关重要,因为它通常预测用户最终将成功找到合适的项目。想象一下,您正在寻找购物中心的食品法院。如果食品法院在顶级,而且您首先取得自动扶梯,您可以随时发现它的机会苗条。但是,如果你开始进入正确的水平,那么你的机会就可以徘徊一点并找到它,如果只有食物的味道。

第一次单击的操作方式与此相同。一旦用户接近正确的分类,上下文提示和本地导航会使他们更有可能找到它。但不正确的第一次点击往往是灾难性的;下表显示了成功率只有20%的任务的首次点击数据。正确的顶级类别,目录,只收到了第一个点击次数的14%。相反,用户开始了程序学校部分,最终徘徊在这些区域周围,从未恢复过来目录

只有14%的用户点击了目录作为他们寻找环境法教授名单的第一选择;这导致了在这个树杰克研究中任务的整体成功率只有20%。

仔细检查第一个单击数据时:

  • 任务的成功率和/或直接性低。第一次点击表明用户最初期望找到该信息的用户,以及建议应移动项目的位置(或至少交叉)。
  • 最终设计将使用大型的菜单同时暴露2n和3.理查德·道金斯级别类别一目了然。同时查看和比较多个子级别的能力可以大大提高成功率,比在树形测试中观察到的要高——但这只有在第一次单击成功且用户找到了正确的超级菜单时才有效。

如果您有许多任务,首先单击跨多个类别分发,则可能有太多重叠类别。执行卡片排序,或再次查看树测试结果并查找其他可能的组织方案。

检查最终目的地用户在第一次单击时选择正确,但成功率很低。这种模式表明较低级别的类别重叠太多。

示例任务结果显示选择每个位置作为最终目的地的用户的百分比
首先点击和最终目的地,了解有关艺术节的信息;所有用户都正确单击娱乐类别,但选择了35%艺术与文化作为他们的最终目的地,而22%选择探索魅力的土地。只有30%正确选择新墨西哥发生了什么。此结果表明,这些兄弟子类别与用户的适当目的地重叠过多,其中任何一个都将其视为适当的目的地。

将数据转化为行动

虽然树测试产生定量数据,但结论绝不是黑白的。任务成功率只是第一步,必须在努力努力获得正确答案的情况下(直接性)以及他们预期正确答案(首次点击)的背景下解释。

一旦分析完成,您就可以确定适当的解决方案。例如:

  • 当第一次点击均匀分布在多个区域中时,列出多个类别的主题。如果许多任务发生此问题,请考虑更改整体组织方案。
  • 当成功率低但首先点击正确时,将子类别的标签更改为更明显的。

了解有关我们全天课程中的选择组织方案和标签的更多信息信息架构