重叠的信息类别和令人困惑的标签是网站设计中最普遍存在的两个问题。幸运的是,有快速有效的技术您可以使用它来创建对您的受众有意义的类别和标签。

最著名的技巧可能是卡片分类,其中用户将代表内容项列表给出组和标签,因为它们认为合适。卡排序对于了解您的观众思考,但它不一定会产生应遵循的确切分类方案。例如,卡片中的参与者通常会创建一个通用类别以容纳一些似乎不适合其他任何物品的物品;这是可以理解的,但如果您在菜单中实际包含“其他东西”类别,同样的用户将避免像瘟疫一样。(网站游客令人惊奇地愿意点击模糊的标签,因为他们非常怀疑他们必须做大量的工作来筛选内容。)

为获得最佳结果,应通过树测试跟踪卡排序以评估所提出的菜单结构。

定义:树的测试通过让用户在树中找到可以完成特定任务的位置,对层次类别结构或树进行评估。

树测试非常有用作为卡片排序的后续,因为它:

  • 根据其在真实情景中的执行方式评估层次结构,使用类似于可用性测试的任务;和
  • 可以在设计页面布局或导航菜单之前很好地执行,允许对菜单类别和标签进行廉价的探索和优化。

要进行树测试,您不需要绘制任何线框或写入任何内容。你只需要准备两件事:或层次菜单,以及任务,或者说明研究参与者应该尝试寻找什么。

定义了树

您的树应该是所有主要内容类别的完整列表,以及所有子类别。即使您有兴趣仅对树的特定部分进行测试,除了其他部分是否存在风险,因为它假定用户将知道要哪个部分转到。例如,如果您的网站有一个产品A.服务,而您选择只测试产品树,你会错过发现你的观众是否了解这两类之间的差异。

根据您最感兴趣的层次结构的哪个部分,您的树可能需要有3、4,甚至5层的深度。包括到您想要测试的子类别的最低级别的完整深度。每个子类别应该提供该领域所有选项的完整列表,以便从用户那里引出真实的行为。用户通常通过将链接标签与附近的替代品进行比较来评估链接标签。例如,对历史记录感兴趣的用户可能会尝试标记为“历史”的类别文化- - - - - -但如果还有一个选择历史资源。

竞争性树测试:标签与位置

如果您正在考虑为同一树类别使用不同的标签,那么您可能希望测试两个不同的树,以便比较术语的执行情况。这样的测试特别容易做Userzoom该工具允许您随机分配参与者到树的不同版本,其方式类似于anA / B测试在一个现场网站上。如果要测试多个树,请避免在与第二棵树交互时相同的会话中显示相同的用户的两个替代树,这将由其与第一个树进行偏移。

如果您只是想比较不同的树,则不需要准备和测试一个单独的树地点对于标签——例如是否西红柿应置于水果要么蔬菜。您可以测试单个树并比较有多少用户单击,而不是为每个位置测试两个不同的树水果vs.点击了多少蔬菜。(如果他们点击两者,你也能够讲述他们首先尝试的类别。)

准备测试:工具和格式

您可以使用纸张原型(或任何可点击的原型工具)进行树测试,但专门为树测试设计的服务将大大加快分析结果的过程,并非常值得。UserzoomTreejack都是进行树测试的好选择。

在电子表格中准备您的树,在电子表格中您可以轻松地可视化和编辑它,然后简单地复制并粘贴整个层次结构到您的树测试工具中。电子表格的格式应该是你的主页在A栏的顶部单元格,然后从左到右列出较低的层次。确保每一行只列出一个类别,以便在导入层次结构时能够正确解析级别。

包含菜单树的电子表格的屏幕截图
此电子表格显示新墨西哥州政府网站的树木或菜单层次结构。每个类别都显示在一个单独的行上,子类别放在包含它们的父类别右侧的列中。

将层次结构粘贴到测试工具后,类别将被解析并用于自动创建一个可单击的菜单层次结构,其中每个类别都可以展开以显示相应的子类别。

在OptimalWorkshop的Treejack测试工具中创建的树的截图
树测试工具如Treejack,如上图所示,将自动解析你的电子表格层次结构到一个可点击菜单的类别和子类别。

树测试任务

您要求用户完成的任务与树本身同样重要。首先,您需要决定以哪些类别和标签为目标。理想情况下,你应该包括以下目标:

  • 主要网站目标和用户任务,比如找到最重要的产品(主要导航任务的成功率可以作为比较次要任务的基线,以及未来测试的参考点)。
  • 潜在的问题区域,例如卡片中的利益相关者或参与者提出的新类别

标签或位置比较-同一类别的任何替代标签或位置。对于你写的每个任务,你也应该定义正确的答案,对应于信息在树中的实际位置。此信息允许测试工具自动计算每个任务的成功率。

在Userzoom的树测试工具中为任务标记正确位置的示例
来自Userzoom树测试系统的此屏幕用于指示特定任务的正确答案是哪个类别。

任务措辞

每个任务都应该通过要求用户查找包含在该类别中的内容来测试一个类别标签。与可用性测试任务一样,树测试任务说明应该避免使用泄漏答案的术语。预防启动有时可以通过描述场景和动机来实现,但也要记住,用户可能不会仔细阅读说明,如果他们被一个冗长的故事所淹没,很容易错过重要的细节。

作为一个例子,这里有一些不同的措辞来评估创业新墨西哥州政府树的分类(如上所示):

  1. 查找有关启动业务的信息。
  2. 你明年就要搬到圣达菲去了,一旦到了那里,你就会想开一家提供草坪护理服务的副业来增加收入。找出你需要遵守的规则。
  3. 您正在考虑开设草坪护理服务。请参阅此站点上是否有任何资源,可以帮助您开始进程。

第一个例子通过使用确切的标签术语来赠送答案,创业;而第二个页面很长,而且充满了无关的词,用户在快速浏览时很容易把这些词误认为是主要内容。第三种选择既避免了标签术语,也避免了误导的细节。

树测试的局限性

树测试通常作为远程执行,未修改研究。后招聘代表用户,您只需将它们发送到学习的链接,并且测试工具通过使用自己的计算机完成任务的过程来浏览它们。测试工具比人类更好地保持轨道恰好究竟是哪个类别用户点击。

但是,此格式不会捕获用户行为的完整背景(例如在执行任务时进行的评论),并且您无法提出个性化的后续问题。

为了将版式的影响降到最低,起码要对几个版式进行缓和飞行员会话在收集大部分数据之前。在这些审核会话中,您可以确保任务措辞是可以理解的,并且还可以有机会接收可能在定量数据中难以发现的细微差别。例如,在最近的树测试中,我们注意到在飞行员测试中,许多用户避免了他们会话上半年的某个类别,因为标签如此广泛地宽阔,他们担心内容将是压倒性的。由于任务订单随机化,在定量结果中,这种趋势并不明显,但是当您完成每个会话并在用户忽略一个明显的选择后,它非常明显。仅凭洞察力一天都让飞行员测试得很好。

你还可以通过在树形测试之后做一个简短的调查来部分弥补你无法提出后续问题的缺陷。与其让用户回忆他们觉得容易混淆的标签,不如给他们提供一份标签列表,让他们检查哪些是难以理解的。这个问题可以用一个开放式的问题邀请用户分享任何进一步的评论和反馈,以引出可能从点击历史中看不到的意外假设或误解。

结论

树测试专注于评估类别标签。这既具有巨大的实力和显着的弱点。由于用户与视觉造型和内容完全互动的菜单,因此该体验显着不同于与完整设计进行交互。例如,设计大型的菜单提供了比在树测试中测试的浏览体验相当不同,因为它同时显示了几个子类别的内容。

然而,即使是这些固有的限制,也可以通过仔细的数据分析来克服或最小化——例如,通过关注用户是否选择了正确的顶级类别,而不是关注具有超级菜单的网站的成功率。

总的来说,与能够在设计过程的早期对信息层次结构进行迭代和评估的好处相比,这些限制是很小的代价。你可以创建一个全新的树来测试,只需编辑你的电子表格-完全不需要设计或编码。