如果您曾经为一个网站或应用程序构建过信息架构,那么您可能遇到过一些有点棘手的问题。也许他们有几个天然的家(polyhierarchy)或者合身松散归入一个类别。您可能想知道如何处理这种情况,问自己是否应该为这些奇怪的项目创建一些特定的子类别,或只是把它们放在它们的类别中属于。您甚至可能已经考虑过您的分类需要多么“严格”或“合乎逻辑”。

超级菜单从自行车电子商务网站具有两个服务零件和自行车挡泥板类别。都是用红线圈起的部分。
行星自行车有一个单独的类别服务部分例如,更换的自行车挡泥板(用来固定自行车挡泥板的金属“臂”)在那里,而不在自行车挡泥板类别。不幸的是,这个名字服务部分较低 信息的气味 这使得这些零件很难找到。

信息架构师经常纠结于:要归属于同一类别,需要有多相似;反之,要分开,需要有多不同。

卡片排序显示出乎意料的分组

卡片分类是信息体系结构项目常用的研究方法。它要求用户将物品(卡片)分类成对他们有意义的堆。其思想是,如果大部分人将一个对象分配到同一堆(或类别),那么在最终的信息体系结构中,该对象可以安全地放在该类别中。

分析卡片分类数据通常是具有挑战性的。首先,参与者之间的差异很大。

第二,我们通常会离群值卡——这并不完全符合用户普遍认同的模式。

通常情况下,卡片排序指示了一个与异常值不太相关的类别——但与该类别中的其他项目相比,对该类别的分配相对较弱。(换句话说,一些参与者可能已经投票将离群值分配给了该类别,但没有分配给该类别中其他项目的那么多。)在这种情况下,信息架构师需要决定离群值是否应该属于(1)与它们关联较弱的主类别(可能是它们自己的专用子类别),还是(2)属于它们自己的完全独立的类别(或两者都属于)。

一个面向公民的欧盟生活网站的卡片分类树形图显示,基于高参与率(71%),6张绿卡属于一个与教育相关的类别。
一个面向公民的欧盟生活网站的卡片分类树形图显示,基于高参与率(71%),6张绿卡属于一个与教育相关的类别。
然而,在同样的卡片分类和同样的绿色教育类别中,我们看到三个一致性得分较低的异常值(与前面截图中的强大核心组相比):研究人员的补助金和工作(25%),边学习边工作(54%),大学费用和财政援助(64%)。信息架构师需要在这里做出一个关键的决定:这三个链接应该放在主要的Education类别中,还是属于与财政支持相关的单独子类别中?
但是在相同的卡片排序和相同的绿色教育类别中,我们看到三个异常值较低的协议得分(与前一张截图中的强核心组相比):研究人员的补助金和工作(25%),边学习边工作(54%),大学费用和经济援助(64%)。信息架构师需要在这里做出一个关键的决定:这三个链接是否应该进入主链接教育类别或他们属于一个单独的子类别与财政支持?

有时,这是一个问题,是否只创建一个或两个项目的子类别,与其他项目有一点不同。在其他情况下,我们会发现我们的研究参与者收集了非常令人惊讶的东西,这些东西根本不符合我们的期望。

29%的研究参与者将动植物和其他主要与文化和户外景点有关的项目放在一起。
29%的研究参与者表示植物和动物在一组中,其他项目大多与文化和户外景点有关。

这里的信息架构师必须做出与教育示例中略有不同的决定:因为植物和动物在概念上与这一组的其他项目(与旅游和文化景点有关)略有不同,选择变成:

  • 把所有这些项目放在一个类别中(例如,要做的事情,访问欧盟),希望对当地动植物感兴趣的人可以在这里找到相关信息。
  • 有相同的包罗万象的大类(比如事情要做),但
    • 将内容分成子类别文化户外,
    • 把大部分的东西都放在主目录里植物和动物成一个子类。
  • 有一个单一的顶级类别文化还有一个单独的在户外
  • 把不同类别的东西分类(一种轻层次结构)。

那么,信息架构师应该做什么呢?

分类理论:人类(严格地)不是理性的

当弄清楚如何处理类别异常值时,有必要回顾并理解人们将事物组合在一起时会发生什么。

首先,请允许我纠正大家的普遍假设,即人们在类别之间形成牢固的、逻辑的界限,而这些界限是由公共属性把所有的东西放在一起。这种隐含的假设是合乎逻辑的;然而,这不是真的。(我不是在这里讨论科学、法律等领域中出现的正式分类和定义设置,而是我们的用户在他们的产品中所依赖的直觉分类心智模式.)

例如,什么构成了科幻小说?就像它的名字所暗示的那样,它与科学有关吗?很明显,它不是基于科学——《星球大战》虽然很有趣,但不断打破我们已知的物理规则。故事设定在未来吗?《太空堡垒卡拉狄加》是一个很好的反例(就这点而言,《星球大战》也是)。太空吗?不,北k·杰米辛的《破碎的地球》三部曲打破了这种假设。等等。

那么,人们是如何形成分类的呢?语言学家和认知科学家已经形成了围绕概念的模型家族相似性.家庭成员当然有一些共同的特征(面部特征,好恶等),但并不是所有家庭成员都有相同的特征。家族相似性是逐渐形成的,家族成员的每个共同特征都有一个固有的谱,而不是二元的是/不是。

此外,人们经常向一个类别添加新项目并扩展其边界,即使这些新项目与其他已建立的类别成员不同。最著名的是游戏当20世纪70年代电子游戏首次出现时,它的界限发生了巨大的变化。因此,一个类别的成员不必都有一个单一的、固定的共享特征集。

另一个重要的概念是中央和偏心的类成员。人们认为某些类别的成员在整个类别中比其他人更有代表性。如果我想教一个外星人汽车是什么,我给他们看了一张教皇专车的照片,你可能会笑我不是一个很好的老师。但你几乎肯定会同意,教皇的专车是一辆汽车——然而,是一辆奇怪的、非典型的汽车。非中心类别成员仍然相对容易识别为所属类别的成员,但不像同一类别的其他中心成员那样容易识别。这是关键的区别——非中心类别的成员仍然可以属于这个类别,即使他们不是最好的例子。

这是一张教皇专车的照片,这是一辆为了能看到教皇而抬高的车,但仍然受到保护
教皇的专车显然是一辆汽车,尽管它是一个不寻常的例子。教皇的专车是这一类的非中心成员汽车但大多数人还是很容易认出它是一辆车。

有趣的是,仅仅因为某物是非中心类别成员从概念上讲例如,在2020年的美国,最畅销的汽车是福特f系列皮卡。皮卡不是概念类别的中心类别成员但福特的销量超过了丰田凯美瑞(Camry),后者是这个类别中相当重要的一员几乎任何人的直觉)91%!

那么,让我们回到如何处理信息架构中的异常值问题。我们将从定性的角度做出这些决定——什么才是最合理的,而不是过于担心从卡片分类中获得的百分比差异。同样重要的是,我们的决策在很大程度上受到业务优先级的影响。如果概念上可能存在于层次结构中更深层次的东西对业务或用户很重要,我们可能会选择将其提升到层次结构中的更高层次,以增加其可见性。

方法1:在导航中的子类别中放置离群值

一种方法是创建一个更具体的子类别,专门用于我们确定的异常值。这种方法的优点是人们非常的求知具体的条目可以过滤掉他们需要考虑的条目列表。

在本例中,我们将非中心类别成员从组的其他成员中隔离出来。当离群值与更大的类别具有相对较低的家族相似性时,这种方法最有意义。包括它们将迫使我们使用一个更通用的类别名称,低信息气味。回到之前的欧盟访问者网站的例子,如果我们植物和动物并将其与文化和历史景点放在同一个主要类别中,我们可能需要使用像这样的名字事情要做,它的信息气味比文化

除了降低父类别的信息气味外,这种方法的另一个缺点是它可能导致深度信息架构,有许多子类别供用户考虑(其中一些类别可能涉及大多数人不熟悉的区别)。一般来说,较深的层次结构比浅层的层次结构更具有挑战性,而特定的子类别比之前描述的基本类别需要更高程度的认知努力。

此外,这些特定的子类别最终可能只包含几项内容——这不是世界末日,但也不是强大内容策略的一部分。

office echairsusa在其座位类别中有许多具体的子类别;其中一些只提供少数几种产品。这个分类列表可能会让不熟悉办公椅细节的用户感到困惑。
OfficeChairsUSA有许多具体的子类别在其座位类别;其中一些只提供少数几种产品。这个分类列表可能会让不熟悉办公椅细节的用户感到困惑。

方法2:在主要类别中保留离群值,并通过元数据支持替代寻找行为

作为一种替代方法,您可以将那些离群的类别成员留在稍大一些的类别中,而它们通常是这个类别的一部分。当异常值的数量相对较少,并且它们与主要类别成员的家族相似性非常接近时,这种方法是有意义的。

以下是为什么这种方法在大多数情况下是合理的:

  • 如上所述,使用者的心理类别界限不是严格的,而是基于家族相似性的程度。因此,他们仍然有一个很好的机会来定位更大类别中的异常值。
  • 因为这些异常值将被托管在更大、更异构的父类别中,它们将更容易被发现(也就是说,那些没有寻找这些选项的用户可能会在解析类别列表时偶然发现它们)。
  • 您可以使用替代路径来获取这些离群值(例如,使用概念的后端分类的健壮搜索,可以进入一个更结构化的类别层次结构),以支持那些不会在其宿主类别中寻找这些离群值的用户。
Williams-Sonoma包括厨房用具类别中的勺座等配件。虽然勺状支架可能是这个类别中的异类,但它仍然是一个合理的位置。即使可以为厨房用具创建一个Utensil Accessories子类别,这种特异性水平很可能会增加不必要的交互成本(寻找并解析子类别)和不必要的认知负荷(由于此类类别标签的低信息气味-到底什么才算“器具配件”?)
Williams-Sonoma包括附件,如勺子休息在厨房用具类别。虽然勺状支架可能是这个类别中的异类,但它仍然是一个合理的位置。即使一个用具配件子类别可以创建厨房用具,这种程度的特异性可能会增加不必要的交互成本(找到子类别并解析它)和不必要的认知负荷(由于此类类别标签的低信息气味——究竟什么才算“器具附件”?)
此外,Williams Sonoma支持搜索与汤匙架同义的术语(例如,汤匙架,木制汤匙架,炉灶汤匙架)。
此外,Williams Sonoma支持搜索同义词勺子休息(例如,勺架,木勺架,炉灶勺架).

方法3:在两个级别的Polyhierarchy

使用前两种技术通常都可以很好地支持离群值——也就是说,将离群值放到它们自己的子类别中在主要类别中。这种技术与为离群值创建一个新的子类别有相同的主要限制——你可能最终会得到许多人口稀少、模糊的子类别。

麦考瑞大学的研究伦理分部有多个内容重叠严重的子类别,如研究诚信、研究伦理、研究政策和研究安全与保障。子类别和主要的道德、诚信和政策部分之间的过度重叠可能会给用户带来过度的负担,因为他们试图弄清什么是什么。
麦考瑞大学的研究伦理学分部有多个子类别,内容重叠严重,例如研究诚信、研究伦理、研究政策和研究安全保障。子类别和主类别之间的过度重叠道德、正直和政策当用户试图弄清什么是什么时,部分可能会给他们带来过度的负担。

总结

在信息体系结构中,类别离群值可以用多种方式处理。创建单独的、特定的子类别来容纳它们通常会导致用户不熟悉的一堆稀疏的子类别。在大多数情况下,我们建议将异常值保留在更大的类别中,并使用额外的可查找性工具帮助用户,如搜索或在上雕琢平面的导航。

参考文献

罗杰·布朗。1958。一件事该怎么称呼?心理评估65:14-21

George Lakoff》1987。女人、火和危险的事物:什么类别揭示了关于心灵的东西芝加哥大学出版社,伦敦。

Elanor罗斯奇1975语义范畴的认知表征。实验心理学杂志,104,192-233