Likert和语义差异是用户体验调查中常用的两种评分量表。他们常常感到困惑,因为他们之间的差异是微妙的。然而,他们以稍微不同的方式阐明了态度和偏好。

用户体验专业人士如何使用评分量表问题

我们经常使用评级尺度问题来衡量态度,看法,信仰,偏好和自我报告的行为。这些类型的问题允许不同程度的意见.

评分量表问题出现在各种研究方法中。评分量表问题最常见的应用当然是在调查中。然而,评分量表问题也经常在定量可用性测试中进行。从评分量表问题产生的态度数据有助于我们了解用户对我们的产品或服务的看法,以及他们是如何执行给定任务的。这些数据为我们提供了更丰富的总体用户体验。

利开特式量表

利克特量表利克乌特)是以心理学家伦西斯利克特命名的,他在20世纪30年代创立了利克特量表法。

利克特量表措施协议. 在Likert量表中,被调查者被问及他们对一组陈述的同意或不同意程度。在分析对相关问题的所有回答后得出总体立场。可用性评估问卷,比如系统可用性量表(SUS)和标准化的用户体验百分位等级问卷(SUPR-Q),使用李克特量表。(从技术上讲,一个关于自己的一个问题不是李克特量表,而是一个利用likert型响应格式的问题。一个问题被称为李克特项目。)

以下是SUS问卷中的三个问题:第一:我想我想经常使用这个系统,第二:我发现这个系统不必要的复杂。问题3:我觉得这个系统很容易使用。每个问题有5个选项:强烈同意、同意、不同意或不同意、不同意和强烈不同意。
系统可用性量表(SUS)问卷采用利克特式量表,每个项目有5个回答点。SUS要求受访者选择是否同意10种不同的说法。SUS问卷的问题1-3如上图所示。

李克特量表(和李克特型响应格式)容易受到两个响应偏差:

1)默许偏见
2)社会渴望偏见

  1. 默许偏差是人们同意他人观点的倾向。这种现象并不奇怪——毕竟,和蔼可亲是我们的天性。默许是因为参与者涂过底漆的通过他们必须同意或不同意的肯定(或否定)陈述。这种行为就是框架效应-当强调一种情况的积极(或消极)方面时,人们倾向于将整个情况视为积极(或消极)的。

回避这个问题的一个方法是用积极的措辞和消极的措辞交替表述。例如,SUS问卷在正面陈述和负面陈述之间交替(如上图所示)。然而,采取这种方法并非没有自身的困难。Sauro和Lewis(2011)发现,积极和消极措辞的交替会导致参与者(他们可能没有仔细阅读陈述,注意到这种交替)和研究人员(他们可能没有意识到对消极和积极问题的回答必须以不同的方式编码)之间的混淆。

  1. 社会可取性偏见是渴望报告其他人将有利地被视为的观点。当受访者感到有一个接受的立场时,他们更有可能与这种立场同意,担心分歧可能会对自己造成严重反映。(例如,如果人们认为政治正确性是被接受的立场,他们可能不愿意报告以这种观点的个人态度报告个人态度。)为了尽量减少这一偏见,不要要求受访者姓名或其他识别信息。研究人员发现,询问调查中的名称和其他标识符会增加社会可取性偏见。

语义差异

1957年,Osgood、Suci和Tannenbaum在书中提出了语义差异问题意义的衡量,并从此流行起来。

语义差异问题要求受访者评价他们的态度通过在双极形容度范围内选择一个位置. 音阶的两端有反义词形容词(例如,丑陋-美丽,容易-困难)。单一简易问题(SEQ)是语义差异规模的一个例子。SEQ呈现7分尺度,结尾标有末端非常简单分别是,非常困难.

显示了单个Ease问题,简称SEQ。问题是,“总体任务是:”并提出了7个未标记的选择选项。这些选项的两端用“非常容易”和“非常困难”括起来。
单一轻松问题(SEQ)是7点语义差异的一个例子。两极两端描述了给定任务的交互容易程度。

在语义差异的大多数应用中,可以沿连续uum选择的选项未标记,因为它们应该代表抽象点;然而,中间点的变化存在(例如,-3 - +3)或用诸如的单词标记非常,有些,也不也不.

虽然研究发现,人们发现与未标记的量表相比,更容易理解单词标记的量表,但很难找到合适的词来描述量表的中间点。

仅当满足两个假设时,从语义差异问题产生的数据是可靠的。这些是:

  1. 这对形容词是真正地双极.然而,可能并不总是能够找到一对两分的形容词。
  2. 这个受访者了解这对与它们之间的连续体之间的二分法。但是,由于规模未标记,因此每个选项可以在多个受访者中以不同的方式解释。

Likert与语义差异

尽管这两种评级尺度都考虑了意见的程度,但它们之间存在微妙的差异。回答语义差异比回答Likert量表问题需要更多的认知努力,因为被调查者必须抽象地思考他们的态度,以便选择一个选项,最明显的是因为量表上的点没有标记。然而,选择的认知灵活性意味着被调查者不会被某个特定的标签所束缚,这在李克特量表中是可能的。

下面的对比表突出了这两类问题之间的一些差异。

Likert项目 语义差异

获得的信息

同意或不同意陈述 受访者的观点在于两个对比形容词之间的连续内容
供选择的选项数 通常,5,但数字可以多达7或9 通常为7,但点数可能不同
选项的标签 每个选项都标有单词。(如果包含更多级别,则连续体可能没有完全标记,因为当有两个以上的协议选项时,很难总结协议的范围。) 标记两个极侧,但是通常未标记选项,或者仅用数字标记。
局限性 受默许偏差和社会期望偏差的影响

由于未标记选项,需要更高的认知需求来回答

获得的信息

Likert项目:同意或不同意陈述

语义差异:受访者的观点在于两个对比形容词之间的连续内容
供选择的选项数

Likert项目:通常,5,但数字可以多达7或9

语义差异:通常为7,但点数可能不同
比分点标签

Likert项目:每个选项都标有单词。(如果包含更多级别,则连续体可能没有完全标记,因为当有两个以上的协议选项时,很难总结协议的范围。)

语义差异:标记两个极侧,但是通常未标记选项,或者仅用数字标记。
局限性

Likert项目:受默许偏差和社会期望偏差的影响

语义差异:由于未标记选项,需要更高的认知需求来回答

在某些情况下,对于给定的研究问题,可以使用Likert项或语义差异。例如,如果我们想了解使用我们的网站有多令人满意,我们可以询问用户对该声明的同意或不同意程度:这个网站使用起来很满意. 我们还可以创建一个语义差异问题,该问题要求:使用网站的满意度如何?秤的极点包含“令人满意”的词语和“不满意”。这两个问题都有助于我们了解用户对我们网站易用性的看法。

然而,在有些情况下,很难或不可能使用语义差异。例如,考虑下面的陈述,这些陈述是在对用户体验从业者的调查中作为Likert量表呈现的。

  • 直到我们完成了我们的发现,我们才开始思考解决方案。
  • 在开始设计新功能,产品或服务之前,我们有时间做足够的发现工作。
  • 参与这项发现的团队都通力合作,共享工作。
  • 我们的发现是围绕我们的目标用户的用户研究。

在不改变我们尝试从受访者的信息类型的情况下将上述转换为语义差异是不可能的。

因此,总的来说,使用Likert类型回答格式的问题更灵活,并且有更多的应用程序。

在UX调查中使用评级尺度的提示

如果您正在考虑在调查中使用评级尺度,那么这里有一些提示。

  • 如果要评估接口的易用性,使用标准化的可用性问卷已被尝试和测试并经过心理测量测试,而不是创建自己的。
  • 如果你不确定使用哪种类型的评分量表,那就同时测试它们. 亲自做一个定性调查,以测试对问题和答案选项的理解。要求参与者大声思考当他们完成调查的时候。你也可以尝试两种版本的调查,并比较回答,以决定你应该使用Likert还是语义差异量表。考虑一下听众:人们会很难回答语义差异,还是会倾向于同意得太多?
  • 使用现有刻度标签使用Likert型响应格式设计问题时。坚持典型的措辞协议和分歧的方式(强烈地同意,同意,也不同意也不不同意,而不是重新发明轮子和创建新的响应选项。
  • 确保你的极性形容词是对立面在设计语义差异量表时。例如,选择公认的配对,如有趣的与。真无聊,而不是奇数对,例如凉爽的与。奇怪.在实现大规模定量调查之前,与用户有人测试以了解Word配对是否被视为双极。
  • 包括可选的文本字段,以便您可以获得更多的见解. 像这样的问题你为什么选择这个等级?收集了在规模上选择一个选项背后的思考过程。
  • 添加不适用选项对于那些可能不适用于所有受访者的问题。这个额外的选择可以让你从那些不相信这个问题与他们相关的被调查者中消除任何中立的被调查者的歧义。

结论

Likert和语义差异是用户体验研究中常用的两种评价量表。这两种方法都是经过尝试和测试的,用于衡量与产品和服务体验相关的意见程度;但是,它们的方式略有不同。选择适合你的研究目标的正确的评分方式,并注意两者的局限性和细微差别。

工具书类

李克特,r。(1932)。一种测量态度的技术。心理学档案馆,140,1-55。

OSGood,C.E.,SUCI,G.J.和Tannenbaum,P.H.(1957)。意义的衡量. 伊利诺伊大学出版社,伊利诺伊州乌尔巴纳。

Sauro,J.,Lewis,J.R.(2011)。在设计可用性问卷时,它是否有伤害?SIGCHI计算机系统中人为因素会议论文集(CHI'11). 2215–2224.