一个常见的问题,我在教学时得到用户访谈是我们UX会议上的一个全天课程我需要采访多少人?不幸的是,没有一个黄金数字。在本文中,我将强调一些有助于您做出决定的因素。

常见的误解

一些UX专业人士认为这方面的建议使用5个用户进行测试同样适用于基于面试的研究。事实上,对于许多探索性研究来说,5个参与者太少了.另一些人则被教导要每名员工招聘5人persona.,一个拇指的规则,以确保样品代表和足够大。但是,这条规则可能导致更多的面试,而不是必要的 - 特别是当你有5个或更多的人物。经验丰富的面试官可以从更小数的面试会议中提取深入的见解。

定量研究可以通过样本大小的计算来告诉我们招募有多少参与者为了自信地向更广泛的人群进行概括。但面试是一种定性研究方法。定性研究目的是详细了解人类的经验,而不是确定有多少人有一个特定的经验或表达一个特定的需求。(这是后续定量研究可以告诉我们的。)不可能知道完全有多少参与者就足以获得这种深入的理解。

饱和

在定性研究中,样品大小通常由该点决定饱和是达到了。

定义:在定性研究中,饱和是主题从研究中得出的结论已经足够充实,因此进行更多的访谈不会提供改变这些主题的新见解。

(根据思想学校,对饱和度略有不同的解释,但这超出了本文的范围。)

经过一定数量的采访后,回报会递减——关于研究主题的新信息很少。这就是达到饱和的点。

划线图显示了左下角,y轴和底部x轴的参与者数量的新洞察数。这条线首先急于加速,快速缩小。该线路开始锥度的图表被突出显示为饱和点。
随着更多参与者被添加到该研究中,有关学习主题,因此获得了更少的新见解。

招募用户进行可用性测试时,发生了相同的饱和现象。在建模从11项研究中发现的可用性问题时,Jakob Nielsen和Tom Landauer发现该测试5个人发现了85%的可用性问题在被测试的界面中,随着每个新的参与者加入到样本中,新的可用性问题越来越少。

然而,在基于访谈的研究中,我们希望了解人们的经验和需求,而不是在界面中发现问题。因此,由于我们所收集的信息种类具有更多的可变性,所以饱和点通常高于用户测试。因此,5次面试往往是不够的。

不幸的是,对于需要多少面试参与者才能达到饱和,学术研究人员并没有达成共识。例如,马克·梅森分析了2000多篇博士论文的摘要,这些论文利用了定性访谈,发现样本量从少到多,从少到多,从少到多。虽然样本中位数为31,但标准差较大:18.7。多年来,研究人员根据自己的经验提出了不同的样本量建议。这些建议从5条到50条不等。市场研究人员Abbie Griffin和John Hauser分析并建模了从他们关于便携食品携带设备的访谈中发现的客户需求数量,并估计20-30次访谈通过揭示所有客户需求的90-95%达到饱和。研究人员格雷格·盖斯特、亚文·邦斯和劳拉·约翰逊就性健康的话题对非洲妇女进行了60次采访,并进行了一次专题分析经过6组访谈。然后,在每一轮分析后,他们分析了新代码的数量和代码更改的数量。研究人员观察到,在36种高频信号中代码(导致主题的发展),在6份转录本之后添加了34份,在12份转录本之后添加了35份。此外,在分析了12份转录本后,尽管随后进行了访谈,但创建的代码仍然完整和稳定。这些发现让他们得出结论,在他们进行和分析了12次采访时,饱和已经发生了,但他们承认,如果他们对高层的总体主题感兴趣,6个样本对他们的项目就足够了。(如果这是一个UX项目,出于实际原因,我们会在6次面试后停止。尽管我们可能会错过一个主题和一些更深入的细节,但进行和编写额外采访所需的时间应该花在研究其他紧迫问题上。)

影响饱和度的两个大因素

你需要面试多少人来达到饱和取决于:

  • 您的研究目标的广度和范围
  • 研究人群的多样性

与小范围研究目标和同质研究人群的研究相比,一个非常具有探索性并以多样化研究人群为目标的研究项目将需要更多的访谈来达到饱和。例如,一项研究可能需要20-30人(或更多)的样本才能看到饱和度。这是因为人口非常多样化(从年轻人到老年人,从健康到疾病),研究的范围(获得医疗保健的经验)相当广泛。另一方面,观察研究II型糖尿病患者在接受治疗的经验可能需要只有5面试,因为它有一个较小的范围(接受治疗特定疾病)和更多的同质性研究人群(每个参与者患有相同疾病和将收到相同或非常相似的治疗)。

当然,还有一些额外的因素会影响饱和度。这些包括:

  • 面试官有多有经验:有经验的面试官可以通过问一些精心设计的探索性问题和后续问题来获得更多的见解可以在分析数据时发现更多主题。
  • 招聘的参与者有多少专业知识:在某一特定领域有丰富经验的人将能够分享更多相关信息。
  • 面试的结构如何:如果采访是非结构化的,那么每次面试中可能并不总是涵盖相同的主题或问题,使饱和度越来越难以实现较小的样本。如果对每个面试参与者询问了相同的开放式问题,如果每个面试参与者询问相同,那么它更有可能会发生重叠,并且饱和将提前达到。

考虑到这些因素可以让您了解您的样本大小。

从小处着手,边做边分析

因为我们很难提前知道什么时候会达到饱和发现的时间往往太短,最好从一个小的代表性样本开始(比如5-6),并在你去的时候分析你的采访。如果您仍然学习新事物并生成新代码,您可以在达到更多的参与者之前招募一些参与者,直到您达到您的主题完整,并且每次新面试都发现了很少的新洞察力。

确保招聘是您的目标受众的人,并强调可能影响您的研究问题的相关特征。例如,如果您正在研究在线预订休假的最终到期体验,则相关特征可能包括收入,旅行频率和年龄。这些特征可能会影响人们的偏好,态度和行为。

当然,如果您可以,但是,如果您可以,但是由于基于面试的研究具有小样本,因此您的样本将与所有人口统计因素相匹配,因此您的样本不太可能与所有人口统计因素相匹配 - 这没关系!一些特征将在样品中超越。例如,如果你关心包容设计时,你的样本中应该有大量数字技能和易访问性需求较低的人。

最后,如果你需要在开始面试前设定一个样本大小(为了预算或因为利益相关者想知道),请给出一个范围。通过这种方式,你可以设定期望值,如果你提前达到饱和,你就可以停止。

总结

多少面试才算足够取决于你什么时候达到饱和,而饱和又取决于你的研究目标和你研究的对象。为了避免做过多的采访,从小处着手,边做边分析,这样当你学不到新东西时就可以停下来。

参考文献

Abbie Griffin和John R. Hauser。1993.客户的声音。市场营销科学12卷。1号。

格雷格·盖斯特,亚文·邦斯和劳拉·约翰逊,2006年。面试多少次才够?一项关于数据饱和和可变性的实验。场的方法,第18卷第1期,59-82页。

标记梅森。2010.使用定性访谈的博士学位研究中的样本大小和饱和度。论坛:定性社会研究,卷。11,3. 3. https://doi.org/10.17169/fqs-11.3.1428

Nielsen, Jakob, and Landauer, Thomas K.:“一个发现可用性问题的数学模型。”1993年ACM INTERCHI会议论文集(荷兰阿姆斯特丹,1993年4月24-29日),第206-213页。