菜单 关闭

智能助手有可怜的可用性:用户Alexa的研究,谷歌的助理,和Siri

通过 拉鲁卡布迪乌页劳布海默7月22日,2018年

简介:可用性测试发现,只能和基于屏幕的智能助手工作只有非常有限的,简单查询非常简单,简短的回答。用户与别的有困难。。


可用性的圣杯是建立一个接口,需要0交互成本:能够满足用户的需求而不让他们做任何事。尽管界面设计仍远离阅读人们的思想manbetx官方网站手机版,Alexa等智能助手,谷歌的助理,和Siri是向这个方向迈进的一步。。

UI特性

智能计算机助理结合5基本用户界面技术:

  1. 语音输入:通过输入命令是口语,而不是发布或点击/利用图形物品。。
  2. 自然语言理解:用户不限于使用特定的,computer-optimized词汇或语法,但结构能在很多方面他们的输入,就像他们在人类谈话。。
  3. 声音输出代替在屏幕上显示信息,助理大声读出来。。
  4. 聪明的解释:助理利用额外的信息(比如上下文或过去的行为),除了用户的文字输入,估计用户想要什么。。
  5. 机构:助理操作,用户没有要求,但电脑自行承担。。

聪明的解释和机构要求助手积极地学习关于用户和可以修改他们的行为服务的用户。。

因此,当评估用户体验的智能助手,我们需要考虑6个问题:每一个5技术,再加上他们集成。。

集成一束UI技术的想法并不新鲜。同样的原理是在最流行的风格的图形用户界面(gui),懦弱的人呼吁“windows-icons-menus-pointing装置”。你可以没有鼠标(使用windowsAlt- - - - - -标签或者没有图标的鼠标(点击文字)但全套GUI生成一个很好地集成,提供了良好的可用性超过30年。。

并非所有的助手都使用所有5种UI技术:例如,如果屏幕可用,助手可以使用视觉输出而不是声音输出。然而,5技术支持和增强彼此当他们顺利地集成在一起。例如,语音命令,像传统的基于命令的交互方式,有一个固有可用性弱点而点击(他们依靠一些回忆,而点击和直接操作涉及识别),但自然语言可能使艰苦创作一个命令低于点击一个图标。。

整合5 UI技术承诺一个交互样式有两个优点:

  • 它可以缩短物理接口,并简单地允许用户制定他们的目标自然语言。虽然说话确实涉及互动成本,理论上这成本小于学习一个新的UI,按按钮,和选择。。
  • 它可以根据上下文信息或先前的用户行为提供适当的建议,从而推断用户的目标,并对此采取主动。这第二个方面事实上更接近“阅读我们的思想。““

现在的助手对上下文的建议仍然相当有限,虽然在这个方向采取小步骤——谷歌助理解析电子邮件和日历添加航班或餐厅预订;Siri和谷歌的助理警告用户所花费的时间要经常目的地一旦他们离开一个位置。当这些上下文适当建议,他们无缝地朝着他们的目标用户。。

用户研究

为了更好地理解这些助手今天面临的挑战以及他们帮助用户的原因,我们跑两个可用性研究(一个在纽约,一个在旧金山海湾地区)。共有17个参与者- 5在纽约,在加利福尼亚州,他们经常使用至少一个主要的智能助理(Alexa,谷歌的助理,和Siri)被邀请进实验室单个会话。每个会话包括可用性测试(使用Alexa facilitator-assigned参与者完成任务,谷歌的助理,或Siri)和面试。。

在可用性测试部分的研究中,我们要求被试使用助手来完成各种任务,范围从简单(E)。g。,天气的4th7月的周末,附近Walgreens的药房时间,当乔治克鲁尼出生时,变得更复杂了。g。,当斯坦利·库布里克的第二个去年的电影,周末期间交通苔藓海滩)。。

本文总结了我们的主要发现。第二篇文章将讨论的社会维度的交互与智能助手。。

结果:交付可用性严重低于承诺的可用性

我们的用户研究发现,目前的智能助理在所有6个问题上都失败了(5个技术加上集成),导致整体可用性水平接近无用的甚至稍微复杂的交互。对于简单的交互,设备满足最低限度的可用性需求。即使这违背以人为本设计的基本前提,manbetx官方网站手机版用户必须训练自己来理解智能助理何时有用,以及何时最好避免使用它。。

我们的思想一直是计算机应该适应人类,而不是相反。人工智能的承诺之一就是高适应性,但我们并没有看到那一幕,当观察实际使用。相比之下,观察用户斗争的感觉就像一个AI接口回到1970年代的黑暗时代需要记住神秘的命令,压迫性的模式,令人困惑的内容,僵化的交互——基本上就是一次不愉快的用户体验。。

让我们来看看这6种UI技术中的每一种,并评估它们如何很好地实现了它们对用户的承诺。而这个问题的答案是悲伤,我们还可以问,目前的弱点是否是技术固有的,并将继续存在。还是他们是由当前的技术限制和将会改善。。

用户界面技术

当前的可用性

未来的潜在

语音输入

好(除了非母语者)

很快很好,也应对口音

大多数输入正确地转录,偶尔会有名字的例外。。

自然语言

可以变得更好,做起来难

Multiclause句子不理解;等价查询配方产生不同的结果。有限的了解代词指示物。。

声音输出

本来就有限的可用性,除了简单的信息

除了一些任务(e。g。,导航,天气),助理不能持续产生令人满意的声音响应查询。。

聪明的解释

可以变得更好,但极难做

助理使用简单的上下文信息,如当前位置,联系资料,或过去频繁的位置,但很少超越这一点。。

机构

可以变得更好

只有非常有限的使用外部的信息来源(如日历或电子邮件)推断出用户潜在的利益的行为。。

集成

可怕的

可以变得更好,但是需要太多的繁重工作

助理不与其他可用的应用程序在设备上工作得很好,与各种“交互技能”或“行动”不要把所有的UI技术的优势。。

我们是不讲道理的吗?不是真的基于ai的用户界面在近几年取得了巨大的进步吗?对,当前的人工智能产品比许多人工智能研究系统过去的几十年。但是普通人日常使用的要求明显高于研究生演示的要求。学术会议的演示我们看到20年前都给我留下了深刻的印象,为基于ai的交互带来了福音。目前的产品是更好的,然而,不履行承诺。。

承诺依然存在,人们已经得到一些使用的智能助手。但这巨大的进步所需的交互样式支持更广泛的使用高水平的可用性。类比是移动设备开发的方式:当我们2000测试手机可用性,结果是糟糕的。然而,移动信息服务的承诺很清楚,许多人已经大量使用一个特别有用的低端服务:人与人之间的短信。经过许多年的技术进步和更严格的UI集成第一的智能手机,导致一个可接受的,虽然仍2009年手机的可用性水平低。另一个十年的改进,和移动用户界面现在很好。。

基于ai的用户界面可能略优于移动可用性是在2000年,但不是很多。要花二十年才能达到好的AI可用性?需要解决的一些问题是如此艰难,这甚至可能是一个乐观的评估。但就像手机一样,基于ai ui的好处是足够大的,即使是中点(我。e。,像样的,但不好,可用性)可以接受,可以更快地触手可及。。

为什么人们使用助手吗

我们的大多数用户报告说,他们在两种情况下使用智能助理:

  1. 双手忙碌时——例如,在开车或烹饪
  2. 当问这个问题比打字快,阅读结果

第二种情况值得讨论。大多数人对助手能做什么有明确的期望,和经常说,他们不会使用助理进行复杂的信息需求。他们觉得一个查询一个明确的答案有一个很好的机会被助理回答正确,和两个参与者明确提及5 w1h(什么,在那里,的时候,为什么,如何)的问题。相比之下,更微妙的,通过网络搜索或与屏幕设备(如电话或平板电脑)的一些其他交互,可以更好地满足类似研究的信息需求。。

然而,有些人觉得助理甚至能够完成复杂的任务,提供,他们问了正确的问题。一个用户说:“我可以做一切我能做的和Siri在我的电话。[…]复杂的问题——我必须简化他们的工作。““

然而大多数人认为思考正确的问题不值得付出努力。作为一个用户,“Alexa就像一个外星人,我不得不解释一切…很好只是简单的查询。我要告诉她的一切。我喜欢简单的提问,认为如何制定问题。““

语音助理节省交互成本的一个显著领域是口述:长消息或搜索查询比输入更容易说,特别是在移动设备上,何处小键盘是容易出错,缓慢的,和令人烦恼的交易。参与者通常很快注意听写是不完美的,有帮助当他们不能轻易类型(例如,因为他们走路,驱动,烹饪,或者干脆远离一个设备和一个真正的键盘),,他们避免听写mistranscribed如果文本使用独特的术语。他们也提到斗争有助理插入正确的标点符号(或者助理将停止听如果用户暂停表示一个句子的结束或助理只是忽略标点符号,要求用户校对和编辑文本)。。

用助手

当参与者花时间思考如何制定交付的查询,然后连续流动的助理,助手通常能够解析整个查询。作为一个用户,“你应该在问问题之前先想一想,因为在你向[助手]说话的时候很难解决。你必须事先考虑一下,因为它不像一个人在与他们交谈(你可以模糊)。“另一个说,“当我问问题时,我几乎觉得自己像个机器人。因为我必须说它在这样一个清晰,简明的方式,我必须把它显然。当我试图给一个命令或问一个具体的问题,你不使用变形。这真的只是拿起单词,这不是捡的情绪在你的声音。““

但许多参与者开始之前制定完全查询(如您通常会与人类),偶尔停下来寻找最好的词。这样的停顿是自然的交谈中,但助理没有正确地理解,经常冲到回应。当然,这种不完整的答案查询大部分时间是不正确的,总体效果令人不快:参与者抱怨他们被打断了,助理”讨论过他们”,或者是“助理粗鲁的“一些甚至明确地骂它的助理(“Alexa,那是不礼貌的!“)。。

当人们需要重述一个没有被正确理解的查询时,他们经常发表的话在一个高度夸张的方式(如果他们跟人类听力障碍)。。

大多数参与者感到复杂,multiclause的句子(如“我该什么时间离开苔藓海滩周六如果我想避免交通?“或“找到从伦敦飞往温哥华的飞行状态,今天在4:55pm”)是不可能理解的助手。有些人试图在多个查询中分解这样的句子。例如,一位参与者想要找出当库布里克的倒数第二个电影是要求列表库布里克的电影,然后计划询问关于列表中的第二个到最后一个项目的问题。不幸的是,Siri根本不是有用的,因为它只是提供了库布里克的电影的一个子集,没有明显的订单。。

非英语母语者

几个人有外国口音,觉得助理并不总是得到他们的话语,不得不经常重复。这些人沮丧,认为助手不得不学会处理各种语言和说话的方式。。

除了口音,有三个因素影响他们的成功与助理:

  1. 他们可能会暂停比母语更在他们的话语。这些停顿往往被助理解释为查询的结束。。
  2. 他们倾向于正确的自己当他们觉得念错一个字,最后两次说同样的话。这些重复的话似乎使助手们感到困惑,尤其是Alexa。。
  3. 他们有时使用较少的常见措辞。例如,一位与会者问道:“Alexa,大不列颠足球队是什么时候参加足球锦标赛的?“Alexa无法找到那个问题的答案。。

幸运的是,口音的理解是有潜力成为一个领域计算机比现实他们能够比人类更好地识别单词的非标准发音。计算机并不关心你如何发音,除非它被训练成只识别一个特定的声音,它可以明白几个不同的声音都代表相同的词。因此,我们希望更好的口音识别只是一个时间问题。应对本节讨论的其他问题将更加困难。。

展示答案

助理的语言

一些参与者抱怨的助理说话太快,没有办法让它重复答案。特别是当答案太长或复杂的,参与者不能提交给他们的所有信息工作记忆。例如,提供抵押贷款报价之前,Alexa贷款树技能要求用户通过背诵地址和抵押条款来确认输入的所有细节都是正确的,然后列举一组命令编辑如果需要的信息。一个用户说:“它最后说得太快了-[它说]‘如果某事不对[你必须]去瞎扯’;要记住所有的选择太难了。““

当助理误解问题,提供了一个不正确的反应,这种经历令人厌烦。人们讨厌等待一个完全不相关的长时间的回答,并努力插入Alexa,停下来在谈话。一位与会者解释说,“我不喜欢的是(Alexa)不闭嘴当我开始和她说话。这是一个更人机交互。[…],这将是理想的如果它小于“Alexa,互动停止-像“OK”之类的东西,或“足够”,或者几乎任何我咕哝[…]就像跟人地往前走,你等着找到一个停顿,这样你能阻止他们。““

但即使一些正确的助理反应过于冗长。一位用户抱怨说:当她试图把物品添加到食品杂货清单时,Alexa确认”“ 添加到购物清单”在每一个。感觉太多的单词对于这样一个重复的任务。另一个用户名为Google助手”太爱说话了当它提供额外的信息对药房营业时间查询。参与者骨碌碌地转着眼睛当Alexa读长描述列表中为每个配方提拉米苏的菜谱,包括一些(相当)明显的和重复性的成分——比如鸡蛋。。

声音vs。屏幕上的结果

智能助手的主要用途之一是在汽车中免提使用。在厨房里,或者在其他类似的情况下。。我们的用户视为一个声音回答优于在绝大多数情况下屏幕上的答案。。(包括异常情况的答案包含敏感信息,例如,一个女人憎恨她的医生预约大声朗读出来,他说:“我宁愿它说‘事件’”这个词。)

最聪明的人没有一个屏幕,因此他们必须传达声音格式的答案。这个限制一些参与者更喜欢演讲者在手机同行,mixed-modal交互感觉更乏味的地方。。

手机助手通常延迟搜索结果当他们没有现成的答案,强制用户与屏幕交互。人们感到失望当他们必须用他们的眼睛和手指浏览一个结果列表。他们评论说:“它没有给我正确的答案。它给了我一篇文章和链接。不告诉我我问,“和“我希望它没有给我只是一些链接…(至少)应该告诉我一些……然后,也许如果你想要更多,检查这个或那个。’”“

正确的答案读的时候,“感觉就像魔术。“一个参与者问谷歌助理”我应该花在布拉格多少天?“,和响应是响亮而清晰:“根据Quora,你应该花费3 - 4天在布拉格[…]。“用户说:“这就是我正在寻找的人;我大声的读出的信息也显示这些信息。“这些类型的经验被认为是我们的参与者最有帮助的,但在我们的研究中,它们非常罕见:尽管这个任务是由几个参与者执行的,只有一个使用“正确的”查询公式产生一个清晰的口头回答;其他六个试着变异的同样的问题(“好了谷歌,你认为是一个很好的时间的假期在布拉格”,“好了谷歌,我应该多长时间假期在布拉格”,“嘿,Siri,访问布拉格多少天就够了?““好了谷歌,在布拉格呆多长时间,““Siri,我应该去布拉格多少天?“,“Siri,如果我去布拉格,我应该多久?“)有一组链接而不是Siri和谷歌的助理,除了最后的查询,周围的交通提供了布拉格。。

和西丽一起,有链接被破坏的另一个原因:那些结果列表中点击一个链接被送往浏览器或到另一个应用程序,还有一些人不知道如何回到清单上继续检查其他结果。一个iPhone用户点击餐馆在地图上看到它,然后试图返回其他餐馆;她说,“哦,不,(餐馆)消失…是困扰我的一件事,我不知道如何检索SIRI请求,你知道的,一旦上面写着你可能会发现一些有趣的事情……比如,如果我开车,如果我真的想找到谁出演这部电影,我可以说“添加到我的待办事项清单后的或者我可以说“查”,但我不会去看它,直到我到达目的地,而且,我在那里的时候,消失了…所以这餐馆列表消失了因为我摸在地图上,所以我必须再试一次。“(餐馆的列表可能是用户应该点击检索回到应用程序iPhone按钮在屏幕的左上角,但是那个按钮是微小的,很多用户不熟悉它。然而,更普遍点无法检索的历史互动绝对是一个软弱的Siri与其他智能助手。甚至Alexa允许用户看到一个Alexa的查询移动应用的历史。)

转录用户查询的基于屏幕的助手在转录不是即时时引起问题。一位与会者认为,因为她没有看到她的口语词汇在屏幕上,Siri没听到她,所以她会不止一次重复那些最初的几句话。由此产生的话语被助理通常不能被正确的理解。。

部分答案

有时Alexa公开承认,它没有一个答案。当它提供的信息仍然是相关的,尽管不是直接响应用户的查询,参与者们高兴。例如,一位用户询问了Willow Glenn(若泽)附近的房租,加州)和Alexa说它不知道答案,而是提供平均租金在旧金山湾地区。用户很高兴,助手已经认出Willow Glenn是海湾地区的一部分,答案很好。另一个用户问道:Alexa,一房一厅的公寓在山景城多少钱?“而且,当助理回答“对不起,我不知道。现在我能查找电话号码,个小时,和地址。“,用户评论”谢谢您。这是有用的——就像‘好吧,我不能这样做,但我可以做到这一点”。。。““

的时候,而不是口头回答,Siri助理或谷歌提供了一组屏幕上的结果,第一反应是失望,正如上面提到的。然而,如果屏幕上的结果是相关的查询,人们有时觉得经验是可以接受的,甚至很好。(这种感知可能与实验室环境有关,在参与者的手是自由的,他们可以与他们的设备进行交互。许多人觉得他们比助手(尤其是比Siri)更了解如何从SERP中搜索和挑选相关结果,所以当助手只返回搜索结果时,一些人说,他们将必须重做搜索。少数人试图制定搜索查询大声说话的时候助理和押注的想法最初几个结果将是足够好的。这些人使用助理(谷歌助理通常)作为一个搜索引擎声音接口。。

相信结果

人知道聪明助理是不完美的。所以,即使当助手提供答案时,他们有时怀疑答案是对的,不知道如果查询是正确理解它的全部,或助理只匹配它的一部分。作为一个用户,“我不相信,Siri会给我一个回答这个问题对我来说是好的。““

例如,当被问及配方,Alexa提供了一个“食谱”更多的选项。但它没有透露什么信息””意味着,食谱是如何选择和命令。这些是高度评价的食谱吗?认为博客或烹饪网站公布的食谱吗?人信任Alexa为他们的选择和排序,没有任何证据形式的评级或评论的数量。尤其是Alexa,用户看不到结果,只听一个列表,的问题列表是如何组装的几个用户是非常重要的。。

然而,甚至手机助手了信任问题,即使他们可以使用屏幕支持证据。例如,在其中的一个任务,用户要求Siri找到餐馆苔藓海滩。Siri是返回一个列表的餐馆与相应的Yelp评级(似乎在回答查询),但是没有映射到显示餐厅确实满足用户指定的标准。访问地图上所有的餐馆也单调乏味:必须选择一个餐厅和点击地图;地图显示所有的餐厅选择Siri。。

西丽没有在地图上展示餐馆的名单。访问地图,用户必须选择一个餐厅,在地图上显示它。一旦他们这样做,一些用户不知道如何恢复的餐馆列表(可以通过单击back-to-app按钮Siri 在屏幕的左上角)。。

相比之下,谷歌助理做得更好解决相同的查询:它显示所有餐馆显示在地图上,用户可以看到(不幸的是)结果集中在苔藓海滩之间的路线,而不是结束。。

谷歌在地图上显示,餐厅助理。。

可怜的支持比较和购物

在我们的研究中,涉及比较的任务具有特别差的可用性,有几个原因:

  1. 演讲是一个低效的产出形态。需要一个长时间聆听向助手宣读每个可能的备选方案,我们关注的用户得到明显生气一边听助理终于谈论一个选项。助理的多嘴尤为令人沮丧当参与者很快意识到她不关心当前项,但她仍然不得不听Alexa或Siri嗡嗡作响。如果两人彼此交谈,他们可以使用音调,脸部,引导或肢体的语言线索来谈论一个有趣的两个方向。但是语音助理不能理解用户何时对选项不感兴趣并停止谈论它。。
  2. 没有为用户方便地来回和比较选择。他们必须提交所有信息的一个替代他们的工作记忆来比较,与后续项目。。

例如,当为用户提供不同的提拉米苏的食谱,Alexa上市配方的名称,准备它所需的时间,然后说,“你可以问更多的信息,或者,更多的食谱,说“下一个”。“如果用户说,“下一个”,很难回去参考以前的配方。这种交互方式假定用户很舒服满意(我。e。,选择第一个最小可接受的选项),而不是比较利弊不同的选择。对于一些简单的任务,没有后果的挑选一个平庸的选择,“满意解决”可能是一个合理的假设,但在我们的研究中,即使是为晚餐挑选食谱,用户想做的相当程度的比较。。

使用多个标准选择的任务更加困难。例如,当使用Google助理比较披萨的地方在纽约,用户无法有效地比较每一个有多远,然后决定在附近的选项根据恒星的数量他们在评论——所有的信息提出了单独为每个餐厅,用户将所有这些细节都保存在工作记忆中,以便对不同的餐厅进行比较。

缺乏伴随视觉细节为每个选择重要——特别是,例如网上购物,餐馆,或酒店。在我们的研究中,用户通常不考虑购买一件物品而不能看到它的图像来评估它的想法,同时doublecheck是正确的项目。有太多的空间误差与模棱两可或名称类似的产品。。

一个参与者甚至指出,要求Alexa比特币的现价是令人沮丧,因为它不能轻易改变随着时间的推移,交流人们交易的迅速波动cryptocurrency关键因素。。

技能和行为

对于像Alexa和谷歌助手这样的系统,用户可以访问特殊的“应用程序”(称为“技能”在亚马逊的生态系统和“行动”在Google的)致力于特定的任务。。

理论上,技能和行动可以扩大这些系统的力量,但在我们的研究中,他们证明是无用的。Alexa的大多数用户不知道技能;他们遇到一些人,安装一个或两个,然后完全忘记了他们的存在。。

Alexa技能有两大发现问题:

  • 他们要求用户记住准确的名称的技能。尽管你可以问Alexa技能目前安装在你的设备上,企业是徒劳的,因为Alexa开始描述他们在没有明显的顺序一个接一个,和你有第三个技能的时候,你觉得你已经受够了。。
  • 他们要求用户记住调用技能的咒语。在理论上,这些都是“玩 “,“跟 “,“问 “,但是,在实践中,我们的参与者麻烦让这些短语的一些工作:一个词似乎好了一个技能,但不与其他。(我们要求人们在Alexa导航到技能页面应用程序,有时他们试着列出的短语为例,甚至那些似乎也不起作用。)

一个人讲述如何,他买了一个回声设备的主要原因是与和谐远程控制他的家庭娱乐系统,然后努力记住的单词,他不得不使用调用和谐技能,最终放弃使用它。。

人更熟悉谷歌的行动,而不是助理Alexa的技能。一个用户要求方向苔藓海滩,然后,在收到它们,继续查询这个周末”(意义方向如果他离开在周末)。谷歌助理回答说:肯定的是,你可以跟太阳能天赋。那听起来好吗?“用户说,是的,和意外地发现自己在太阳才能行动,哪一个要求一个位置后,提出“在莫斯比奇高达10。“这句话让用户完全糊涂了。(事实证明,太阳能才能返回一个位置的紫外线指数。)用户评论道:“在这一点上,我不喜欢拥有一个新的应用程序,也不知道它到底是什么。““

一个用户无意中发现自己在Google助理的太阳天赋行动中,当他试图说明苔藓海滩在周末。(在大多数浏览器,悬停在视频显示视频播放器控制如果他们不是已经可见。)

而似乎一个动作(或技能)建议偶尔可能是合适的,建议应该伴随着一些基本的关于应用程序的信息。。

与技术交流

即使人们终于能够访问一个Alexa的技能,与他们交流并不简单。不像Alexa本身,接受了相对自由的语言,技能需要一套有限的回答。在许多方面,它们看起来非常类似于传统的交互式语音应答系统,该系统要求用户通过说出特定的单词或数字来进行选择。人们不理解之间的差异”受限语言”模式与““正常语言”模式,和许多与技能失败了,因为他们没有发现正确的方法与应用。大多数时候,他们只是忽略了指令和制定他们的答案在自由形式和查询。这种行为产生困难和重复触发响应的能力。。

例如,餐厅Explorer技能迫使用户参考餐厅它建议说“1”,“2”或“3”而不允许他们使用餐厅的名称。孤独星球的技能要求用户说特定的关键词,如“最好的时间去”和不理解这样的问题”2018年7月在悉尼的事件是什么?。“当用户问这个或其他nonscripted问题,这一技巧重复了一套关于悉尼的一般事实。一位与会者评论说:太多了。就好像我听百科全书——这不是互动。(。。只是告诉我事实,它不关心如果我不想听。““

加拿大航空技能还向用户提供有限的功能,希望特定的措辞;当有人问“的地位从旧金山飞往温哥华,四百五十五点”,这个技能几乎忽略了所有的单词455“,它被解释为航班号。。

技能也烦人,因为“导论部分,联合作用的“飞溅”屏幕和教程。在这样(冗长)的介绍中,这些技能受到用户的欢迎,并列举了他们可用的word命令列表。不幸的是,这些介绍经常重复,而且,就像所有的教程一样,人们几乎无视他们,渴望开始他们的任务与技能。

工作更好的技能当他们问用户特定的问题,允许他们提供答案。但即使在那里,设定的期望有一个问题:一个用户交互与贷款树技能抱怨技能开始问问题没有告诉她(1)为什么它需要的答案,和(2)不给予保证,它将有答案。更好的应对她94087年邮政编码查询关于抵押贷款利率将是一个范围值,其次是选择继续和回答一些问题为了得到一个精确率。。

技能和行为造成的另一个问题是用户定向障碍:参与者仍然不确定他们是否与技能也可以恢复正常交互与Alexa的交互。一个参与者试图解决这个问题,问Alexa明确:“Alexa,我们仍然在[技术]哇?“,下一步她需要做什么。(这个问题是UI的标志完全失败的第一个可用性启发式-系统状态可见度。)

与其他应用程序集成

与助理一个常见的抱怨是,他们没有很好地集成在虚拟用户生活的生态系统。iPhone用户抱怨Siri之间缺乏整合和各种应用他们想使用——Spotify播放音乐,谷歌地图的方向,等等。许多人认为西丽对苹果应用和设备进行了优化,但他们没有谈到他们的应用程序和服务。。

Alexa用户也抱怨亚马逊的服务优先级——许多已经订阅Spotify或苹果音乐,觉得它是浪费订阅亚马逊音乐为了得到他们想要听音乐的回声设备。公司自身服务的积极推广迫使用户学会制定查询,从而绕开这些限制:当我说玩音乐,它告诉我,我没有亚马逊音乐所以我必须非常清楚,说玩iHeart收音机。’”“

结论

今天的“智能”助理仍远未通过图灵测试,对大多数交互,人们很容易找出他们不与人类说话。虽然用户人类品质投射到他们身上,他们有相对较低的预期这些助理和储备为黑白,事实问题。尽管主要的障碍可能是更好的自然语言和对话处理(一个固有的难题),许多规模较小的问题可以用更周到的设计来解决。manbetx官方网站手机版。