一文读懂,语音交互设计流程

钱柜娱乐777真钱娱乐下

阅读文字,语音交互设计过程

随着智能扬声器的快速发展,对智能语音产品的需求也越来越多。本文为您提供了语音交互设计全过程的详细说明,让我们来看看

555d05affe814e3ebac4a374df4c8a45.png

首先,VUI的现状

随着智能扬声器的快速发展,谷歌(谷歌首页),亚马逊(Echo)天猫精灵,小爱扬声器.智能产品的突飞猛进,对智能语音产品的需求越来越大,越来越多的智能扬声器越来越高对人们的生活有更深刻的影响,更自然和新的专业需求,例如:VUI(语音用户界面设计师),语音体验设计师VUE(语音用户体验)设计师),但实际上VUI和VUE之间的界限是很模糊,所以这里没有更多的描述。

一些大型国际公司已经做了很好的示范,如:亚马逊,谷歌等,会有特殊职位,一些特殊研究,当然相关国内招聘也会看到相关职位。薪水不低。然后我们将详细分享VUI(语音用户界面)。

0a71ef2b56bd4e33b2374355302694d8.jpeg

二,VUI起源/历史1. VUI的第一个时期

在20世纪50年代,贝尔实验室建立了一个单人语音数字系统;

在20世纪90年代,第一个可行的非特定语音识别系统诞生了。

交互式语音响应IVR系统的出现代表了VUI的一个重要时期。

2.第二期VUI

那是我们现在所处的时期。

我们目前的情况是,我们处于下一阶段的早期阶段,我们的手机已经可以通过语音处理很多事情,但仍有许多事情无法通过语音来完成。

3. VUI的一些优点和局限

(1)优势

速度:显然速度越来越快。国内语音和语音到文本技术极大地提高了人们的效率;

放开你的手:例如,当你开车时,你可以直接对你的手机语音助手说,嘿XX,麻烦你帮我XXX;

直觉:说话是每个人的本性(当然,不包括特殊情况);

同理心:言语包含情绪,音量,音调和语速。这些功能包含许多感知信息,可让您了解其他人所表达的内容。

ba5d9ad6cd57403993c646d15af74618.jpeg

(2)限制

环境:对环境的要求相对较高。在公共场所,有很多人,不利于接受和进入演讲;

不适合:仍然有许多用户不喜欢它,并且不响应语音设备;

喜欢打字:一些喜欢打字,打字的用户可以通过某种方式给他带来一些乐趣;

隐私:这很容易理解,每个人都不希望别人知道他们的隐私。

3.什么是VUI设计师(它在做什么)?

需要考虑系统和最终用户之间的整个对话过程,从头到尾;

用户研究是必不可少的;

负责设计,产品原型和产品描述;

需要了解底层技术的优缺点;

分析数据的能力。

从项目的发布阶段到发布阶段,它起着非常重要的作用。

当然,很多人可能会发现以上五个项目可能有点尴尬。事实上,他们并不需要所有这些。他们还可以负责链和节点之一,例如用户研究和数据分析。

888ffcbbcd774478ab77a1c97f0bd4a6.jpeg

四,VUI的基本设计原则1.会话设计

定义:简单地说,我请你回答

目前,我们使用的智能设备只能支持单轮对话,但这不是人们习惯对话的方式。一轮以上的对话符合用户的心理预期。

请回顾一下使用智能扬声器的一些场景体验,例如(天猫精灵):

网友:天猫小精灵,我明天有闹钟吗?

天猫:你明天没有闹钟

网友:你能帮我订一个吗?

天猫:

你会发现智能扬声器在这个时候就像一个记忆丧失,没有反应,显然这不是我们想要的互动。从用户的社会属性的角度来看,人们沟通的方式一直是一轮以上的对话,而不是一轮。通常,我们必须让用户决定会话将持续多长时间。显然,如果你自己经历过,你可以进行更多轮次的对话。

插入一个题外话,最近天猫精灵更新了游戏的游戏玩法,它更进一步,虽然不是很好的体验,但至少一步一步,我相信未来会越来越好。对话是如何设计的?什么是近似过程?

2.设计工具

这里提到的设计工具并不是说它是一种特定的工具,而是一种方法论。

示例对话:

定义:示例对话框的字面意思是演示示例对话框,看起来像电影脚本,就像两个人在一起聊天一样

特点:它是整个设计对话过程的关键方法。成本低,易于操作

用法:在文本中写下要完成的场景,然后大声朗读。您会发现写作和口语之间存在许多差异,甚至有些奇怪。在这个时候,你会发现有很多东西可以改进。这个地方,所以你会看到一些招聘人员会有这个相应的要求,甚至要求一些东西有戏剧技巧,并且喜欢写剧本的经验。

角色:它允许您在开始投资开发之前了解您的设计是如何工作的。

3.视觉原型

尽管它是语音交互,但它仍然与GUI不可分离,它可以与示例对话结合以可视化用户体验。样本对话和原型构成了我们产品的故事板。 GUI + VUI是用户的完整体验。因此,VUI和GUI将在早期合作,这将使用户体验更加流畅。

5e40df15039d4157a34057f0bd1eec80.gif

4.流程图

也称为调用流程图,一般我们的流程图需要包括用户使用的所有可能的分支,但是会有数千个复杂的情况,流程图会很混乱而且难以理清,所以我们采用分组方法。

具体的分类方法可以分为组(日历功能,搜索功能,电话.),或根据不同的目的分组。

流程图中使用了很多工具,所以我不会在这里列出它们。

在我们设计了一组示例对话之后,我们必须进行一些详细的研究,例如确认。

5.如何确认

确认用户声音

非口头确认

一般确认

视觉确认

1.确认用户声音

最重要的是用户语音的确认,分为显式确认和隐式确认。

明确确认:强制用户确认信息更为重要。例如:你能帮我喝奶茶吗?看看附近的XXX奶茶。使用折扣后的价格是XX元。你想要一个吗?

隐形确认:不需要用户确认信息,例如:用户:XX你能帮助我在明天10点设置闹钟吗?好的,我已经在明天上午10点设置了闹钟。

73c14d146ca940f5ac5ccd77dbf80fdd.jpeg

1.1那么如何确定何时使用隐式和显式确认?

然后我们将介绍下面的三级置信水平。

系统将在一定阈值内明确确认表格,并将此阈值设置为三个级别。

1.2信心?

智能扬声器可识别声音的清晰度。

用易于理解的词语来说,这是人与人之间语言接受的清晰度。当然,当你听不到对方说的话时,你会经常提问,或直接说,抱歉,我不明白,你可以再说一遍。

1.3三级置信度

例如:帮我买另一个外卖。

当置信度大于80%时,使用隐式确认:好的,我已经为您订购了一个外卖。

当信心为45~79%时,请使用明确的确认:您想订购另一个外卖吗?

当信心低于45%时:对不起,我没有听到你的演讲,你想买什么?

2.仅使用隐形确认

当智能语音扬声器能够清晰地识别您正在谈论的内容时,您可以直接通过隐身确认它,这使得体验流畅舒适。

3.非语言风格

例如,如果灯光需要几秒钟,那么只需让系统恢复或知道它让用户知道发生了什么。还有一些特定的声音效果来表示特定的含义。

4.有趣的普遍确认

也就是说,智能语音扬声器不会单独回答你,并会主动问你一些问候。通过这种情感设计,用户将感到更加温暖和舒适。

所以我们讨论了很多确认策略,所以让我们谈谈会话标识,因为它是用户理解会话进度和进度的重要方式。

5.会话标识

它包括以下三个方面:

时间表:开始,进度和结束。

收到收据:谢谢,我知道,好的。了解。

积极的反馈:哇,这个消息真是太棒了。

对话对话的作用是什么?这是用户了解会话进度和进度的重要方式。它可以更好地跟踪用户使用的路径方法。

每个人都会发现很多次,智能语音设备无法准确,准确地识别我们的信息。错误率相对较高。以下是语音识别异常的情况的概要。

六,语音错误异常和解决方案

几个错误异常案例:

没有发现语音;

检测到语音,但无法识别;

检测到语音,但无法识别;

一些语音识别错误。

1.未检测到语音

有两种情况没有检测到语音:一种是用户说,系统没有收到;另一个是用户没有说。

主要是说用户说,系统没有收到这种情况,建议采取两种解决方案:

我们前面提到的前三个信任级别,我们直接询问,“对不起,我没听到你说的话,你能再说一次吗?”

第二是不采取任何行动。

1.1您在什么情况下使用查询?

用户必须在系统继续执行任务之前做出响应;

您的系统仅支持语音;

没有其他方法可以回复。

1.2什么情况下更适合什么都不用?

用户有其他选项(例如移动界面类,通过按钮操作);

什么都不做,不打断谈话;

拥有视觉信息可以提示用户做出明确的选择。

2.检测到语音,但无法识别

处理方式和未检测到的语音基本相同,并且已经在这里采用。

3.检测到语音,但无法识别

原因通常是两件事:

系统程序没有对这种情况作出反应;

程序中写入了错误的响应。

解决方案:在这里我们将测试找出问题的哪个部分出错,通过数据收集和分析可以找到具体的答案。

4.部分识别的错误

可能这就是场景,天猫精灵,嗯.我想.好吧,好吧,带给你一首XXX的歌。

解决方案:这仍然需要技术干预。您可以使用N-Best列表(可用于规避二次错误)以及应用固件后的相应数据分析来构建此问题的解决方案。

在谈到错误异常处理和解决方案之后,我们将讨论延迟和消歧。

5.延迟

普通用户等待交互的时间是7秒(现在是5秒)。当您要求等待答案超过此阈值的时间时,用户将怀疑系统是否出现故障甚至是恼人的。

解决方案:首先,让用户知道您正在工作并查看“请稍等”;第二,非语言提示,如:音效等。

6.消除歧义

在许多情况下,只有用户提供的信息的一部分,加上中文的多层含义的特殊性,消除了歧义,并在改善用户体验中起着重要作用。

例如,当被问及地名的天气时,中国许多城镇的名字都是一样的。

鼓楼:

河南省_开封市_鼓楼区

福建省_福州市_鼓楼区

江苏省_南京市_鼓楼区

江苏省_徐州_鼓楼区

解决方案:您仍然可以使用置信度来判断。如果您确定,请直接回答,或要求多轮。

7.帮助功能

最后一个模块说帮助功能也很重要,可以在一定程度上消除用户的“恐慌”。因此,在VUI中设计相应的帮助是非常必要的。例如,您可以使用智能语音设备做什么?它会告诉你他能做什么?例如:我的设备如何链接到您的蓝牙。 APP:好的,长按.

七,语音交互的几个原则

它应该节省时间和效率

简短

可以随时中断

能够链接上下文上下文

1.它应该节省时间和效率

与可视界面的交互几乎相同,用户非常不愿意花费大量时间来完成他想要完成的任务。更高效,更短的用户体验将更加愉快。

2.短暂

只需告诉用户主要密钥信息,不要太冗余。举一个简单的例子:购物应用程序的商品表示通常是将名称和价格放在主要位置,并将细节放入下一级页面。使用尽可能短的表达形式让用户直接获得他想要的东西。当然,这种对用户的理解和洞察需要积累和体验感知

3.可以随时中断

例如,用户:明天天气怎么样?

APP:明天XXX的天气是19°C,小雨,适合穿着.

用户可能只想知道天气。此时,我们需要能够被用户打断,而不是说“顽固”。如果我们继续说出来,则不允许用户中断,并且不响应用户的请求。用户会有一种怨恨的感觉。

eeaa22f85d5b4a55802d56c5d4a5dc1c.jpeg

4.链接上下文上下文的能力

这是一个许多智能语音设备不太好的地方。据说有很多轮对话。当然,如果你想建立多轮对话,中间的互动将比现在更大更大。可能性也更复杂。

上半部分语音交互设计的设计过程已基本概述,主要是关于VUI的起源,VUI中使用的一些方法,设计工具,一些异常处理以及VUI设计的几个原则。让我们与您讨论用户测试和预发布,确认发布.

八,用户测试

语音用户界面测试与可视化界面测试方法有一些相似之处,但存在一些差异。

一般来说,在开始测试之前,您仍然需要进行用户研究,大致分为以下几个步骤:

1.了解要求(用户用例背景研究)

在进行用户研究和访谈之前,我们必须首先了解这个利益相关者的需求是什么,业务需求是什么,用户需求是什么,以及我们的产品能为用户带来什么?我可以为他们解决哪些问题?最后,我们需要确定目标用户,然后进行访谈和研究。 (一般方法,你可以去看看阿里提出的五导体加方法)

2.制定设计研究计划

2.1为目标用户开发,任务流程

它是给每个受访用户一个特定的任务流,但很多时候我们不只是测试任务,会有很多任务,它将涉及任务排序问题。最好的方法是使用拉丁方设计,这样您就不必尝试所有可能的拒绝。

然后,在完成这项任务后,我们将招募科目。

2.2招募受试者

需要注意以下几点:

从目标用户中提取测试用户;

人数可能由5至12人控制。可用性专家Jakob Nielseb建议,效果一般控制在5-8人左右。

50ca0453c6db47bb81e54d2cd70f8c81.jpeg

小公司招聘测试用户可能相对困难,而且成本相对较高。当然,您可以从公司招募朋友和公司的同事来帮助您,但最好避免项目的直接核心人员。

因此,在现有人员完成后,我们可能会进行一些正在进行的测试,例如:我们会做一些问题。

我想问一下这里的方法,我们称之为交互设计中的用户体验图。

3.用户体验地图

我将给用户一些经验流程的任务,然后根据他的一些反馈,通过语言,表达式,然后绘制用户体验图,确定用户在任务过程中,获得一些经验,找到可能的问题它所在的节点然后被修改。

让我们来谈谈访谈中需要注意的问题以及如何进行访谈。

4.面试的注意事项

那么在口头提问过程中我们需要注意什么呢?

提问不要对声明有偏见,不要出现刻意的指导,例如,你喜欢这个功能吗?这种问题不合理。最好的问题是,使用此功能后感觉有什么样的感觉?或者您怎么看?

注意引导用户得出具体结论。而不是用户说的可能,也许我认为它应该是一个像等待的词。要有具体的例子,不要做出抽象的结果。

为什么从较少使用开始会使受访者觉得你在质疑他,或故意,并指责他。例如,受访者表示语音天气查询功能特别难以使用。你能简单谈谈你的使用场景吗?在什么情况下他觉得难以使用?描述我们需要更具体,而不是一般,抽象。

5.可用性测试(用户研究)

目标是测试工作流程和易用性,但在语音交互过程中,识别问题通常会阻止用户完成任务。最好找几个测试用户,尝试弄清楚主要的识别问题,并修复它。

可用性测试大致分为几类:

(1)远程测试(电话/视频访谈)

优点:

找到符合这些特征的用户会更容易。

成本较低,只需要远程,无需支付其他额外费用,如达成约定的当地旅行费用。

它会更自然,更接近真实情况。

用户的心理负担在会议上不太舒服。

没有测试主机。

如果可能,最好使用视频通话,以便我们可以记录图像,稍后我们可以观察用户的表情和反应,以获得更准确的测试结果。

缺点:没有办法实时跟进参与者的反应。

(2)面试

这种类型的测试非常困难。这意味着我们必须去公众拦截受访者,然后让他参加你的测试,因为人们很警觉,所以很多人会拒绝你。如果您想提高成功率,最好准备一些小礼物或其他小奖励,以帮助您提高成功率。

当然,你也很有可能获得成果。会有一些偏差。受访者将出于某种目的回答您的一些问题。这可能不是真的。因此,不建议每个人都使用此方法。

(3)测试完成

测试结束后,我们需要进行结果分析和统计。

通过测试测量的一些指标大致分为五个关键指标:准确度,响应速度,认知速度,清晰度,友好性和声音。

(4)注意事项

这里需要注意的是,您必须事先设置它以确定每个任务的符号是什么。如果没有标准,很难计算一个时期的结果,这是相当混乱的。

我们需要总结一下这是用户对问题的回答以及完成任务率错误的数量和类型等,找出用户的痛点,用户的一些干扰点。当任务错误时,用户可以自己解决吗?等等,需要绘制的一些具体结论是基于您要测试的一些目的。

通过这种方式,我们完成了整个可用性测试过程。

6.预测试

它需要在释放前进行一次并进行测试,但重量可能不会那么高,但这也是一个至关重要的步骤。

7.鉴定测试

最重要的是识别测试,它与整个产品的体验有关。整个测试过程需要使用三级置信度和N-Best列表,以及后台表来查找相应的问题节点并进行修复。

8.加载测试

当流量进入时,您必须了解您的设备,最大容量或流量会崩溃。体验非常糟糕。

9.结果评估

您仍然需要对效果进行评估。在测试运行开始之前,您需要设置目标并查看是否可以实现此目标。有什么影响?你满足了期望吗?任务的完成率也是成功的一个非常重要的指标。

10.试运行→发布

终于到了发布阶段。为了产品的安全性,我们仍将进行试运行。

11.迭代

如果可能,请重复之前的用户调查方法,然后在此阶段获得一些问题。我们需要实时跟踪系统故障并快速改进,这是我们需要做的。

总结

可能所有的语音交互过程都在这里,让我们简要回顾一下:

语音交互设计的起源

语音交互设计的设计原则 - 示例对话

确认原则/更正方法 - 3级置信度

可用性测试

发布

语音交互设计的未来在哪里?设计师的机会在哪里?

战略选择:世界一直不确定,如何处理?

眼睛和选择。

这是梁宁在《产品思维30讲》中所说的点线表面的战略选择问题。她可能会说这样一个例子:例如,有一对双胞胎,2010年一起大学毕业,一个进入腾讯,一个进入报纸。七年后,如果没有意外,腾讯的人应该有一百万的年薪,并且猎头公司正在街头挖掘,投资者正在挖掘,只要他们出来开办企业并给钱。那个去报社的人,报纸的情况,我们今天必须知道整个行业已经沉溺其中。他放置理想的整个行业都消失了。事实上,一切都需要重复。

在这个时候,并不是说双胞胎的个人品质有问题,或者他们的能力有问题。他们没有问题,他们也不是单独跟随他们的领导者。例如,我们与老板,老板的能力。积分和个人行为也没问题,但问题出在哪里?

问题在于这两个单位所依赖的经济体,其中一个正快速增长,另一个正在快速崩溃。您努力工作的公司的收入远低于2010年之前或2013年之前的收入,例如购买腾讯的股票,或者说您在北上买了一套房子,

我们是自己的一个观点。我们的观点需要与整个“快速线”相关联。战略和视力水平的选择尤为重要。它与努力工作同等重要。有时它有时候比努力工作更重要,但选择它也是努力积累的结果。

我们的设计师如何选择适应这个快速崛起的经济也是我们目前的机会,我们可以看到什么样的机会,我们想要依附于什么样的网络,在专业界限越来越模糊的时代,我们的能力提高和愿景可以很容易地应对未来的变化。

然后,随着人工智能的发展和5G的到来,我们的许多工作方法可能会被颠覆。语音交互的设计将是一片蓝色的海洋。虽然现在有很多瑕疵,但这是一个趋势,这是一个迅速崛起的趋势。趋势。设计师的工作你能想象未来没有展示吗?有臃肿的主人吗?等等,未来可能会发生,所有这一切都在发生.

无论世界如何变化,未来都可以预期,我们在路上.

参考文献:

《Designing Voice User Interfaces》(语音用户界面设计)

《U一点料1/2》

《产品思维30讲》 - 梁宁

作者:木七木七,请分享

本文最初由