1.用户测试的类型
汇总测试
· 目标:为了证明一个观点并回应一个假设,例如:“在x测量中a>B吗?“(与方案A和B的差别通常很小,仅在设计方面有所不同)
· 测试:需要对照实验,结果应该是可测量的(例如:A/B测试)
· 需要:10到20+个用户
· 定量方法
形成性测试
· 目标:要修复的标识问题,以及设计的哪个部分会导致问题
· 测试是面向任务的
· 关注用户在说什么、做什么和挣扎。
· 定性方法
2.你应该招募谁?
可用性测试的一般目的是查看用户组X(具有相似特征、行为或态度的用户)是否可以使用系统Y来执行活动Z。因此,您必须非常清楚你的用户是谁,以及你希望看到他们在你的测试中做什么。
在开始招募用户进行用户测试之前,应考虑以下特征:专业知识,特征,行为,态度。
专长:他们对通用计算机或数字产品的专长水平。
行为:他们对您正在测试的数字产品的体验水平。
特征:用户的背景(例如,如果您正在测试一个健康应用程序,您不能期望医生的知识水平与患者相同)
态度:数字产品的某些特性可能会触发用户,因此应该研究他们对某些问题(如隐私问题)的预先意见。
3.设计任务
这些任务是你要让参与者进行的活动,以使他们尝试使用数字产品来实现某些目标。因此,问问自己,该测试的目的是什么?我们首先要从该测试中找出什么?
这将从问题陈述开始,其中应包括用户组,数字项目及其提供的活动,例如:
经验丰富的在线购物者可以使用eBay查找和购买装饰品吗?
用户群:经验丰富的在线购物者
系统:eBay
活动:购买装饰品
在确定用户组和活动之后,就可以开始集思广益,讨论用户将在该活动范围内执行的特定操作。
良好导向任务的特点
总之,一项任务应具有以下特征:
· 与测试目标相关
· 实事求是、可核实
· 不应附有说明
细化它们,不要陷入只提及任务最终结果的陷阱,例如,想象一个任务被框为“购买新书”,首先问“用户为什么要购买那本书?”?,其背后的原因将掩盖购买它的目的,“用户想要一本书来学习如何烹饪”。
用户任务设置示例
目的:观察初学者在线学习是否能与FutureLearn有效互动,以获取课程内容。
主要任务:你正在寻找与用户体验相关的课程,你可以注册。它必须没有先决条件,必须在初级中级水平。你想要一门每周可以学习3小时的课程。它应该只运行6周,最好你可以尽快开始。
任务集
1)任务:在FutureLearn中创建帐户。
2)任务:查找与IT和计算机科学相关的课程列表。
3)任务:选择一门没有任何先决条件的课程,最好现在就可以,每周2小时就可以完成,而且只能持续2周。
4)任务:检查你的课程是否已成功添加到你的帐户/个人资料中。。
5)任务:找到一个运行时间不超过2周,研究生水平,成本低于800欧元的微型证书。
4.问卷调查和访谈
测验前问卷
在此阶段中,你将了解参与者的多样性维度,并仅询问与分析中使用的内容有关。此信息将帮助你解释在执行任务期间看到的内容。如果研究人员不希望用户之间的差异会影响性能,则也可以跳过此步骤。
测验后问卷
在参与者完成任务后应用。在测试后问卷中应避免使用自由文本回复。例如,使用表示同意程度的数字来提问:“使用该系统很容易”:强烈不同意— —强烈同意
可衡量的回应:
· 感知的可用性“您觉得系统的可用性如何?”
· 感知的有用性“您认为该系统对您实际需要做的事情有多有用?”
· 偏好或可取性方面:“您觉得该系统在美学上有多吸引人?他们相对于竞争产品的偏好是什么?”
测试后访谈
你可以使用“标记团队报告”技术标记后续行动。汇报可能包括:
· 跟进任务
· 他们被困的地方
· 错误的转弯
· 他们甚至没有注意到他们犯了错误的地方
· 提出的问题
· 重播任务并抛出他们在任务中遇到的问题
一般的问题:
您认为系统运行良好吗?
您认为系统最需要改进的地方?
如果要使用此系统,该怎么办?(认为??有用)
您认为该系统对谁最有价值?
如果您必须向某人解释系统的功能,您会说什么?
他们真的了解系统正在尝试做什么以及应该做什么吗?
您是否使用过与该系统具有类似功能的系统,您将如何比较它们?
最重要的是,“为什么”应该是进行这次采访时要问的核心问题。
可能出什么问题了?
注意需求特征(参与者倾向于给你想要的东西)默认偏差(提供积极反馈的可能性)和确认偏差(选择性地忽略了我们的信念)。也不要期望每个人都能给你有效的答案。
解决方法:
需求特征和默认偏差:通过要求诚实的反馈并注意不自然的答案,并说明测试的目的。
确认偏差:通过与无偏见的三方进行测试,不要分享你对测试结果的兴趣。
5.进行可用性测试
1)选择一组代表性的任务
2)试点测试:自己进行测试,找出成功完成该任务的模样以及执行的难易程度。
3)清除状态:如果需要,请从过去的参与者中删除数据(重置系统,清除缓存,搜索历史记录,撤消系统中的用户历史记录)
4)从轻到重组织任务
平均时间:完成所有任务的30–45分钟。
主持人应如何行动
首先介绍你自己和其他干预措施。重要的是要通过与参与者建立信任关系来定下基调,通过表现出他们的价值兴奋而热情,并通过用户测试明确目标。向他们展示您的角色,如何帮助评估和观察以及诚实反馈的重要性。而他们的角色是自愿帮助您评估系统,确保他们了解未测试的系统,它们可以随时停止并且不会被迫回答所有问题。如果可能,给予奖励并说“谢谢您的时间”。此外,不要通过给出指令来引导用户完成任务,Newman(2020)建议以下句子预先说明:
“我要你试着做这个任务。如果你陷入困境,你真的需要帮助,我会在这里。但我真的想让你尽你最大的能力来完成这件事,我们会讨论你后来遇到的问题。”
如何适度
· 测试前计划要准备面对问题
· 选择一个安静而私密的地方
· 记录您的测试会话(捕获视频和音频将使您以后可以进行所有分析)
· 使用日志记录表记录记录器的移动和进度
日志记录表使您能够组织任务分析并仅在测试过程中关注相关报告:
6.收集统计数据并分析结果
返回目标声明“用户X可以使用系统Y进行活动Z”,您需要:
· 收集以下统计信息:任务成功/失败;错误;定时
· 审查关键事件:哪里发生了故障?为什么会发生?
· 解释汇报反应
“任务成功非二进制结果”字体:(密歇根大学,2020年)
· 在执行的用户测试结束时,你应该已经收集了:
· 5–7次测试
· 用户可能尝试了25到50个任务
· 10小时的视频
· 一堆记录表
· 5–14个问卷
识别严重问题(主要发现)
在最终报告中,最突出的问题,或者换句话说,就是关键发现,为了做到这一点,应该首先强调:
1-描述问题“问题是在什么屏幕或页面上,或者在什么交互过程中发生?是否有特定条件在多长时间内发生?”
2-提供证据:指出造成问题的严重事件(例如:任务失败,时间延长)。
3-通过提出建议或进行其他研究来找到解决方案的行动方案,以找到其他数字产品的合适示例,设计原则或启发式方法(适用于这种情况的良好可用性实践的一般原则),以了解如何解决此问题以及是否需要其他研究。
对于不太严重的问题:
· 描述发现,描述和严重性等级
· 提供附录
解释结果
总结你的结果,查看事件和通知方式。为什么会发生问题,违反了哪些可用性原则,是否有根本原因?
报告中
· 格式应由受众和目的决定
· 如果是“个人”项目:优先列表就足够了,但是如果你与团队合作,则报告应包括:列出关键发现;不太严重的清单;证据。
· 如果这是给外部利益相关者的:专注于正式报告,强调方法以及您如何提出任务,以便他们可以了解结果的出处。
本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理