기본 콘텐츠로 건너뛰기

목표의 사용성, 결과의 사용성

우리가 소프트웨어를 개발하고 테스트를 수행할 때는 항상 목표가 있습니다.

사용성 테스팅 역시 목표가 있습니다.

지금 제가 하고자 하는 얘기는 사용성 테스팅을 예로 드는 것이지만 사용성 테스팅을 다른 말로 바꾸셔서 이해하셔도 큰 무리가 없을 것이라고 생각합니다.

사용성 테스팅의 목표는 무엇일까요? 여러가지가 있겠지만 대표적으로 하나를 꼽는다면 사용자에게 좋은 경험을 주는 것이 목표일 것입니다.

사용자가 우리 제품을 사용함으로써 우리 제품에 대한 충성심을 가지는지, 원하는 작업을 쉽게 할 수 있는지 등이 우리가 사용성 테스팅을 통해 얻고자 하는 결과이고 그 결과가 사용성 테스팅의 목표가 됩니다.

그런데, 사실 목표와 결과는 조금 다릅니다.

대표적으로 목표는 시간, 돈 등으로 구체적으로 수치화 할 수 있습니다.

하지만 결과는 사람들이 느끼는 감정입니다. 감정은 수치화 할 수 없습니다.

예를 들어, 당신이 정말 좋아하는 사람이 생겼습니다. 그 사람과 사귀기 위해 참 많은 투자를 합니다.

꽃도 사주고, 영화도 보여주고, 맛있는 것도 사주고..

이 모든 과정들은 시간, 돈 등으로 측정이 가능합니다.

그러나 결과는 어떤가요? 여러분의 목표는 누군가와 사귄다였겠지만 그 것이 실제적인 결과로 도출될까요?

당신이 결혼을 하기 위해 상대방에게 '당신을 행복하게 해드리겠습니다'라는 말한다고 하더라도 당신이 생각하는 행복과 상대방이 생각하고 받아들이는 행복이 과연 같은 것일까요?

당신은 결혼이라는 결과를 생각했고 행복하게 해주겠다는 메시지로 그것을 전하려고 했지만 정말로 결혼을 승낙받을 수 있을지는 전혀 보장할 수 없습니다.

그저 그동안 당신이 결혼 승낙을 받기 위해 투자한 것들, 여행도 가고 음식도 사주고 영화도 보고 그러한 것들은 그 자체로 목표에 도달한 것이고 '음식이 비싸다.', '여행지가 어디이다.' 등은 그러한 목표에 도달한 한 부분으로 수치화가 가능한 것들이지만 그러한 목표들이 만들어낸 경험의 총합인 결혼 승낙이라는 결과는 봉장할수도 없고 수치화 할 수도 없습니다.

연예 시뮬레이션 게임처럼 여행에 몇점, 맛있는 음식에 몇점, 영화에 몇점 해서 총점 몇이 되면 결혼에 골인하는 그런 것이 아니라는 것입니다.

마찬가지로 고객의 작업 성공률을 80% 이상으로 한다는 사용성 테스팅의 목표는 세울 수 있습니다. 그리고 이러한 목표는 여러가지 방법으로 측정되고 수치화할 수 있습니다.

그러나 작업 성공률 80%의 결과가 긍정적일지 부정적일지는 아무도 알지 못합니다.

작업 성공률 80%를 위해 기능을 너무 쉽게 만들어 버린다면 사용자들은 그 기능에 매력을 느끼지 못할 수도 있습니다.

이것이 실제적인 결과입니다.

여러분은 작업 성공률 80%를 통해 고객이 쉽게 사용할 수 있는 제품을 목표로 했다면, 고객은 너무 쉬워 매력을 느끼지 못하는 기능이라는 것이 결과가 될 수 도 있습니다.

기존의 사용성 테스팅은 대체로 목표 중심이었습니다. 목표를 달성하는 것이 최고의 미덕이었습니다.

응답속도, 성공률 등 모든 것이 수치로 제공되고 그 목표치에 도달하면 사용성이 좋다고 판단되었습니다.

하지만 그렇게 사용성이 좋다고 측정된 제품들이 정말 사용성이 좋은 것이었을까요?

우리는 사용성이 좋은 제품을 목표로 했었는데 왜 전혀 다른 결과가 나온 것일까요?

그것은 우리가 결과를 지향한것이 아니라 목표에 몰입했기 때문입니다.

목표가 아닌 결과를 먼저 선택하고, 그 다음 구체적인 목표를 설정할 필요가 있습니다.

사용성 테스팅을 측정할 때, ISO/IEC 9126의 품질 매트릭을 먼저 설정하는 것이 아니라 정말 사용자에게 어떤 경험을 주고자 하는지에 대한 결과의 선택이 먼저 되어야 하고 그 결과를 이루기 위한 구체적인 목표는 그 다음에 설정되어야 합니다.

즉, 결과를 예측하지 못하고 목표를 설정하는 것은 매우 위험하다는 것입니다.

사용자가 원하는 결과를 예측하지 못하고 제품을 설계하고 테스트 하는 것은 사용자에게 원치 않는 강제 노역을 하게 할 수도 있습니다.

어떤 작업이 끝날때마다 알림창을 출력하도록 할 수도 있습니다. 하지만 너무 자주 출력되는 알림창은 사용자에게 오히려 생각과 작업의 흐름을 끊어버려 사용성이 더 좋지 않게 될 수도 있는 것입니다.

사용자에게 작업의 진행 상태에 대한 정보 제공에 충실하고자 했던 것이 오히려 사용자에게 좋지 않은 경험을 제공할 수도 있다는 것입니다.

때문에 결과를 예측하기 위해서는 규정이나 관습에서 벗어날 필요가 있습니다. 그리고 감정적으로 다가갈 필요가 있습니다.

결과는 경험입니다.

고객이 정말 행복한지 불행한지 측정하기 위해 고객이 과제를 성공한 경우가 몇 퍼센트나 되는지, 고객이 제품에 대한 점수로 10점 만점을 몇번이나 주었는지에 집중하게 된다면 이는 방향을 잘못 잡은 것입니다.

많은 경우 위와 같은 데이터 측정과 수집에만 몰입하고 그러한 데이터가 일정 수준을 만족하면 사용성이 좋은 것으로 만족을 해버립니다.

하지만 사용자가 실제로 이해하고 인식한 경험이 반영되지 못한 그런 데이터는 아무 짝에도 쓸모없는 데이터일 뿐입니다.

저런 데이터는 절대로 결과를 분명히 설명하지 못합니다. 그저 측정하고자 했던 목표에 대한 데이터일 뿐입니다.

사용성 테스팅이 고객의 행복이라는 결과를 보장하지는 못합니다. 단지 도움이 될 뿐이죠.

많은 사람들이 이걸 기억해 주었으면 합니다.

사용성이 좋다는 결과에 도달하기 위해 수많은 원칙들이 있지만 그러한 목표를 달성한다고 해서 그것이 꼭 좋은 사용성을 보장해주지는 못한다는 것입니다.

결론적으로 위의 내용을 정리해보자면..
  • 목표와 결과는 구분되어야 한다.
  • 높은 사용성이 목표라면 고객의 경험은 결과이다.
  • 우리의 목표가 결과가 되지는 않는다. 결과는 결코 보장할수도 없으며 예측하는 것은 더 어렵다.
따라서 사용성을 개선하고자 한다면 지금 현재 여러분의 목표를 버리고 결과부터 다시 규정할 필요가 있습니다.

이해성, 사용용이성과 같은 좁은 목표들에서 벗어나 좀 더 넓은 결과를 규정할 필요가 있습니다.

그리고 결과는 감정적일 필요가 있습니다.

사람들은 자신이 감정적으로 갈망하는 것이라면 그것을 달성하고자 하는 의욕을 갖게 됩니다.

단순히 작업 완료에 몇분, 작업 성공률 몇 %와 같은 목표는 사용자에게 제품을 사용하게 하고자 하는 의욕을 불러일으키지 못합니다.

그리고 사용성 테스팅은 기존의 목표 중심에서 사용자의 경험을 측정하기 위한 방법을 꾸준히 고민할 필요가 있습니다.

댓글

이 블로그의 인기 게시물

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁

탐색적 테스팅의 역사

이 글은 James Bach 의 ' Exploratory Testing 3.0 '을 번역한 글입니다. 이번 글은 의미를 전달하는데 무리가 없는 선에서 대부분 의역으로 번역되었습니다. 때문에 잘못 번역된 부분은 댓글로 남겨주시면 수정하도록 하겠습니다.(읽어보시면 시제나 문체가 시시각각으로 변합니다. 감안해서 읽어주시면 고맙겠습니다.) 이 글은 James Bach의 허락을 얻은 후 번역한 글로 다른 곳에 퍼가실때는 반드시 원 출처와 본 블로그를 같이 언급해주시기 바랍니다. ----- [저자 주: 다른 글에서 이미 탐색적 테스팅을 이제는 테스팅으로 불러야 한다는 것을 얘기했다. 사실 Michael은 2009년에 테스트에 대해 얘기했었고, James는 테스터에 대해 얘기했던 것을 2010년에 블로그에 작성했다. Aaron Hodder는 2011년에 직접적으로 언급했고 Paul Gerrard 역시 그러했다.우리는 모든 테스팅은 탐색적이라는 것을 깊이 이해하고 가르쳤지만(여기에 James가 작년에 한 학생과 대화를 나눈 예가 있다.), "탐색적 테스팅"이라는 용어를 더이상 사용하지 않을 준비가 되어 있지 않다. 지금도 우리는 탐색적 테스팅이라는 용어를 사용하지 말아야 한다고 주장하지는 않는다. 다만 테스팅이 탐색을 어느 정도 포함한 스크립트 테스팅을 의미하는 것이 아니라 테스팅이 곧 탐색적 테스팅이라는 것이다.] By James Bach and Michael Bolton 태초에 테스팅이 있었다. 아무도 탐색과 스크립트 테스팅을 구별하지 못했다. Jerry Weinberg는 1961년 Computer Programming Fundamentals에서 테스팅의 형식화(formalizing)에 주의를 표명하고 테스팅은 본질적으로 탐색이라고 설명했다. 그는 책에서 "프로그래머의 의도에 대한 많은 정보 없이 프로그램과 프로그래머의 의도가 얼마나 일치하는지 기계적으로 검사하는 것은 어렵다. 만약 검사를 위해 컴퓨터에 간단