기본 콘텐츠로 건너뛰기

사용성 테스팅 - TDD(Testability Driven Design)

사용성 테스팅 만큼 쉬우면서도 어려운 것이 있을까?

사용성 테스팅에서 가장 어려운 것은 역시 테스트 오라클이 명확하지 않다는 것이다.

그리고 테스트 오라클을 협의하고 정하는 것 자체도 쉽지 않다.

더 큰 문제는 협의하고 정한 테스트 오라클이라 할지라도 고객이 그것에 동의할 것인지, 테스트 오라클이 제대로 정해졌는지에 대해 확신할 만한 근거가 부족하다는 것이다.

아래 글은 이러한 사용성 테스팅에 대한 테스트 오라클을 정하는 데에 있어 그 기준으로 생각할 만한 것에 대한 나의 의견이다.

자 한가지 예를 통해서 설명해 보도록 하겠다.

우리가 윈도우를 사용하면서 어떤 이유로든 더 이상 필요없는 파일은 깔끔하게 삭제해 버림으로써 하드 디스크의 용량을 늘리고 있다. 아 .. 머 요즘은 하드 디스크 용량이 좀 널널하게 남아돌기도 하지만서도..

어쨌든..

여기서 중요한 것은 파일 삭제이다.

그럼 첫번째.. 파일 삭제에 있어서 고객에게 가장 큰 가치는 무엇일까?

사람마다 모두 다른 답이 나오겠지만 적어도 나에게는 삭제하면 제깍 삭제되고 혹시라도 잘못 삭제했다면 제깍 복구할 수 있어야 한다라고 답하고 싶다..

그러면 윈도우의 파일 삭제 과정을 한번 낱낱이 생각해 보자.


첫눈에 딱 봐도 복잡하지 않는가?

일반적으로 우리는 가장 오른쪽의 경우만을 알고 있다. 그리고 왜 문제인지 잘 알지 못한다.

가장 오른쪽의 경우 첫번째 문제점은 파일 삭제 여부를 묻는 확인창이다.

많은 사람들은 그것이 왜 문제인가? 라고 물을 것이다.

내가 처음에 파일 삭제의 가치에 대해 말을 할 때 전제조건은 제깍이었다. 이것은 즉시 삭제되기를 원한다는 것이었다.

실제 생활에서 만약 당신이 화장실에서 편안함 속에 화장지를 휴지통에 버리려는 순간 이 휴지통이 건방지게 당신이 휴지를 버리겠다는 확고한 확신을 보여야만 휴지를 버릴 수 있습니다라는 메시지와 함께 지문 인식을 원한다면 어떤 느낌이 들 거라고 생각하는가?

동일한 경우지만 이것을 받아들이는 느낌은 사뭇 다르다. 이것이 학습의 결과이다.

많은 사람들은 대부분 파일 삭제를 할 때 경고창의 메시지는 확인하지 않는다. 그냥 예스를 누를 뿐이다. 왜냐하면 예스를 누른다고 하더라도 휴지통에서 파일을 복원할 수 있다는 것을 알고 있고 그것이 신뢰할 수 있다는 것을 학습을 통해 이미 알고 있기 때문이다.

하지만 이러한 흐름은 고객의 가치를 해치게 된다. 우선은 확인창이 떠야 하고 확인 버튼을 누르는데 아주 작지만 약간의 시간이 필요하다. 그 짧은 시간이 무슨 의미가 있느냐고 하겠지만 티끌 모아 태산인 것이다.

이러다 보니 이제 윈도우 좀 안다는 파워 유저들은 이 확인창이 무척이나 신경이 쓰이고 귀찮아졌다. 그리하여 나온 편법이 Shift+Del이었다.

하지만 이 역시 키를 조합하여 눌러야 하기 때문에 무척이나 귀찮은 일이 되어버렸다.

그리하여 마침내 휴지통의 속성창을 열어서 설정을 아예 바꿔버리게 되었다.

파일 하나를 지우기 위해 우리는 이렇게 많은 경우의 수를 생각하고 투자를 하게 되었다. 그렇게 함으로써 어찌 되었든 파일을 바로 즉시 즉시 지울 수 있게 되었다.

하지만 우리는 그렇게 함으로써 파일을 복원할 수 있는 가치를 영구히 훼손해 버렸다.

빠르게 지우기 위해서 우리는 단축키나 설정을 바꾸기 위해 투자를 하였다. 하지만 그 투자는 파일 복원이라는 가치를 영원히 훼손시켜 버렸다.

만약 우리가 파일 복원이라는 가치를 지키기 위해서는 파일을 삭제하기 위한 투자를 늘려야 한다.

왜 이런 일이 벌어진 것일까? 왜냐하면 인간은 게으르기 때문이다. 인간은 특정한 가치를 동일하게 얻을 수 있다면 더 적은 노력과 유지비용만을 지불하기를 원하기 때문이다.

다만 이 경우는 더 적은 노력과 유지 비용을 지불하기 위한 노력이 결국은 쓰루풋을 훼손시켜 버린 것이다.

TOC적인 관점에서 본다면 이 두가지 모두 좋지 않은 것이 된다.

첫번째는 투자를 늘렸지만 쓰루풋은 훼손되어 버렸다.

두번째는 투자를 늘렸지만 쓰루풋은 늘어나지 않았다.

이러한 이유로 윈도우의 파일 삭제는 고객에게 아무런 가치를 줄 수 없는 사용성이 낮은 경우가 된 것이다.

기능상으로는 아무런 문제도 없다. 그리고 많은 경우 이것이 왜 사용성이 낮은 것인지에 대한 아무런 반감이 없다. 그 이유는 우리가 학습이 되어버렸기 때문이다.

아래는 우분투의 파일 삭제 과정이다.
이 얼마나 아름다운가?

내가 처음 우분투에서 파일을 삭제했을 때 난 커다란 혼란과 두려움에 사로잡혔다.

왜냐하면 윈도우에서 언제나 보던 확인창이 뜨지 않았던 것이다. 이것은 내가 학습해 놓은 상황에 완전히 대치되는 상황이었다.

하지만 내가 삭제한 파일은 안전하게 휴지통에 들어가 있었고 난 이로써 새로운 학습에 성공하고 새로운 신뢰를 쌓았다.

우분투의 경우는 쓰루풋을 훼손하지 않으면서 내가 투자해야할 대상은 획기적으로 줄였다.

난 단축키를 사용하지 않아도 되고, 난 설정을 바꿀 필요도 없었다.

그저 지우면 휴지통으로 파일이 이동되었고 원하면 복원하면 되었다.

사용성을 평가하기 위한 과정을 간단히 정리하면 아래와 같이 생각해 볼 수 있다.

먼저
  1. 테스트하고자 하는 대상 또는 기능에 대한 핵심적인 가치를 정의한다.
  2. 가치에 도달하기 위한 가장 적은 투자와 유지비용이 들어가는 경로를 산출한다.
즉, 고객의 가치를 도달하기 위한 가장 적은 투자와 유지비용이 들어가는 경로가 바로 테스트 오라클이 되는 것이다.

다른 말로 하면 사용성이 높은 제품은 고객이 적은 투자와 유지 비용만을 사용한 상태에서 최상의 가치를 얻을 수 있는 제품이다.

우리는 의외로 주변에서 그런 제품을 쉽게 찾아볼 수 있다.

대표적인 것이 삼성과 애플의 MP3만 봐도 알 수 있다.

그런데 이 내용을 잘 살펴보면 이것은 테스팅 보다는 설계에 관한 내용에 더욱 가깝다.

난 이것을 TDD(Testability Driven Design)이라고 부른다.

내가 만들어낸 말이지만 실제로 나와 유사한 생각을 하는 사람들이 있는 것으로 안다.

요지는 설계를 할 때 테스트 가능성, 용이성을 고려하여 설계해야한다는 것이다.

윈도우의 경우가 테스트 용이성을 고려하지 않고 설계한 것이라고 가정한다면 윈도우의 경우는 많은 경우의 수를 테스트 해야한다.

확실히 우분투보다는 테스트를 수행하기 위한 리소스가 더 많이 필요하다는 것을 알 수 있다.

처음부터 고객에게 전달해야하는 핵심 가치와 그 가치에 도달하는 최단 과정을 고려하고 그러한 과정이 테스트를 수행함에 있어 얼마나 용이한지 고려하여 설계한다면 분명 테스트에 들어가는 리소스를 획기적으로 줄일 수 있다고 생각한다.

많은 경우 테스팅이 전체 개발 과정에서 가장 많은 비용과 일정이 들어가는 병목이 된다. 이것을 기획 단계 즉 설계 부터 고려한다면 분명 획기적인 개선이 있을 것이다.

이것이 TOC에서의 DBR의 핵심과 일맥상통한다고 생각한다.

위의 경우에서 생각해 보더라도 윈도우의 경우에 싸이클로메틱 복잡도(cyclomatic complexity)로 계산해본다면 3의 복잡도를 가진다. 하지만 우분투는 0이다.

Cyclomatic Complexity = 분기노드 개수 + 1로 계산할 수 있다.

Cyclomatic Complexity는 쉽게 말해서 테스트해봐야 하는 경로의 개수라고 할 수 있다. 이것이 높다는 것은 필요한 테스트케이스가 그만큼 많으므로 오류를 모두 확인하지 못할 확률이 더 높다는 것이다. 보통 3~7 사이의 값을 권장하며, 10 이상은 지양하는 것을 권장한다.


처음 설계에 있어서 테스트 용이성을 고려하여 설계함으로써 코딩과 테스트 모두에 들어가는 리소스를 절약하고 고객에게 전달해야 하는 가치를 지킬 수 있다는 것이 나의 생각이다.

이에 관련해서 의견 있으신 분은 트랙백이나 댓글로 의견을 좀 더 나누었으면 한다.

댓글

  1. trackback from: 좋은 디자인이란?
    요즘 팀에서 '설계'에 대한 교육과정을 만들고 있습니다. TDD 메일링 리스트를 읽던 중 좋은 디자인 good design 이란 단어가 눈에 띄어 옮겨봤습니다. 밥 아저씨가 한 말입니다. One reasonable definition of good design is testability. It is hard to imagine a software system that is both testable and poorly designed. It is al..

    답글삭제
  2. 김주봉5/7/10 12:06

    좋은 글 감사합니다~

    답글삭제

댓글 쓰기

이 블로그의 인기 게시물

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁

탐색적 테스팅의 역사

이 글은 James Bach 의 ' Exploratory Testing 3.0 '을 번역한 글입니다. 이번 글은 의미를 전달하는데 무리가 없는 선에서 대부분 의역으로 번역되었습니다. 때문에 잘못 번역된 부분은 댓글로 남겨주시면 수정하도록 하겠습니다.(읽어보시면 시제나 문체가 시시각각으로 변합니다. 감안해서 읽어주시면 고맙겠습니다.) 이 글은 James Bach의 허락을 얻은 후 번역한 글로 다른 곳에 퍼가실때는 반드시 원 출처와 본 블로그를 같이 언급해주시기 바랍니다. ----- [저자 주: 다른 글에서 이미 탐색적 테스팅을 이제는 테스팅으로 불러야 한다는 것을 얘기했다. 사실 Michael은 2009년에 테스트에 대해 얘기했었고, James는 테스터에 대해 얘기했던 것을 2010년에 블로그에 작성했다. Aaron Hodder는 2011년에 직접적으로 언급했고 Paul Gerrard 역시 그러했다.우리는 모든 테스팅은 탐색적이라는 것을 깊이 이해하고 가르쳤지만(여기에 James가 작년에 한 학생과 대화를 나눈 예가 있다.), "탐색적 테스팅"이라는 용어를 더이상 사용하지 않을 준비가 되어 있지 않다. 지금도 우리는 탐색적 테스팅이라는 용어를 사용하지 말아야 한다고 주장하지는 않는다. 다만 테스팅이 탐색을 어느 정도 포함한 스크립트 테스팅을 의미하는 것이 아니라 테스팅이 곧 탐색적 테스팅이라는 것이다.] By James Bach and Michael Bolton 태초에 테스팅이 있었다. 아무도 탐색과 스크립트 테스팅을 구별하지 못했다. Jerry Weinberg는 1961년 Computer Programming Fundamentals에서 테스팅의 형식화(formalizing)에 주의를 표명하고 테스팅은 본질적으로 탐색이라고 설명했다. 그는 책에서 "프로그래머의 의도에 대한 많은 정보 없이 프로그램과 프로그래머의 의도가 얼마나 일치하는지 기계적으로 검사하는 것은 어렵다. 만약 검사를 위해 컴퓨터에 간단