기본 콘텐츠로 건너뛰기

충분한 소프트웨어 테스팅이란?

소프트웨어 테스터로서 겪는 딜레마 중 하나가 도데체 얼마나 테스트를 해야 충분한가?에 대한 문제입니다.

경영진을 포함해서 많은 사람들이 테스트 결과 보고서를 보면서 말합니다.

테스트가 충분히 진행되었나요? 결함은 없나요? 출시해도 괜찮은거죠?

이 질문들에 확신에 찬 대답으로 '물론입니다'라고 대답할 수 있는 테스터가 과연 있을수가 있기나 한지 의문이 듭니다.

이런 문제는 소프트웨어가 형체가 정의되지 않은 불확정성을 내포한 상태이기 때문이라고 생각합니다.

예를 들어, 하드웨어라 한다면 우리가 테스트를 해야할 범위와 한계가 명확해집니다.

우리가 먹는 식품이라면 구성 성분들이 인체에 유해한지 검사하고 그 과정 전체를 관리 감독하는 것이 불가능하지 않을 것입니다.

재료의 선정부터 출시까지 일관된 기준으로 검사와 관리가 가능합니다.

하지만 소프트웨어는 어떨까요?

요구사항을 수집, 분석, 정의해서 나온 산출물과 아키텍처가 설계한 산출물, 개발자의 코드, 디자이너들의 산출물 어느 하나 공통된 것이 없습니다.

다양한 형태의 산출물간의 추적성 설정조차 어려울 지경입니다.

과연 이 모든것들을 일관된 기준으로 검사와 관리가 가능하긴 한걸까요?

소프트웨어란 도데체 무엇일까요?

저는 소프트웨어를 아래 3가지 구성요소로 정의합니다. 이 정의는 테스터로서 바라보는 소프트웨어에 대한 정의입니다.

소프트웨어란 입력값(Input)출력값(Output) 그리고 데이터(Data)로 구성된 논리적 집합체이다.

그렇다면 우리가 충분한 테스트를 했는가는 소프트웨어에 입력해야 할 값과 출력되어 나오는 값 그리고 그 과정에 사용되는 데이터를 모두 테스트 했는가로 추적해 볼 수 있다고 생각합니다.

대부분의 설계 기법이 이 과정에 대한 논리식과 데이터 생성에 초점이 맞추어져 있습니다.

경계값 분석이나 동등분할은 입력값 또는 출력값의 데이터 검증에 초점이 맞추어져 있습니다.

결정 테이블, 원인 결과 그래프, 상태 전이, 시나리오 테스팅과 같은 기법들은 논리식의 검증에 초점이 맞추어져 있습니다.

그러면 이렇게 입력값과 출력값 그리고 데이터에 대한 검증만으로 충분할까요?

문제는 이건 소프트웨어 자체에 대한 테스트일뿐입니다.

소프트웨어는 운용하는 사용자와 환경에 따라 매우 다양하게 변용됩니다.

누가 사용하는가? 어떤 환경에서 사용하는가? 에 대한 테스트가 추가로 필요합니다.

그래서 아래와 같은 요소들을 추가로 고려해야한다고 봅니다.

조건(Condition), 정황(Context)

그런데, 조건이나 정황은 입력값, 출력값, 데이터와 달리 쉽게 정의하기 어렵고 변수가 너무 많습니다. 때문에 많은 테스터들이 이 부분에 대한 테스트를 수행하지 못하거나 충분하게 고려하지 못합니다.

RST에서는 이러한 부분에 대하여 아래와 같이 7가지 구성요소를 제안합니다.

1. 구조 (Structure)
2. 기능 (Function)
3. 데이터 (Data)
4. 인터페이스 (Interfaces)
5. 플랫폼 (Platform)
6. 운용 (Operations)
7. 시간 (Time)

그러면 이것으로 충분한가?

사실은 이것으로도 부족합니다.

저는 여기에 ISO/IEC/IEEE 25010 소프트웨어 품질 특성을 추가로 고려합니다.

그렇게 저는 커버리지를 측정할 때 위의 7가지 구성요소소프트웨어 품질 특성을 함께 고려해서 사용합니다.

그런데 이로써 문제가 해결된것인가? 아닙니다.

무엇을 측정할지는 정해졌는데 이걸 어떻게 측정하는가에 대한 문제가 남았습니다.

왜냐하면 각각의 요소들마다 모수가 불명확하다는 것이 문제입니다.

모수를 측정할 수 있다는 분들도 계시디만 소프트웨어는 하드웨어와 달리 이 모수가 소프트웨어가 종료되어 사라지는 순간까지 지속적으로 변한다는 것입니다.

고로 어제의 100%와 오늘의 100%는 완전히 다른 얘기가 됩니다.

그러면 도데체 이걸 어떻게 측정하는가?

사실 이 부분에 대해서는 저도 아직까지는 명확하게 얘기를 하지 못합니다.

제임스 바크나 정황 주도 학파에 몸 담고 있는 사람들, RST 진영 쪽에 있는 분들이 강조하는 것은 테스터들의 책임감입니다.

내 이름과 양심을 걸고 하늘을 우러러 한점 부끄러움 없는 테스트를 했는가?

그래서 저도 매번 테스트를 할때마다 저에게 되묻습니다.

내가 놓친것은 없는가?
내가 고려하지 못한 것이 있는가?

충분한 소프트웨어 테스팅이란 결국 자신과의 싸움이고 타인이 나에게 보내는 신뢰라고 생각합니다.

무엇을 테스트할 것인가에 대한 것은 조금만 고민해보면 어느 정도까지는 쉽게 정의할 수 있습니다.

경험이 누적되면 이것은 점점 더 쉬워집니다.

그런데 그것을 얼마나 충분히 고려하여 테스트를 수행했는가는 아직까지도 참 많이 어렵습니다.

경영진이나 이해관계자들 특히 우리 나라처럼 정량 분석 데이터를 좋아하는 사람들이 많을때는 이것이 참 어렵습니다.

가끔은 그 사람들 입맛에 맞춰 보기좋게 포장을 하기도 합니다.

하지만 중요한 것은 그런 숫자보다는 스스로 자부심을 느끼기에 충분할 만큼 떳떳한가? 이해관계자가 내 테스트를 신뢰하고 지원하는가? 가 아닐까 싶습니다.

그런 신뢰를 얻기 위해 나는 최선을 다해 노력하고 있는가? 라고 스스로 물어보는게 중요하다고 생각합니다.

스스로에게 떳떳하고 이해관계자의 신뢰를 얻고 있다면 저는 그것이 충분한 소프트웨어 테스팅이라고 생각합니다.

-----

글을 쓰는 건 항상 어렵습니다. 머리 속에 떠다니던 생각을 끄집어내어 한줄 글로 표현하는 것이 참 어렵습니다.

생각을 글로 적다보면 생각해 두었던 내용이 사라지고 바뀌고 글로 표현하지 못하는 경우도 생깁니다.

글을 쓰는 법을 제대로 배우지 못한 무식의 소치라고 치부하기에도 부끄러운 글을 계속 쓰는 것이 맞는지 가끔 고민을 합니다.

이 글도 용두 사미 같아 부끄럽습니다.

제가 적는 글을 읽어보시고 반론이나 궁금한 내용을 댓글로 적어주시면 저에게 많은 도움이 됩니다.

이번에도 제 글을 읽어주셔서 고맙습니다.

댓글

이 블로그의 인기 게시물

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁

탐색적 테스팅의 역사

이 글은 James Bach 의 ' Exploratory Testing 3.0 '을 번역한 글입니다. 이번 글은 의미를 전달하는데 무리가 없는 선에서 대부분 의역으로 번역되었습니다. 때문에 잘못 번역된 부분은 댓글로 남겨주시면 수정하도록 하겠습니다.(읽어보시면 시제나 문체가 시시각각으로 변합니다. 감안해서 읽어주시면 고맙겠습니다.) 이 글은 James Bach의 허락을 얻은 후 번역한 글로 다른 곳에 퍼가실때는 반드시 원 출처와 본 블로그를 같이 언급해주시기 바랍니다. ----- [저자 주: 다른 글에서 이미 탐색적 테스팅을 이제는 테스팅으로 불러야 한다는 것을 얘기했다. 사실 Michael은 2009년에 테스트에 대해 얘기했었고, James는 테스터에 대해 얘기했던 것을 2010년에 블로그에 작성했다. Aaron Hodder는 2011년에 직접적으로 언급했고 Paul Gerrard 역시 그러했다.우리는 모든 테스팅은 탐색적이라는 것을 깊이 이해하고 가르쳤지만(여기에 James가 작년에 한 학생과 대화를 나눈 예가 있다.), "탐색적 테스팅"이라는 용어를 더이상 사용하지 않을 준비가 되어 있지 않다. 지금도 우리는 탐색적 테스팅이라는 용어를 사용하지 말아야 한다고 주장하지는 않는다. 다만 테스팅이 탐색을 어느 정도 포함한 스크립트 테스팅을 의미하는 것이 아니라 테스팅이 곧 탐색적 테스팅이라는 것이다.] By James Bach and Michael Bolton 태초에 테스팅이 있었다. 아무도 탐색과 스크립트 테스팅을 구별하지 못했다. Jerry Weinberg는 1961년 Computer Programming Fundamentals에서 테스팅의 형식화(formalizing)에 주의를 표명하고 테스팅은 본질적으로 탐색이라고 설명했다. 그는 책에서 "프로그래머의 의도에 대한 많은 정보 없이 프로그램과 프로그래머의 의도가 얼마나 일치하는지 기계적으로 검사하는 것은 어렵다. 만약 검사를 위해 컴퓨터에 간단