기본 콘텐츠로 건너뛰기

충분한 소프트웨어 테스팅이란?

소프트웨어 테스터로서 겪는 딜레마 중 하나가 도데체 얼마나 테스트를 해야 충분한가?에 대한 문제입니다.

경영진을 포함해서 많은 사람들이 테스트 결과 보고서를 보면서 말합니다.

테스트가 충분히 진행되었나요? 결함은 없나요? 출시해도 괜찮은거죠?

이 질문들에 확신에 찬 대답으로 '물론입니다'라고 대답할 수 있는 테스터가 과연 있을수가 있기나 한지 의문이 듭니다.

이런 문제는 소프트웨어가 형체가 정의되지 않은 불확정성을 내포한 상태이기 때문이라고 생각합니다.

예를 들어, 하드웨어라 한다면 우리가 테스트를 해야할 범위와 한계가 명확해집니다.

우리가 먹는 식품이라면 구성 성분들이 인체에 유해한지 검사하고 그 과정 전체를 관리 감독하는 것이 불가능하지 않을 것입니다.

재료의 선정부터 출시까지 일관된 기준으로 검사와 관리가 가능합니다.

하지만 소프트웨어는 어떨까요?

요구사항을 수집, 분석, 정의해서 나온 산출물과 아키텍처가 설계한 산출물, 개발자의 코드, 디자이너들의 산출물 어느 하나 공통된 것이 없습니다.

다양한 형태의 산출물간의 추적성 설정조차 어려울 지경입니다.

과연 이 모든것들을 일관된 기준으로 검사와 관리가 가능하긴 한걸까요?

소프트웨어란 도데체 무엇일까요?

저는 소프트웨어를 아래 3가지 구성요소로 정의합니다. 이 정의는 테스터로서 바라보는 소프트웨어에 대한 정의입니다.

소프트웨어란 입력값(Input)출력값(Output) 그리고 데이터(Data)로 구성된 논리적 집합체이다.

그렇다면 우리가 충분한 테스트를 했는가는 소프트웨어에 입력해야 할 값과 출력되어 나오는 값 그리고 그 과정에 사용되는 데이터를 모두 테스트 했는가로 추적해 볼 수 있다고 생각합니다.

대부분의 설계 기법이 이 과정에 대한 논리식과 데이터 생성에 초점이 맞추어져 있습니다.

경계값 분석이나 동등분할은 입력값 또는 출력값의 데이터 검증에 초점이 맞추어져 있습니다.

결정 테이블, 원인 결과 그래프, 상태 전이, 시나리오 테스팅과 같은 기법들은 논리식의 검증에 초점이 맞추어져 있습니다.

그러면 이렇게 입력값과 출력값 그리고 데이터에 대한 검증만으로 충분할까요?

문제는 이건 소프트웨어 자체에 대한 테스트일뿐입니다.

소프트웨어는 운용하는 사용자와 환경에 따라 매우 다양하게 변용됩니다.

누가 사용하는가? 어떤 환경에서 사용하는가? 에 대한 테스트가 추가로 필요합니다.

그래서 아래와 같은 요소들을 추가로 고려해야한다고 봅니다.

조건(Condition), 정황(Context)

그런데, 조건이나 정황은 입력값, 출력값, 데이터와 달리 쉽게 정의하기 어렵고 변수가 너무 많습니다. 때문에 많은 테스터들이 이 부분에 대한 테스트를 수행하지 못하거나 충분하게 고려하지 못합니다.

RST에서는 이러한 부분에 대하여 아래와 같이 7가지 구성요소를 제안합니다.

1. 구조 (Structure)
2. 기능 (Function)
3. 데이터 (Data)
4. 인터페이스 (Interfaces)
5. 플랫폼 (Platform)
6. 운용 (Operations)
7. 시간 (Time)

그러면 이것으로 충분한가?

사실은 이것으로도 부족합니다.

저는 여기에 ISO/IEC/IEEE 25010 소프트웨어 품질 특성을 추가로 고려합니다.

그렇게 저는 커버리지를 측정할 때 위의 7가지 구성요소소프트웨어 품질 특성을 함께 고려해서 사용합니다.

그런데 이로써 문제가 해결된것인가? 아닙니다.

무엇을 측정할지는 정해졌는데 이걸 어떻게 측정하는가에 대한 문제가 남았습니다.

왜냐하면 각각의 요소들마다 모수가 불명확하다는 것이 문제입니다.

모수를 측정할 수 있다는 분들도 계시디만 소프트웨어는 하드웨어와 달리 이 모수가 소프트웨어가 종료되어 사라지는 순간까지 지속적으로 변한다는 것입니다.

고로 어제의 100%와 오늘의 100%는 완전히 다른 얘기가 됩니다.

그러면 도데체 이걸 어떻게 측정하는가?

사실 이 부분에 대해서는 저도 아직까지는 명확하게 얘기를 하지 못합니다.

제임스 바크나 정황 주도 학파에 몸 담고 있는 사람들, RST 진영 쪽에 있는 분들이 강조하는 것은 테스터들의 책임감입니다.

내 이름과 양심을 걸고 하늘을 우러러 한점 부끄러움 없는 테스트를 했는가?

그래서 저도 매번 테스트를 할때마다 저에게 되묻습니다.

내가 놓친것은 없는가?
내가 고려하지 못한 것이 있는가?

충분한 소프트웨어 테스팅이란 결국 자신과의 싸움이고 타인이 나에게 보내는 신뢰라고 생각합니다.

무엇을 테스트할 것인가에 대한 것은 조금만 고민해보면 어느 정도까지는 쉽게 정의할 수 있습니다.

경험이 누적되면 이것은 점점 더 쉬워집니다.

그런데 그것을 얼마나 충분히 고려하여 테스트를 수행했는가는 아직까지도 참 많이 어렵습니다.

경영진이나 이해관계자들 특히 우리 나라처럼 정량 분석 데이터를 좋아하는 사람들이 많을때는 이것이 참 어렵습니다.

가끔은 그 사람들 입맛에 맞춰 보기좋게 포장을 하기도 합니다.

하지만 중요한 것은 그런 숫자보다는 스스로 자부심을 느끼기에 충분할 만큼 떳떳한가? 이해관계자가 내 테스트를 신뢰하고 지원하는가? 가 아닐까 싶습니다.

그런 신뢰를 얻기 위해 나는 최선을 다해 노력하고 있는가? 라고 스스로 물어보는게 중요하다고 생각합니다.

스스로에게 떳떳하고 이해관계자의 신뢰를 얻고 있다면 저는 그것이 충분한 소프트웨어 테스팅이라고 생각합니다.

-----

글을 쓰는 건 항상 어렵습니다. 머리 속에 떠다니던 생각을 끄집어내어 한줄 글로 표현하는 것이 참 어렵습니다.

생각을 글로 적다보면 생각해 두었던 내용이 사라지고 바뀌고 글로 표현하지 못하는 경우도 생깁니다.

글을 쓰는 법을 제대로 배우지 못한 무식의 소치라고 치부하기에도 부끄러운 글을 계속 쓰는 것이 맞는지 가끔 고민을 합니다.

이 글도 용두 사미 같아 부끄럽습니다.

제가 적는 글을 읽어보시고 반론이나 궁금한 내용을 댓글로 적어주시면 저에게 많은 도움이 됩니다.

이번에도 제 글을 읽어주셔서 고맙습니다.

댓글

이 블로그의 인기 게시물

테슬라 악세사리 구매 후기

테슬라를 구매하면서 알리와 네이버 페이에서 이런 저런 악세사리를 정말 엄청나게 구매했습니다. 스파크 13년의 경험을 총동원해서 어머 이건 꼭 사야지~~ 라고 생각되는건 모두 구매해봤습니다. 실제 비용은 쿠폰과 포인트로 조금씩 달라질 수 있기 때문에 구매한 제품과 구매 링크 그리고 간단한 후기만 남겨보도록 하겠습니다. 1. 하이패스(AP500S) 뭐.. 얼마 안 있으면 하이패스가 필요없어진다는 얘기도 있지만.. 시범 사업 이후에 전국 고속도로에 설치되려면 아직 멀었고 뭐.. 말이 필요없는 필수품이죠.. 테슬라 카페이서 추천하는거 구매해봤습니다. TKC에서 공구하는건 이걸 구매하고 나서 알게 되었네요.. 네이버 공식샵에서 구매했습니다.  설치 후 동작은 잘 되는데.. 센터 콘솔 안에 위치한 시거잭에 설치하고 뚜껑을 닫았더니.. 음량을 최대 5로 설정해도 동작음이 잘 들리지를 않습니다. 그래서 이게 제대로 결제가 된건지 안된건지 알 수 없는게 유일한 불만이고.. 작고 잘 동작하고 좋습니다. https://smartstore.naver.com/gair/products/4776415369 2. 액정 보호 필름(스코코) https://brand.naver.com/skoko/products/9882239107 좋다고 해서 구매해봤는데.. 솔직히 모르겠습니다. 그리고 미묘하게 크기가 안맞습니다. 테슬라 모니터 테두리가 곡면이라서 그런것 같습니다. 샵에서 붙여 달라고 했는데.. 제래도 붙지 않고 계속 기포가 생깁니다. 점착력이 떨어지는건지.. 혹시 몰라서 한번 더 구매해서 다시 붙여보려고 합니다. 무엇보다 비싸기 때문에.. 무반사 이런거에 큰 관심 없으시면 다른 적당히 저렴한거 구매하시는게 나을 것 같기도 합니다. 3. 도어 커버(카마루) https://blessauto.kr/products/37263 생각보다 얇고 얘도 생각보다 잘 안맞습니다. 미묘하게 좀 큽니다. 제가 똥손이라서 잘 못붙여서 그런것일 수도 있습니다. 막상 붙이고 나면 감촉도 좋고.. 관리하기 편합니다. 브

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁