기본 콘텐츠로 건너뛰기

메트릭.. 그거 측정해서.. 뭐할라고? (대부분의 메트릭은 쓸모없다.)

2009년부터 4년 넘게 이 공간에 쓸데 없이 주절 주절 소프트웨어 테스팅과 관련이 있다고 생각하는 글을 137편을 끄적거렸습니다.

매달 2편 정도의 글을 썼습니다.

그다지 많이 쓰지도 않았는데.. 이제는 예전에 제가 무슨 글을 썼는지 잘 기억이 안납니다.

이 블로그 서비스는 구글이 제공하는 서비스임에도 불구하고 검색 기능은 아주... 엉망인지라...

지금 쓰고자 하는 이 글도 예전 언젠가 썼었던 기억이 있는데..

아무리 찾아보아도 아니보여서 다시 써봅니다.

이번에 제가 얘기하고 싶은 주제는 메트릭입니다.

우리는 소프트웨어를 개발하고 테스트를 진행하면서 제품의 품질과 테스트의 진척을 판단하기 위해 꽤 많은 메트릭을 사용하고 있습니다.

결함 갯수, 수정된 결함 수, 잔존 결함 수, 결함 수정 기간, 작성된 테스트 케이스 수, 품질 지표, 실행된 테스트 케이스 수, 실패한 테스트 케이스 수 등등등...

정말로 많은 메트릭 종류가 있습니다.

그리고 이러한 메트릭을 기반으로 사람을 평가하고 제품을 평가합니다.

많은 조직에서는 좀 더 의미있는 메트릭을 수집하고자 매우 많은 노력을 하고 있습니다.

그래서.. 그 많은 메트릭을 수집하셔서 품질이 좀 나아지셨습니까? 테스터의 역량이 향상되셨습니까? 개발자로부터 유입되는 결함은 좀 줄어드셨나요?

물론, 괄목할만한 성과를 얻는 조직도 있습니다.

하지만 많은 조직은 분명 열심히 하고 있다고 생각하는데 성과는 높지 않습니다.

그리고 더 나은 메트릭을 찾아서 킬리만자로의 표범처럼 헤메이고 있습니다.

자.. 더 나은 메트릭을 찾아 헤메기 전에 왜 나아지지 않는 것일까요?

수집하는 메트릭이 좋지 않아서일까요?

잘못된 메트릭을 수집하고 있어서 그런걸까요?

결론적으로는 메트릭을 수집하기 때문에 그렇다고 볼 수 있습니다.

어쩌면 메트릭을 수집하지 않음으로 인해 더 나은 경험을 해보실 수도 있습니다.

이 무슨 해괴한 이야기인가 싶으신가요?

관리자는 숫자에 대한 맹신과 같은 신념이 있습니다.

관리자들은 말 그대로 관리하는 것에 대해 굉장히 집착하는 경향이 있습니다.

때문에 현재 상태를 판단하고 의사결정을 위해 굉장히 많은 메트릭을 수집합니다.

하지만 정말로 제대로 된 메트릭을 수집하고 계신가요?

더 나은 메트릭을 찾아 헤메시기 전에 아래 사항들에 대해 한번 더 고민해 보시기 바랍니다.

첫번째는 지금 수집하는 각 메트릭에 목적과 용도가 있으십니까?

그 메트릭을 어떤 목적을 가지고 어디에 어떻게 사용하기 위해서 수집하고 계신가요?

이 질문에 명확하게 대답하지 못하신다면 의미 없는 메트릭을 수집하고 계신겁니다.

그리고 다른 회사들에서 성공적이었던 그 어떤 메트릭을 가져다고 수집하셔도 그 메트릭의 목적과 용도를 정확히 이해하지 못하셨다면 그 메트릭은 얼마 안가 매우 쓸모없는 메트릭이 될 것입니다.

예를 들면 많은 조직에서 오늘 발견한 결함을 측정합니다.

그런데 오늘 발견한 결함은 왜 수집하시는건가요? 수집된 결함 갯수를 가지고 무엇을 판단하고 결정하실건가요?

어떤 분들은 결함 갯수가 많으면 제품의 품질이 낮다고 판단할 수 있답니다.

정말로 그런가요? 심각도라는 메트릭을 추가해서 매일 발견된 심각도 높은 결함 갯수를 수집한다고 하더라도 마찬가지입니다. 이걸 왜 수집하시는 건가요? 이걸로 무엇을 판단하고 결정하실 수 있으신가요?

어제보다 오늘 심각도 높은 결함이 나왔다는 것은 무슨 의미일까요?

어제보다 오늘 제품의 품질이 내려갔다는 의미인가요?

잘 생각해보시기 바랍니다. 정말로 이 메트릭이 왜 수집이 되고 있는 것인지? 무엇을 판단하고 결정하기 위해서 수집되고 있는것인지.. 우리가 이해하고 알고 있고 그렇다고 믿었던 것에 대해 한번 더 물어보시기 바랍니다.

정말 확신하시나요?

두번째는 기준이 명확하신가요?

수집하는 메트릭의 기준이 명확하신가요?

메트릭의 추세를 판단하는 기준이 명확하신가요?

많은 조직들이 커버리지를 측정합니다.

예를 들어 오늘 100개의 테스트 케이스 중에 80개를 실행해서 테스트 케이스 실행률이 80%가 되었습니다.

그리고 한 주 뒤에 추가로 100개의 테스트 케이스가 만들어졌고 기존 100개의 테스트 케이스 중에 50개가 기능 변경으로 삭제되었습니다. 전체 테스트 케이스는 150개가 되었고 120개의 테스트 케이스를 실행하여 실행률은 80%가 되었습니다.

지난주에 테스트 케이스 실행률은 80%였고 이번주도 80% 입니다.

그러면 우리는 일은 한 것일까요? 안한것일까요? 우리 팀의 생산성은 높아진것일까요? 낮아진것일까요?

많은 메트릭들의 기준은 프로젝트를 진행하면서 바뀝니다. 그에 따른 기준을 정하기란 매우 어렵습니다.

어떤 관점에서 해석하느냐에 따라 전혀 다른 결과를 나타냅니다.

고로 우리가 어떤 메트릭을 선정해서 측정하기 위해서는 프로젝트 기간 동안 그 기준이 변하지 않고 수집을 하는 이유와 그 활용 용도가 명확한 메트릭을 선정해야 합니다.

그렇지 않다면 그냥 측정하지 않는 것이 더 좋습니다.

우리가 메트릭을 수집하는 것을 측정을 하기 위해서입니다. 측정에는 정량적이란 의미가 내포되어 있습니다.

숫자는 무엇인가에 대한 이해를 빠르고 직관적으로 이루어지도록 하는 마법을 부리지만 숫자에는 정황이 반영되지 못하기 때문에 전체적인 판단을 하기에는 오히려 부적절합니다.

즉, 측정은 관리적인 측면에서 미시적인 관리에 빠져들게 하는 단점이 있습니다.

미시적인 관리에 집중하게 되었을 때 가장 큰 리스크는 신뢰가 사라진다는 점입니다.

오늘 발견된 결함 갯수, 오늘 실행한 테스트 케이스 수, 오늘 작성한 테스트 케이스 수의 측정 이면에는 신뢰하지 못하는 관계가 숨어있습니다.

테스터의 전문성은 사라지고 기계의 일부처럼 취급되고 있다는 의미입니다.

세번째 메트릭은 어떤 경우에도 사람을 측정하는 용도로 쓰여져서는 안됩니다.

어떠한 경우에도 메트릭이 테스터나 개발자와 같은 사람을 측정하는 용도로 사용되는 순간 조직에서 신뢰는 사라지고 무의미한 성과지표 위주의 조직으로 바뀌게 됩니다.

그 조직에는 열정도 사라지고 책임도 사라집니다.

고로 사람을 측정하는데 사용될 수 있는 메트릭은 설계되어서는 안됩니다.

그럼 어떤 메트릭이 좋은 메트릭일까요?

제품 자체, 진척 자체만 측정할 수 있는 기준이 변하지 않고 수집 목적과 활용 방안이 명확한 메트릭은 무엇이 있을까요?

저는 정량적인 측정보다 좀 더 정성적인 측정을 종아합니다.

테스트 목적 도달 여부에 필요한 테스트를 정해 놓고 리스크에 따라 강도를 설정한 후 그에 따른 테스트를 충분히 수행했는가를 측정하는 정도면 충분하다고 생각합니다.

테스트를 충분히 수행했는가를 어떻게 측정할것인가는.. 테스터와 팀원을 믿어야 한다고 생각합니다.

예전에 어떤 분이 이렇게 얘기해준적이 있습니다. 당신은 당신의 이름을 걸고 테스트 보고서를 쓸 수 있습니까?

각자의 이름을 걸고 보고서를 쓸 수 있다면 그걸로 충분하다고 생각합니다.

저도 매일 그러기 위해서 노력하고 있습니다.

우리 나라 실정에 맞지 않고 뜬구름 같은 이야기이지만..

잘 생각해보면 쓸모 없는 메트릭 수집할 시간에 의미 있는 테스트를 한번이라도 더 실행하는 것이 모두에게 더 나은 것임은 분명하다고 생각합니다.

여러분은 의미 있는 메트릭을 수집하고 계신가요? 그렇다면 공유해주시면 고맙겠습니다.

정리하면 좋은 메트릭이란

1. 수집 목적과 활용 방안이 명확해야 한다.
2. 기준이 변하지 않아야 한다.
3. 사람이 아닌 제품을 측정해야 한다.

이렇게 생각합니다.

댓글

이 블로그의 인기 게시물

테슬라 악세사리 구매 후기

테슬라를 구매하면서 알리와 네이버 페이에서 이런 저런 악세사리를 정말 엄청나게 구매했습니다. 스파크 13년의 경험을 총동원해서 어머 이건 꼭 사야지~~ 라고 생각되는건 모두 구매해봤습니다. 실제 비용은 쿠폰과 포인트로 조금씩 달라질 수 있기 때문에 구매한 제품과 구매 링크 그리고 간단한 후기만 남겨보도록 하겠습니다. 1. 하이패스(AP500S) 뭐.. 얼마 안 있으면 하이패스가 필요없어진다는 얘기도 있지만.. 시범 사업 이후에 전국 고속도로에 설치되려면 아직 멀었고 뭐.. 말이 필요없는 필수품이죠.. 테슬라 카페이서 추천하는거 구매해봤습니다. TKC에서 공구하는건 이걸 구매하고 나서 알게 되었네요.. 네이버 공식샵에서 구매했습니다.  설치 후 동작은 잘 되는데.. 센터 콘솔 안에 위치한 시거잭에 설치하고 뚜껑을 닫았더니.. 음량을 최대 5로 설정해도 동작음이 잘 들리지를 않습니다. 그래서 이게 제대로 결제가 된건지 안된건지 알 수 없는게 유일한 불만이고.. 작고 잘 동작하고 좋습니다. https://smartstore.naver.com/gair/products/4776415369 2. 액정 보호 필름(스코코) https://brand.naver.com/skoko/products/9882239107 좋다고 해서 구매해봤는데.. 솔직히 모르겠습니다. 그리고 미묘하게 크기가 안맞습니다. 테슬라 모니터 테두리가 곡면이라서 그런것 같습니다. 샵에서 붙여 달라고 했는데.. 제래도 붙지 않고 계속 기포가 생깁니다. 점착력이 떨어지는건지.. 혹시 몰라서 한번 더 구매해서 다시 붙여보려고 합니다. 무엇보다 비싸기 때문에.. 무반사 이런거에 큰 관심 없으시면 다른 적당히 저렴한거 구매하시는게 나을 것 같기도 합니다. 3. 도어 커버(카마루) https://blessauto.kr/products/37263 생각보다 얇고 얘도 생각보다 잘 안맞습니다. 미묘하게 좀 큽니다. 제가 똥손이라서 잘 못붙여서 그런것일 수도 있습니다. 막상 붙이고 나면 감촉도 좋고.. 관리하기 편합니다. 브

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁