기본 콘텐츠로 건너뛰기

성능 테스팅에서의 테스트 오라클

테스터 관련 직군 중 가장 고액의 연봉을 보장하는 직군 중 하나가 성능 테스팅입니다.

일반적으로 업계에서 성능 테스터라 하면 폭넓은 도메인 지식과 개발 지식, 프로그래밍 능력을 겸비한 로드런너의 스크립트를 아주 능수능란하게 작성할 수 있는 사람을 말합니다.

이런 사람은 솔직히 매우 드물며, 덕분에 고액의 연봉을 받는 직군 중 하나입니다.

성능 테스트는 모든 종류의 소프트웨어에서 가능합니다.

저는 이 성능 테스트를 크게 2가지로 구분해서 제시해 보겠습니다.

하나는 서버와 관련된 성능 테스팅이고 다른 하다는 스탠드 얼론형 제품의 성능 테스팅입니다.

로드런너와 연관된 많은 경우의 성능 테스팅은 서버와 연관된 성능 테스팅이고 이 성능 테스팅의 경우 인터넷이나 주변에서 아주 쉽게 테스트 오라클이나 테스트 방법에 대한 정보를 쉽게 구하고 접할 수 있습니다.

반면 스탠드 얼론형 제품은 최근에 있어서 점점 더 어려워지는 경향이 있습니다.

어떤 사람들은 스탠드 얼론형 제품(이하 설치형 제품)의 성능 테스팅이 왜 어려운가?에 대해 의아해 하는 분들도 있을 것입니다.

아래 제 의견을 보시고 다른 의견이 있으신 분은 먼댓글(트랙백)이나 댓글을 달아주시면 고맙겠습니다.

기존의 설치형 제품의 성능 테스팅은 대체로 메모리와 CPU의 점유율이 테스트 오라클의 주된 척도였습니다.

그다지 먼 과거도 아닌 불과 10년 전만 해도 컴퓨팅의 자원은 열악하기 이를 데 없었습니다.

조금 더 멀리 15년 전  DOS 시절을 기억하시는 분이 있다면 상위 메모리, 하이 메모리와 같은 용어들을 기억하실 겁니다.

그 당시에는 멀티 태스킹은 꿈과 같은 것이었습니다. 물론 가능하기도 했지만 멀티 태스킹은 컴퓨터가 느려지는 주범이었죠.

윈도우와 관련된 많은 팁들이 이러한 메모리 자원을 어떻게 하면 조금이라도 더 쥐어 짤 수 있는지에 초점이 맞춰져 있었습니다.

게임은 이러한 제약이 더욱 심한 분야 중 하나였습니다.

그런데 세월이 많이 흘렀습니다.

이제는 CPU에 적어도 2개 많게는 8개까지 코어가 들어가는 세상이 되었습니다.

메모리는 아무리 적어도 1기가에서 많게는 4기가까지 들어갑니다.

시간이 지날 수록 컴퓨팅의 자원에 대한 이슈는 점점 희석화되어 가고 있습니다.

즉, 기존의 CPU나 메모리의 점유율을 기준으로 하는 테스트 오라클의 의미가 점점 퇴색되어 가고 있다는 점입니다.

운영체제도 발전에 발전을 거듭하여 최근에는 메모리의 점유나 회수에 대한 이슈가 예전에 비해 그렇게 크지 않습니다.

이러한 상황에서 설치형 제품에 있어서 테스트 오라클은 무엇이 될 수 있을까요?

아래에 나열하는 몇가지 경우는 제가 겪어본 이슈들일 뿐, 절대적인 기준은 절대 아닙니다. 혹시라도 더 좋은 예제와 기준이 있다면 저에게 꼭 알려주시면 고맙겠습니다.

그리고 저는 개발자가 아닌 정말 단순한 테스터의 입장에서 바라본 성능 기준이므로 개발자의 입장에서는 분명 더 많은 기준과 고려해야할 사항이 있을 것이라고 믿습니다.

첫번째는 멀티 코어 CPU입니다.

CPU에 멀티 코어가 장착되면서 발생하는 성능 이슈 중 가장 재미있는 현상은 제품이 모든 CPU를 동일하게 점유하는 현상입니다.

즉 멀티 태스킹이 정상적으로 이루어지지 않는 경우가 의외로 많습니다.

두번째는 종속성에 따른 메모리 점유입니다.

일반적으로 성능 테스팅을 할 때 메모리를 테스트 대상 홀로 쓰는 경우는 절대 없습니다.

우선 기본적으로 운영체제의 서비스들이 일정 부분의 메모리를 사용합니다. 문제는 운영체제의 설정에 따라 이러한 부분이 천차만별이라는 것입니다.

거기에 백신과 멀웨어 소프트웨어, 메신저 등을 비롯해 사용자가 기본적으로 사용하는 무수한 제품들이 있습니다.

이러한 제품은 수천 아니 수만가지가 넘고 이 중 어느 제품과 메모리 충돌이 나는 경우가 없다고 절대 장담할 수 없다는 것입니다. 최근에는 이러한 메모리 충돌의 경우가 매우 적긴 하지만 그렇다고 절대 발생하지 않는다고도 말할 수 없기 때문에 테스팅은 해야하는데 이러한 기준을 잡기가 점점 더 힘들어지고 있습니다.

세번째는 사용성과 관련된 이슈입니다.

실제로 사용성은 성능 테스팅과 일견 관계가 거의 없어 보입니다.

하지만 사용자가 인식하는 성능은 사용성과 매우 밀접하게 연관이 되어 있습니다.

예를 들어 데스크탑의 사진을 검색하는 사진 관리 프로그램이나 음악 검색 프로그램과 같은 경우 기존의 파일을 검색해서 DB를 만드는 방식 또는 사용자의 요청이 있을 때마다 즉석에서 검색하는 방식, 주기적으로 DB를 갱신하는 방식 등 그 알고리즘의 종류만큼 각 작업시마다 점유하는 CPU나 메모리도 천차만별이지만 실제로 사용자는 이러한 제품이 얼마만큼의 CPU나 메모리를 점유하는지에 대해 그렇게 큰 관심이 없습니다.

가장 중요한 것은 요청에 대한 즉각적인 응답속도일 것입니다.

하지만 ISO/IEC 9126 등과 같은 품질 특성에서도 성능 테스팅 즉 효율성의 측정 항목들은 실제로 자원에 대한 효율성을 측정하는 항목은 있지만 이러한 사용자 측면의 성능 테스팅에 대한 이슈는 없습니다.

성능 테스팅은 쉬운 테스팅은 아닙니다.

그리고 모든 테스트가 그러하듯 성능 테스팅 역시 테스트 오라클을 선정하는 것 역시 매우 어렵습니다.

하지만 중요한 것은 환경이 변하면 성능 테스팅 역시 변해야 한다는 것입니다.

그리고 그 변화에는 고객에 대한 존중과 생각이 들어가 있어야 한다고 생각합니다.

고객에게 최대의 가치를 주기 위한 테스팅이 가장 좋은 테스팅이라고 생각합니다.

댓글

  1. 이런저런 좋은 글들을 올려주시어, 시간될때 읽어볼까 합니다.

    먼저 감사합니다.



    저 역시 9년간 테스팅이나 컨설팅을 가지고 먹고 살았던 지라

    몇가지 궁금사항이나 의견이 있어서 댓글 남겨요



    그 전에, 요즘 커뮤니키 공간의 추세는 트위터, 블러그 등등이네요

    전 한참을 떨어지는 루저인가 봅니다.

    이런 공간이 아직은 너무 낯섷네요



    일단은 테스트 오라클과 테스트 오라클의 주된 척도가 대체로 메모리와 CPU 점유율이라고 하셨는데.

    아무래도 성능이란 전문 용어를 쓰신다면.. 조금 더 생각해보심이 좋지 않을까 싶네요



    성능보다는 가용성에 대한 테스트 오라클이 될 수 있을 것 같네요

    (물론, 사용성/효율성에서의 Sub-Metric으로도 이용되고 있습니다.)



    물론 각각의 ISO/IEC9126의 품질특성 및 속성 그리고 메트릭스간의 관계를 복잡하면 따지자면, 더욱 더 어려운 일이겠지만요.



    성능에 대한 올바른 정의는 당연히 테스팅 컨설팅을 수행하시니

    ISO/IEC 9126 또는 IEEE Glossary를 참조해 보시면 좋을듯 싶습니다.

    (정확하게 안나와 있을겁니다. 즉 성능을 ISO/IEC9126과 맵핑시키는것 자체가 좀 이상한 일이죠.)



    ISO/IEC 9126의 품질특성에 성능이 있었나요 ? 없기때문에 성능=효율성이라고 생각해야 할까요?



    전, 성능 테스트 오라클(?)은 본 글에 언급한 Factor가 아니라 생각하거든요



    참고로, ISO/IEC 9126의 Usability(사용성) 부분을 잘 읽어보시면 CPU나 메모리에 대한 내용이 언급되어 있을겁니다^^;





    일반적으로 Field에서는 기능/성능/신뢰성으로 품질특성을 구분합니다.

    단지, ISO/IEC9126에서는 표준과 이론적으로 접근하여 품질특성을 6가지로 구분하였을뿐

    그 관계가 1:1, 또는 1:n으로 맵핑되지 않죠. n:n맵핑이라고 생각하시면 좋을것 같네요



    대부분의 내용을 성능=효율성이라고 확정지으시고 적으신 글이라.. 제가 이렇게 반응했을수도 있겠네요

    답글삭제
  2. 김주봉6/7/10 16:56

    좋은 글, 댓글 감사합니다~

    답글삭제

댓글 쓰기

이 블로그의 인기 게시물

테스트 케이스와 체크리스트의 차이가 뭐여?

테스트 실무에서 가장 혼돈되어 사용되는 용어 중 하나가 테스트 케이스와 체크리스트입니다. 많은 경우 체크리스트를 테스트 케이스로 사용하는 경우가 많습니다. 실제로 인터넷 커뮤니티나 블로그, ISO, IEEE, ISTQB 등등을 검색해보시면 테스트 케이스와 체크리스트에 대한 구분이 다 제각각입니다. 각각에 대한 정의가 다 제각각입니다. 사정이 이러하다보니 많은 사람들이 테스트 케이스와 체크리스트를 잘 구분하지 못하고 혼동해서 사용하는 경우가 많습니다. 물과 기름처럼 테스트 케이스와 체크리스트를 정확하게 구분할 수는 없겠지만.. ISTQB를 기준으로 말씀드리면 설계 기법을 통해 도출된 것은 테스트 케이스 그렇지 않은 것은 체크리스트라고 생각하시면 쉽습니다. 예를 들면 아래는 결정 테이블 테스팅 기법을 통해 도출된 테스트 케이스의 예제입니다. 실제 테스트 케이스는 위보다 복잡하겠지만 어쨌든 얘기하고 싶은 것은 위와 같이 설계 기법을 통해서 도출된 것은 테스트 케이스라고 합니다. 그런데 딱 보시면 아시겠지만 실제 테스트에서는 저 정도로는 테스트 커버리지를 충분히 만족했다고 얘기하기 힘듭니다. 그렇습니다. 어떤 분들은 테스트 케이스가 전가의 보도, 은 총알 쯤으로 생각하시는데.. 테스트 케이스는 일종의 마지노 선이라고 보시면 됩니다. 최소한 제품을 테스트 할때 이정도는 해줘야 한다는 최후의 방어선 정도라고 보시면 됩니다. 전쟁에서 최후의 방어선은 물러설 수 없는 마지막 보루입니다. 하지만 최후의 방어선만 지킨다고 전쟁에서 승리할 수는 없습니다. 프랑스는 마지노 요새만 믿고 있다가 독일에게 깔끔하게 발렸던 과거가 있지요. 전쟁에서 승리하려면 앞으로 나가야하고 치밀한 전략과 전술이 뒷받침 되어야 합니다. 더 높은 커버리지를 도달하고, 충분히 좋은 테스트가 수행되려면 테스트 케이스는 기본이 되어야 하고 거기에 더해서 체크리스트가 따라와 줘야 합니다. 이러한 체크리스트는 팀의 경험과 과거 프로젝트의 데이

비츠 스튜디오 버즈 플러스(투명) 사용 후기

제 내자분은 아직도 유선 이어폰을 쓰고 있습니다. 그게 좋다고 하시더라구요. 작년에 혹시나 해서 앤커 사운드코어 라이프Q35를 구매해서 조공해봤지만 결국은 안쓰시더라구요. 그래서 작년 추운 겨울에 제가 귀마게 용으로 잘 사용해왔는데.. 여름이 되니.. 와.. 이건 너무 덥고 무거워서 못쓰겠더라구요. 아이폰도 사고 애플 워치도 샀으니.. 다음은 에어팟인데.... 노이즈 캔슬링이 된다는 에어팟 프로 2는 ... 네... 너무 비싸더라구요... 이건 내자분께 얘기해봐야 결제가 될리가 없어서... 고민하고 있던차에.. 네.. 저는 봐버리고 말았습니다. 비츠 스튜디오 버즈 플러스의 그 영롱한 투명 버전의 자태를... 급 뽐뿌가 왔지만.. 여전히 20만원의 고가더라구요... 초기 출시 시기에 이벤트로 16만원 정도 했던거 같은데.. 그정도 가격이면 선 결제 후 보고 하면 될거 같은데.. 20만원은 너무 너무 비싸서 침만 삼키던 차에.. 당근에 15만원에 올라온 물건을 덥석 물었습니다. 애플 뮤직 6개월 프로모션 코드도 사용하지 않은 따끈따끈한 제품이라서 그냥 질렀습니다. 이상하게 인터넷이 실제 리뷰 게시물을 찾기 힘들어서.. 고민을 잠깐 했지만.. 그 투명하고 영롱한 자태에 그만... 어쨌든 구매하고 한달 정도 사용해본 후기를 간단하게 남겨봅니다. 1. 노이즈 캔슬링은 기대한 것과는 좀 다르고 앤커 사운드코어 라이프Q35 정도 되는 것 같습니다. 노이즈 캔슬링은 활성화하면 이게 소리를 막아준다기보다는 주변의 작은 소음만 제거해준다고 생각하시면 됩니다. 그러니까 옆에서 소근 거리는 소리나 선풍기 바람 소리 같은 작은 소리들이 사라지고 음악 같은 내가 듣고자 하는 소리가 굉장히 뚜렸해지만 지하철 안내 방송 같은 조금 큰 소리는 그냥 들립니다. 그래서 주변음 허용 모드를 켜보면 너무 시끄러워서 안쓰게 되더라구요. 전 에어팟 프로 2를 사용해 본적이 없어서 비교할 수는 없지만.. 아주 못쓸 정도의 성능은 아니라고 생각됩니다. 2. 저는 귓구멍이 너무 작아서 XS 사이즈의 이어팁

탐색적 테스팅의 역사

이 글은 James Bach 의 ' Exploratory Testing 3.0 '을 번역한 글입니다. 이번 글은 의미를 전달하는데 무리가 없는 선에서 대부분 의역으로 번역되었습니다. 때문에 잘못 번역된 부분은 댓글로 남겨주시면 수정하도록 하겠습니다.(읽어보시면 시제나 문체가 시시각각으로 변합니다. 감안해서 읽어주시면 고맙겠습니다.) 이 글은 James Bach의 허락을 얻은 후 번역한 글로 다른 곳에 퍼가실때는 반드시 원 출처와 본 블로그를 같이 언급해주시기 바랍니다. ----- [저자 주: 다른 글에서 이미 탐색적 테스팅을 이제는 테스팅으로 불러야 한다는 것을 얘기했다. 사실 Michael은 2009년에 테스트에 대해 얘기했었고, James는 테스터에 대해 얘기했던 것을 2010년에 블로그에 작성했다. Aaron Hodder는 2011년에 직접적으로 언급했고 Paul Gerrard 역시 그러했다.우리는 모든 테스팅은 탐색적이라는 것을 깊이 이해하고 가르쳤지만(여기에 James가 작년에 한 학생과 대화를 나눈 예가 있다.), "탐색적 테스팅"이라는 용어를 더이상 사용하지 않을 준비가 되어 있지 않다. 지금도 우리는 탐색적 테스팅이라는 용어를 사용하지 말아야 한다고 주장하지는 않는다. 다만 테스팅이 탐색을 어느 정도 포함한 스크립트 테스팅을 의미하는 것이 아니라 테스팅이 곧 탐색적 테스팅이라는 것이다.] By James Bach and Michael Bolton 태초에 테스팅이 있었다. 아무도 탐색과 스크립트 테스팅을 구별하지 못했다. Jerry Weinberg는 1961년 Computer Programming Fundamentals에서 테스팅의 형식화(formalizing)에 주의를 표명하고 테스팅은 본질적으로 탐색이라고 설명했다. 그는 책에서 "프로그래머의 의도에 대한 많은 정보 없이 프로그램과 프로그래머의 의도가 얼마나 일치하는지 기계적으로 검사하는 것은 어렵다. 만약 검사를 위해 컴퓨터에 간단