본문 바로가기
소소한 빅데이터 이야기

빅데이터 엔지니어, 빅데이터 분석가, 데이터 사이언티스는 어떻게 다를까

by 레비스탈(Levistyle) 2023. 1. 26.

엔지니어와 분석가는 개발자와 분석가의 느낌이 난다. 두 분야는 아주 다르다.

 

데이터 사이언티스트는? 데이터 과학자니까 데이터도 잘 알고 코딩도 잘 알아야 할 것만 같다. 

역시 개발자와는 다른 것 같다. 그런데 데이터 분석가와 데이터 과학자는 뭐가 다르지? 

데이터 분석가는 주어진 데이터를 통계적으로 분석해서 원하는 결과를 만드는 직무라고 치고, 

데이터 과학자는 데이터를 과학적으로 풀어내는 직무이니 코딩을 잘 해서 프로그래밍이 가능한 거 아닐까? 

 

그러면 또 개발자와 데이터 과학자는 어떻게 다르지?

 

데이터 엔지니어와 데이터 분석가, 데이터 사이언티스는 서로 왠지 다를 것 같지만, 쉽게 정의 내리기 어렵다. 4차산업혁명 같고, 빅데이터 같으며, 데이터 분석 같다. 그런데 실제 현업에 있다고 해도 이 직무가 구체적으로 어떻게 다른지 깔끔하게 정리할 수 있는 사람은 거의 없다. 나 역시 마찬가지다. 어떤 책에 보니 한 교수님께서 데이터 분석의 직무를 전문성에 따라, 혹은 데이터를 다루는 직무에 따라 여러 갈래로 나눠 놓으셨던데, 예를들면 빅데이터에 대한 전문 교육을 받고 빅데이터 분석을 업으로 삼으면서 코딩이나 통계에 해박한 사람과 그냥 회사를 다니면서 기본적인 기술만 익혀서 서버에 저장된 데이터를 꺼내고 분석할 줄 아는 사람 등으로 말이다. 그런데 그러한 분류는 마치 뭐랄까. 애써 구분해 놓은 느낌이다. 분류를 위한 분류 같은 느낌.

 

내가 겪은 현업에서는 엔지니어와 분석가, 사이언티스트의 분류나 정의는 기업이 어떻게 정의하는지에 따라 달라질 뿐, 공론화된 직무 구분은 명확하지 않다. 좀 더 날 것으로 얘기하자면, 직무의 구분이 아니라 부서명의 구분일 뿐으로 보여질 때도 많다. 내 명함에서 나를 어떻게 정의해주느냐에 따라 내 직무가 정의되는 느낌이다.

 

사실 이런 경우는 세상이 바뀔 때마다 곧 잘 일어난다고 한다. 연차 차이가 제법 나는 선배들에게 전해져 내려오는 얘기 중에 하나가 ‘영업팀이 마케팅팀으로 바뀐’ 사례다. 지금이야 영업은 기업 간의 홍보 업무인 것 같고 마케팅은 기업과 소비자 간의 홍보 활동인 것으로 쉽게 연상되나 마케팅이 대세이던 시절에는 너도 나도 마케팅을 하겠다며 조직 개편을 했는데, 그 때 많은 영업팀들이 마케팅팀으로 이름을 바꿨다고 한다. 당장 하는 일은 크게 바뀌지 않았는데 부서명이 바뀌더니 새 명함이 나온 것이다. 그때부터 영업맨은 마케터가 된다.

 

데이터 사이언티스트는 빅데이터의 산물이다. 데이터가 엑셀에서 감당이 안될 정도로 커지면서 코딩이 개발자 뿐만 아니라 데이터 분석가들에게도 필수템이 되었고, 데이터 분석에 코딩이 붙었으니 ‘사이언티스트’로 명명된 것이다. 그리고 이 명칭은 구글트렌드로 트럼프 당선을 예측한 ‘세스 스티븐스 다비도위츠’라는 사람을 구글에 영입하면서 붙여준 고귀한 직함이다. 

 

이런 사례가 또 있다. 기술적으로 판단할 수 없는 영역에 기술을 붙이는 작업 말이다. ‘디자인 공학’이라는 말 들어 봤는가? 디자인은 산업디자인이라고 하더라도 예술의 영역에 가깝다. 디자인은 회사에서 진행 상황을 브리핑 받지 않는 몇 안되는 업무 영역이다. 회사에서 만약 디자이너들에게 현재 몇 % 업무가 진행되었는지 묻는다면 아마 디자인을 전혀 모르는 사람으로 무시 받을 것이다. 디자인의 제작 과정은 몇 % 완료되었다는 식으로 정리될 수 있는 게 아니니까. 같은 맥락으로 A안과 B안 중 어떤 디자인이 나은지 평가를 받을 때도 이를 정량화시키기 어렵다. 사람들에게 좋은 디자인으로 평가 받았다고 한들, 그 디자인의 Identity를 그대로 다음 제품으로 녹여낸다거나, 좋은 평가를 받았던 디자인 요소가 무엇때문이었는지 밝혀서 기록으로 남겨두자는 시도 자체가 거의 불가하다는 것이다. 그 디자인을 제작하고 창작한 디자이너 역시 해당 디자인의 긍정적 평가 요소를 정량적으로 정의하지 못한다. 그래서 디자인의 좋고 나쁨, 이쁘고 못생겼다는 것은 철저하게 “소비자 취향의 차이”라고 못박고 은근슬쩍 뭉개려고 하는 것이다. 나 역시 ‘디자인 트렌드’와 관련된 분석 프로젝트 의뢰가 들어오면 솔직히 피하고 싶은 것이 사실이다. 어쨌든, 그런데 꾸준히 이런 감각적인 디자인 분야를 굳이 정량적으로 평가하고 디자인에 무지한 사람들에게까지 어떻게든 공론화시키려는 의지를 담은 키워드가 있다. 그게 바로 “공학”이다. 디자인 공학. 

 

이해되는가? 데이터 사이언티스트도 사이언티스트가 존재했는데 데이터가 붙은 게 아니라 데이터는 원래 있었는데 사이언티스트가 붙은 말이다. 의도가 뭐겠는가? 아니 왜 그랬겠는가? 일단은 새로운 데이터라는 것에 대한 각인 효과의 노림수가 있다. 또 하나는 데이터의 중요성, 가치를 제고시키기 위함이다. 데이터의 역할이 점점 위대해지고 있음을 시사하는 하나의 단어일 뿐이다. 데이터 분석가를 거쳐서 데이터 사이언티스트가 되는 등의 단계적 의미가 아니라는 얘기며 굳이 데이터 분석가와 데이터 사이언티스트를 구분하려 노력하지 않아도 된다는 의미다.

 

어떤 사람은 나를 데이터 분석가로 부르고 어떤 사람은 나를 데이터 사이언티스트라고 부르며, 또 어떤 사람은 데이터 분석가는 맞는데 데이터 사이언티스트까지는 아니라는 상당히 섬세한 정의를 내려주고는 한다. 고작 1년 남짓 빅데이터 관련 아카데미를 수강한 이력을 가진 분들이 말이다.

 

하지만 나는 어딜가든 스스로를 데이터 사이언티스트라고 소개한다. 

 

데이터를 통계적으로만 분석하지 않고 코딩을 활용해서 분석하고 해석하는 일을 매일 하고 있으며, 사내 마케팅 담당자나 외부 기업들이 막연하게 요구하는 데이터 수집, 가공 관련 내용들을 개발자들이 이해하기 쉽게 풀어서 설명하고 방법을 함께 찾아주는 역할을 하며, 또 새로운 데이터 분석 솔루션 개발을 주도적으로 이끌고 있기도 하다. 그래서 나는 데이터 사이언티스트다. 구글에서 일하지도 않고 실리콘 밸리에는 갈 생각 자체도 없지만 나는 나 스스로를 그렇게 소개한다. 그리고 무엇보다 아직까지는 데이터 분석가보다 데이터 사이언티스트가 있어 보인다.

 

어쨌든 데이터 사이언티스트는 그쯤 정리하고, 내가 정말 문제라고 생각하는 건 데이터 엔지니어와 데이터 분석가의 모호한 구분이다. 이게 그냥 의미만 모호한 것이라면 상관없는데 모집 공고에서 모호하게 보여지는 건 상당히 문제다. 구직을 하는 기업이나 구인을 하는 취준생 모두에게 말이다.

실제 내가 받은 이직 제안 사례를 보자.
 
 

-      소속팀 : 고객DB관리/Data Science (전략팀)

-      담당 업무
    - 고객 DB 수집 및 DB관리, 빅데이터 스타일로 저장/관리
    - 고객 경험 혁신을 위한 DB 분석
    - 고객 DB 관리체계 구축 및 고객관리방안 수립
    - 오픈소스 활용을 통한 빅데이터 분석과제 수행
    - 소비자 트렌드 분석

-      경력 사항
 - 소비자 데이터 분석 경력
 - 마케팅 인사이트 도출 경력
 - 통계프로그램 및 데이터분석 관련 자격 우대

 

위 내용을 보고 어떤 생각이 드는가? 내가 가장 먼저 든 생각은 “헷갈림”이었다.

 

물론 이 공고를 낸 기업의 입장은 십분 이해가 된다. 당연히 그럴 수 밖에 없다, 아직은. 고객 데이터를 분석하려면 고객 DB에 접근해야 하고 그러다 보면 고객 DB를 어떻게 하면 더 효율적이고 효과적으로, 소위 “빅데이터스럽게” 저장하고 관리할 수 있는지 분석가가 그들만의 시각으로 알 수 있을 것이고 또 해줄 수 있을 것이라고 봤을 것이다. 물론 그렇다. 빅데이터 분석가가 그러한 역량까지 갖추어야 할 것이라는 데에는 너무 너무 동의한다. 그런데 문제는 지금 빅데이터 분석으로 진입하는 인력들이 그렇지 않다는 데 있다. 그리고 DB관리와 DB에 있는 데이터를 꺼내서 분석하는 업무는 생각만큼 유사성이 크지 않다. 각각의 전문 분야라는 얘기다. 다시 한 번 말하지만, 각각의 전문 분야라고 할지라도 데이터를 다루는 이라면 결국 두 분야를 섭렵해야 할 것이라는 것에는 매우 매우 동의한다.

 

그런데 그렇게 매우 매우 동의함에도 우려스러운 것은 나와 같은, 혹은 나보다 어린, 이제 막 빅데이터를 접하고 뛰어들려는 취준생들에게는 “헷갈림”을 넘어 진로 선택의 오류가 될 수 있기 때문이다. 빅데이터 분석이라고 했을 때 연상되는 직무는 데이터를 끈질기게 쪼개고 깍고 붙이는 노력을 통해 나만의 인사이트를 발견하고 멋지게 기업에 제안해 새로운 상품을 출시하거나 일종의 트렌드가 되는 꿈을 꿀텐데 각고의 노력 끝에 실제 입사를 하게 되면, DB 관리에 허덕이며 매몰될지도 모른다. 그래서 데이터 분석, 데이터 사이언스, 전략팀이라는 멋진 직무를 표방하고는 있지만, 결국 데이터 “엔지니어스러운” 업무를 담당하게 될지도 모른다는 것이 작금의 뼈아픈 현실이다.

 

여기에는 일부 사례를 가지고 얘기했지만, 지금 당장 구직사이트에서 “빅데이터”로 검색해 보면 이와 유사한 모집 공고가 몇 십 개, 몇 백 개는 뜰 것이다. 그래서 우리는 안타깝게도 무조건 공고 내용을 신뢰할 수 없다. 관련 공고에 무조건 지원하는 것 외에 여러가지 경로로 해당 직무를 살펴보아야 경력의 오점을 남기지 않을 수 있다. 

 

지금은 많은 기업들이 “빅데이터 분석”에 너무 많은 의미를 담아 취업 공고를 내고 있다. 잘 모르기 때문이다. 그래서 시간이 지나고 빅데이터 분석과 관련된 여러 경험들이 쌓이다 보면 자연스럽게 본인들이 원하는 인재상이 무엇인지 선명하게 알 수 있게 될 것이다. 그런 때가 되면 취업자들은 더 이상 대학원을 가야 하는지 아닌지 고민할 필요도 없을 것이고, 취업 공고를 보고 오해할 일도 없을 것이고 스스로를 비전공자라 하대하는 늪에서 헤어나올 수도 있을 것이다. 그런데 그 시간이 지나는 동안이 문제다. 시간이 지나는 동안에는, 우리가 서로 미숙한 그 시간 안에서는 어찌할 도리가 없다. 우리 스스로 조금씩 현실을 타파하며 앞으로 나가는 수 밖에.