생각이 많고 생각 정리가 필요할 때마다 회고 글을 작성하기로 다짐했다. 여유가 있을 때만...
2022년 4월의 나는 번개장터 데이터 사이언티스트 인턴과 카카오 추천팀 분석 직군 인턴을 마쳤으며, 현재 다른 기업의 데이터 직군으로 취준 중이다.
두 번의 데이터 직군 인턴과 다수의 면접 경험을 기반으로 "기업들이 신입에게 요구하는 역량"에 대해 생각해보았다.
주니어 데이터 사이언티스트의 필요 역량은?
일단 해당 필요 역량들은 매우 주관적이다. 내가 면접에서 공감을 얻었던 답변과 인턴을 하며 나에게 요구했던 역량들을 기반으로 적어보았다.
0. Hard Skills
여기서 Hard Skills이란 데이터 사이언티스트의 기술적 역량을 뜻한다. 데이터 분석부터 모델링, 배포 등이 될 수 있으며 최소한 자격 요건에 적혀있는 기술 역량과 주요 업무를 진행할 수 있을 정도는 숙지되어야 한다고 생각한다.
이를 0번으로 적은 이유는 이런 기술적 역량이 점점 "기본"으로 여겨지고 있기 때문이다. 국비 교육 같은 교육 프로그램은 점점 많아지고 데이터 공모전과 Kaggle, Dacon과 같은 Competition 또한 접할 기회가 많아졌다.
따라서 데이터를 경험해보고 ML/DL 모델링을 배운 신입들이 많아졌으며 이는 필요 역량이 아닌 필수 역량처럼 되어갔다.
공모전, 프로젝트, Competition 경험을 통해 기술 역량만 커지는 것이 아니다. 데이터 사이언티스트는 데이터를 통해 문제를 발견하고 의사 결정하며 적합한 모델을 선정하여 학습시켜야 한다. 따라서 매 순간 문제에 맞는 판단을 하고 문제에 맞는 기술을 공부해야 한다. 즉, 기술을 공부하며 기술 역량을 키우고 적합한 판단을 공부하며 Soft Skills을 키운다.
Soft Skills이란 커뮤니케이션 스킬과 같은 기술 역량 외 추상적인 역량들이다. 추상적이기 때문에 "비판적 사고"와 "논리적 사고"처럼 개념이 겹칠 수도 있으며 기술 역량처럼 해당 역량을 가지고 있음을 표현하기도 쉽지 않다. 결국 Soft Skills은 자신이 겪은 경험을 기반으로 어필하여야 한다.
앞으로 나올 필요 역량은 모두 Soft Skills이며 해당 역량이 무엇을 말하는지, 왜 필요한지, 나는 어떻게 어필했는지를 적어볼 것이다.
1. 논리성
논리적인 사고는 "왜?" 라는 물음으로 시작한다. 데이터 사이언티스트로서의 업무를 진행할 때, "왜 문제점을 그렇게 해결했는가?", "왜 해당 기술을 사용했는가?" 등에 대한 물음에 논리적인 근거가 필요하다. "그냥 해봤더니 성능이 개선되었다" 같이 논리가 없는 의사 결정은 주니어로서 기업에 임팩트를 주기 힘들 것이다.
프로젝트를 진행할 때, 모두가 나름대로의 근거를 가지고 의사 결정을 내리기 때문에 이와 같은 논리성은 대부분 가지고 있다고 생각할 수 있다. 나 또한 발생한 문제를 최대한 데이터 기반의 논리적 의사 결정을 통해 해결하려고 했기 때문에 항상 논리적인 사고를 한다고 생각했다.
하지만, 내가 말하고 싶은 것은 고차원의 논리성이다. 앞서 이야기한 것과 같이 우리는 발생한 문제를 논리적 근거를 들어 해결한다. 여기서 보통 우리가 집중하는 것은 "무엇이 해결되었는가?"이다. 논리적 근거를 들어 기술을 사용하고 문제를 해결했기에 이는 "논리성"을 갖춘 의사 결정이 되는 것이고 문제가 해결되었기에 "왜"라는 물음을 멈춘다. 여기까지가 내가 생각한 일차원의 논리성이다.
물론, 일차원의 논리성 또한 논리적인 사고지만, 이는 결국 보고싶은 것만 보는 반쪽짜리 논리이다. 고차원의 논리성은 끊임없이 "왜"라는 물음을 던지는 것이다. 해결만 문제에만 집중하는 것이 아닌, 발생할 수 있는 새로운 문제에도 집중하는 것이다.
예를 들어, 추천 시스템의 평가 지표로 CTR을 사용하였고 모델 성능 향상의 근거로 CTR의 향상을 들었다. CTR의 향상은 아이템의 노출 대비 클릭 수가 증가했다는 것이기에 "유저가 원하는 아이템을 잘 추천해주었다"라고 판단할 수 있다. 하지만, CTR의 문제점은 자극적인 아이템에서도 높은 지표를 보인다는 것이다. 아이템이 게시글이라면 유저에게 맞는 유용한 게시글의 CTR 뿐만 아니라 자극적이고 선정적인 게시글의 CTR도 높다는 것이다. 후자의 경우에도 추천 모델의 성능이 향상되었다고 할 수 있을까?
이런 논리성은 자연스럽게 Hard Skills과도 연결된다. "왜?"라는 물음에서 나온 문제를 해결하기 위한 깊이 있는 분석과 논문 탐색, 실험을 통해 기술 역량 또한 키울 수 있다.
결론적으로 나의 인턴 경험에서 느낀 논리성이라는 역량은 끊임없이 "왜?"라는 물음을 던지는 것이었다. 특히, 데이터 분석에서는 긍정적인 결과에만 집중하여 논리에 따라 분석하는 것이 아닌 분석을 논리에 맞추어 진행하는 경우가 많다. 긍정적인 것에만 집중하는 것이 아닌 끊임없이 문제를 찾아내어 고차원의 논리를 만족시킨다면 성능은 자연스럽게 따라올 것이다.
2. 탄력성
탄력성은 기술을 빠르게 배우는 "Learning Rate"와 서비스와 업무를 빠르게 이해하는 "적응력"을 뜻한다.
데이터 분석 방법론에는 다양한 통계적 기법과 시각화 방법이 있으며 모델링 또한 태스크에 따라 다양한 ML/DL 모델이 존재한다. 특히, DL은 해가 갈수록 다양한 논문이 쏟아져 나온다.
이런 상황 속에서 주니어 데이터 사이언티스트는 빠르게 논문을 읽어 구현해보거나 구현된 오픈 소스를 빠르게 적용할 수 있는 능력이 중요해졌다.
이렇게 빠른 "Learning Rate"는 낯선 지식을 두려움 없이 접하는 것부터 시작하여 배우는 것까지 모두 포함할 수 있다.
빠른 "Learning Rate" 외에도 "적응력"이 탄력성에 포함되어 있는 이유는 실무 경험이 없는 주니어이기 때문이다.
주니어로서 처음 입사하게 된 회사의 업무 파이프라인과 해당 필드에 대한 이해는 상당히 낯설 것이다. 그럼에도 이를 빠르게 이해하고 적응하여 퍼포먼스를 보인다면 큰 메리트가 될 것이며 이 능력은 실무 중요도가 높은 스타트업 IT 기업일수록 중요할 것이다.
면접 준비를 하다가 "진정 Data Scientist로서 필요한 역량이 무엇일까"에 대해 생각 정리가 필요하여 글로 옮겨보았다.
다시 말하지만 해당 글은 매우 주관적인 글이다.
'회고' 카테고리의 다른 글
가격 전략 세미나 회고 (0) | 2022.06.19 |
---|---|
카일타임 회고 (0) | 2022.06.13 |
주관적인 도전의 원동력, 성장의의미 (0) | 2022.04.20 |
댓글