1. 데이터 사이언티스트 오수은을 소개해 주세요.
안녕하세요! SK C&C에서 데이터 사이언티스트로 일하고 있는 오수은입니다. 데이터 분석 및 AI 모델 등을 바탕으로, 하이닉스 등 관계사에 공장 수율 제고책을 비롯한 다양한 컨설팅을 제안하는 업무를 수행하고 있어요. 데이터를 근거로 문제를 정의하고 해결책을 제시하는 프로젝트가 주요 업무인 셈이죠.
학부 때는 경제·통계 등 문과 계열을 전공했어요. 브랜드 마케팅과 관련해 인턴을 하면서, 도메인 경험이 많은 개인 의견을 근거로 프로젝트가 진행되는 사례를 많이 겪었습니다. 일련의 경험을 통해 프로젝트의 설득력을 높이려면, 데이터 등 정량적인 수치가 뒷받침돼야 한다는 인사이트를 얻었어요. 대학원에서 데이터 사이언스를 전공하게 된 배경이죠. 데이터 전공자를 원하는 시장 수요도 무시할 순 없었죠
2. 데이터 직무로 취업하려면 대학원에 가야할까요?
직무 성격에 따라 대학원 진학 필요성이 달라질 수 있다고 생각해요. 다양한 도메인 데이터를 분석하고 이와 관련해 최신 분석 기술을 활용해야 하는 직무를 수행하려면, 대학원 수준의 학습이 필요하죠. 데이터 분석 트렌드를 다루는 최신 논문을 이해하고 이를 문제 해결에 적용하는 능력을 길러야, 신속하게 도메인별 데이터 특성을 이해하고 적절한 분석 기법을 활용하는 역량을 발휘할 수 있다는 이유에서입니다. 특히 추천 시스템 개발 등 딥러닝 수준의 전문 지식을 요구하는 직무를 수행하려면, 박사 학위 취득까지 염두에 두실 필요가 있겠죠.
반면 한정된 도메인에서 데이터 추출 및 분석 업무를 수행하는 직무를 희망하시면, 대학원 진학이 필수가 아닐 수도 있어요. 무신사·토스처럼 자사 데이터가 실시간으로 업데이트되는 기업에선 상황에 따라 필요한 데이터를 전문적으로 추출하는 직무를 필요로 하는 경우가 많아요. 해당 직무 핵심 역량은 데이터 추출에 필요한 쿼리문을 작성하는 요령과 추출한 데이터를 조직에 리포팅하는 능력인데, 쿼리문 작성과 관련해선 MySQL과 같은 DBMS 활용법을 익히고 리포팅과 관련해선 ‘POWER BI’ 등으로 비즈니스 대시보드 만드는 경험을 쌓아야 하거든요. 실무 역량에 더 중점을 둘 가능성이 높은 거죠.
3. 문과생도 데이터 관련 대학원에 진학할 수 있을까요?
이과생 수준으로 데이터 관련 지식을 쌓겠다는 각오를 해야, 대학원 진학이 의미 있는 성과로 이어진다고 생각해요. 이과생들이 학부 시절에 배웠던 알고리즘 기초나 파이썬 등을 모르는 상황에서 대학원에 진학하면, 강의 진도를 따라가기도 벅차고 실무 경쟁에서도 뒤처질 수밖에 없기 때문이죠. 저도 통계나 알고리즘 프로그래밍 관련 계절 학기를 수강하고, 파이썬 개인 과외를 받는 등 절대적인 학습 시간을 늘렸어요. 동기들이 2시간 만에 끝낸 파이썬 프로그래밍에 6시간을 투자하기도 했죠. 희망하는 직무가 필요로 하는 역량과 학위 취득에 필요한 시간·노력 등을 종합적으로 고려해서, 대학원 진학 여부를 결정하시면 좋을 것 같아요.
4. 대학원 진학을 희망하는 문과생은 어떤 준비를 해야 할까요?
우선 본인이 전공하고 싶은 분야를 선택하셔야겠죠. NLP, VISION AI 등 분야별로 선행 학습할 내용이 다르기 때문에, 분야에 따라 학습 전략도 달라질 거예요. 어떤 학교로 진학해야 하는지가 고민되신다면, 선택하신 분야에서 어떤 학교의 교수 또는 LAB실이 가장 많은 논문을 발표하는지 또는 세미나를 많이 개최하는지 등을 확인해보시면 좋아요. 교수나 LAB실별 논문 발표 및 세미나 개최 수가 인기도와 비례하는 경우가 많기 때문이죠. 진학을 희망하는 학교를 정하셨으면, 학교 연구실 홈페이지 등을 통해 논문 세미나 정보를 찾아보시거나 공개 컨퍼런스에 참여해서 연구 내용 등을 파악해보시는 것을 추천 드려요.
5. 데이터 관련 실무에서 가장 필요한 업무 역량은 무엇이며, 어떻게 쌓을 수 있을까요?
도메인 전문가와 소통하며 데이터 분석에 필요한 힌트를 얻고, 분석에 따른 인사이트를 모두가 이해할 수 있도록 스토리텔링하는 능력, 즉 커뮤니케이션 역량이 가장 중요하다고 생각해요. 데이터로만 실무 상황을 온전히 이해하기 어렵기 때문에, PM과 같은 도메인 전문가와 소통하면서 데이터와 관련된 배경 지식을 쌓아야 분석의 정확도를 높일 수 있어요. C레벨 등 분석에 대한 직접적인 경험이 없는 조직의 리더나 임원진들에게 분석 결과를 어떻게 전달할지 고민하는 일도 중요해요. 다른 조직 구성원이 분석 결과를 이해하지 못하면, 분석에 따른 인사이트를 실무에 적용하기 어렵기 때문이죠. 어떤 AI 모델을 활용했다는 기술적 답변보다 어떤 문제를 왜 해결해야 했고, 어떻게 해결했는지를 하나의 스토리로 설명하는 능력이 중요한 이유죠.
6. [데선배의 취업비책]
학습하신 내용이나 프로젝트 내용 등을 기록하는 습관을 들이는 게 중요하다고 생각해요. 꼭 포트폴리오 형태일 필요는 없어요. 블로그·문서 어떤 플랫폼에든 진행했던 프로젝트와 트렌드와 관련해 학습한 내용 등을 기록해두고, 면접 등 취업 과정에서 활용하시는 것을 추천 드려요. 관심사를 묻는 면접관에게, 장황한 답변 대신 트렌드를 정리해둔 블로그 링크 등을 알려드리는 식이죠 뉴스레터나 캐글에서 발견하신 정보를 어떤 형태로든 기록해보시면 어떨까요?
용어 해설
데이터 사이언티스트
데이터의 다각적 분석을 통해 조직의 전략 방향을 제시하는 기획자이자 전략가
딥러닝
인공지능 컴퓨터를 학습시키는 방법인 머신러닝 중 하나로, 사람 뇌 속 신경망 구조를 모방해 학습시키는 방법
쿼리문
데이터베이스에 정보를 요청하는 명령문
MySQL
SQL로 작성된 쿼리문에 따라 데이터를 조작 및 수정할 수 있는 공개 소스의 관계형 데이터베이스 관리 시스템
DBMS
데이터베이스(DB)에 접근하여 데이터베이스 정의, 조작, 제어 등 데이터베이스 관리를 지원하는 소프트웨어
Power BI
마이크로소프트가 개발한 상호작용 데이터 시각화 소프트웨어 프로그램
파이썬
일상 언어를 컴퓨터가 이해하는 기계어로 번역하는 대표적 프로그래밍 언어
NLP (Natural Language Processing)
컴퓨터를 이용해 사람의 자연어를 분석하고 처리하도록 하는 인공지능의 한 분야
VISION AI
디지털 이미지, 동영상, 기타 시각적 입력에서 의미 있는 정보를 도출할 수 있도록 하는 컴퓨터 비전 기술
PM (Product Manager)
데이터를 기반으로 제품과 서비스를 기획하고, 런칭까지의 모든 프로세스를 총괄하는 책임자
C레벨
CEO, COO, CFO 등 조직의 각 부문별 최고 책임자를 의미하는 용어
캐글
기계 학습 경진대회, 데이터 셋의 공유와 학습 시스템 등을 제공하는 플랫폼