뉴질랜드 데이터 분석가 입문, 비전공자도 배우는 실무 기술 총정리
뉴질랜드 데이터 분석가 입문을 고민하시고 있는 분들 주목하세요. 비전공자인 제가 퀸스타운 QRC에서 5주간 직접 배운 구글 Colab, 파워 쿼리, 시각화 기술 등 실무 커리큘럼을 총정리해 드립니다. 이번 기회에 IT 커리어 체인지를 원하시는 분들은 꼭 읽어 보세요
비전공자가 진짜 데이터 분석을 할 수 있을까?
뉴질랜드 데이터 분석가를 꿈꾸며 새로운 도전을 이어가고 있는 ‘뉴질랜드 생활백서’의 Daniel입니다.
저 역시 시작 전에는 이 질문을 수백 번도 더 던졌습니다. 하지만 퀸스타운 QRC에서 보낸 지난 5주는 그 막연한 두려움을 확신으로 바꿔준 시간이었습니다.
오늘은 제가 직접 경험한 뉴질랜드 데이터 분석가 입문 과정에서 배우는 실무 기술들을 가감 없이 총정리해 보겠습니다. 데이터 분석가 입문을 하려고 하시는 분들은 도대체 뉴질랜드 퀸스타운 QRC에서는 무엇을 배우시는지가 궁금하실 것 같아 준비해 보았습니다.
뉴질랜드 퀸스타운에서 데이터 분석가 도전을 하고 있는 저의 이야기가 더 궁금하신 분들은 아래 전편 포스팅을 읽고 오시면 본 포스팅을 깊이 이해하시는 데 도움이 될 것입니다.
5주 만에 정복한 3가지 핵심 실무 기술
퀸스타운 QRC에서 제공하는 뉴질랜드 데이터 분석가의 과정은 생각보다 체계적이었습니다. 지난 5주 동안 우리는 데이터의 이론보다는 현장에서 즉시 쓰이는 기술에 집중했습니다. 우리가 배운 기술은 아래와 같습니다.
위의 핵심 기술을 알아보기에 앞서 간단하게 데이터 순환 과정을 아래에서 설명드리겠습니다.

제가 짧게 나마 배운 내용은 이렇습니다. 과제로 퀸스타운 에어비앤비 데이터를 한 적이 있습니다. 이 예시를 가지고 설명해 보겠습니다.
Tutor가 퀸스타운 에어비앤비 웹사이트를 Scrape합니다. Scrape는 웹사이트에 있는 모든 자료를 긁어오는 작업을 의미합니다. 이것을 Source(데이터 재료)라고 합니다.
그리고 그 긁어온 자료를 CSV 또는 엑셀 파일로 저장하는 것을 Extraction으로 이해하시면 될 것 같습니다.
Staging Area에서는 CSV 파일 등을 여는 공간입니다. 여기서 중복된 데이터 제거하고, 빈 칸도 채우고, 오타 확인도 하고, 적합한 데이터 타입 변환도 하는 등 데이터 클리닝을 한다고 생각하시면 됩니다.
데이터 클리닝은 끝나면, 깨끗해진 데이터를 Power BI(또는 Tableau)로 옮깁니다. 이것을 Transfer라고 합니다.
하지만, 실제로 완전히 깨끗하다고 생각했던 데이터에 여전히 수정할 것이 발견될 수도 있습니다. 왜냐하면 파일로 보는 것보다 시각화 된 차트를 보는 것이 데이터 오류를 발견할 확률이 높기 때문입니다.
이렇게 2차로 클리닝 작업을 마치고 대시보드로 옮기는 작업을 Load라고 생각하시면 됩니다. 대시보드는 키포인트 데이터를 잡고, 차트를 만들면서 본인만의 인사이트를 담아, 보는 사람들에게 스토리를 들려주는 공간으로 생각하시면 됩니다.
구글 Colab(Jupyter Notebook) : Python
QRC 학교를 시작하기 전에는 저는 데이터 분석을 위해서는 Python이라는 프로그래밍 언어를 무조건 알아야 한다고 생각했습니다. 몰라도 충분히 구글 Colab을 활용하실 수 있습니다.
일단 구글 Colab은 Python이라는 언어를 사용해서 데이터 클리닝을 하는 공간으로 생각하시면 됩니다.
저는 사실 제 노트북에 설치한 Jupyter Notebook을 사용하고 있었는데, 구글 Colab은 클라우드 서버를 이용해서 AI를 사용할 수 있다는 점이 제가 설치한 Jupyter Notebook과 달랐습니다.
클라우드 서버를 이용해서 AI를 사용하면, Python 언어를 몰라도 그냥 자연어로 입력해도 AI가 이것을 이해하고 실행해 줍니다.

해시태그 #을 붙이고 본인이 원하시는 것을 그냥 입력하시면 됩니다. 저는 toy_clean.csv 파일을 여기로 불러와 달라고 요청했습니다.
그 다음 줄에 나오는 import pandas as pd 부터는 제가 한 것이 아닙니다. AI가 제가 입력한 것을 그대로 Python 언어로 코드를 짜고 실행하는 부분입니다.

구글 Colab은 구글 AI인 제미나이를 이용하는데, 저기 파란색 원을 누르시면 AI를 이용해서 코드를 만들 수 있습니다. 한국어든, 영어든 상관이 없습니다. 그래서 제가 Python 언어를 몰라도 구글 Colab을 활용할 수 있다고 한 것입니다.
저는 여기에서 퀸스타운 에어비앤비 CSV 파일 클리닝 작업을 끝냈습니다.
Power Query
Power Query는 Power BI 플랫폼에서 사용하는 데이터 수정 공간 및 기술을 뜻합니다.

구글 Colab에서만 데이터 클리닝 작업을 할 수 있는 것은 아닙니다. 위와 같이 Power Query 편집기에서도 수정이 가능합니다
사실 저의 경우 Python을 미리 공부 했었기에 Colab에서 클리닝 작업을 하는 것을 더 선호했습니다. 하지만, 간단한 수정 작업은 Power Query를 통해서 바로 고치고 확인할 수 있어서 그런 점은 Power Query가 유용했던 것 같습니다.
Power BI
Power BI는 마이크로 소프트에서 만든 데이터 분석 및 시각화 플랫폼입니다. 특히 뉴질랜드에서는 많은 기업들이 데이터 분석과 시각화를 Power BI를 Tableau보다 선호합니다.
이번 과제로 퀸스타운 에어비앤비 데이터 분석으로 만든 Power BI 대시보드입니다.

Power BI에서 워낙 많은 기능을 제공해서, 전체 기능을 다 사용하지도 못했습니다. 신기한 것이 할 때는 분명 잘 되었는데 다음날 똑같은 것을 다시 하려고 하면 항상 기억이 나지 않더군요.
그래도 하나씩 기능을 손대면서 하나씩 익혀 나갔습니다.
퀸스타운 QRC를 5주간 다니면서 배운 핵심 기술 3가지는 위와 같습니다. 기본적으로 첫 주는 데이터의 개념, 두번째 주는 데이터 순환 과정, 그리고 본격적으로 3번째주 부터 데이터 클리닝과 대시보드 만드는 방법을 배우는 것 같습니다.
마무리
오늘은 뉴질랜드 데이터 분석가 입문을 도와준 퀸스타운 QRC 5주간의 핵심 기술 3가지 총정리를 해 보았습니다.
제가 강의가 좋았던 것은 예쁜 대시보드를 만드는 것 보다, 왜 나는 이 작업을 하는 지에 대한 것에 대해서 많은 이야기 오가는 것이 좋았습니다.
계속 얘기하다 보면 내가 왜 이 작업을 하는 지에 대한 이유에 내가 납득이 가는 경우가 많았기 때문입니다.
물론 반대로 토론을 하다 보면, 아 내가 잘못 생각했구나 라는 것이 납득이 가서 방향을 트는 것도 쉽게 가능해서 데이터 분석 작업에서 사람들 간의 소통이 얼마나 중요한 지 깨달었던 것 같습니다.
그래서 뉴질랜드 데이터 분석가는 얼마나 벌고, 뉴질랜드 내에서 얼마나 수요가 있는데 라는 질문을 생각하시는 분들은 아래에 뉴질랜드에서 직업별 연봉 및 수요 현황에 대한 포스팅이 있으니 꼭 한번 읽어 보시기 바랍니다.

