본문 바로가기
프로그래머스/데이터분석 데브코스 프로젝트

나는 왜 프로젝트를 두번이나 엎었는가.

by 포잉띠 2024. 6. 11.

최근 데이터 분석 프로젝트를 진행하며 엄청 좋은 기획이었음에도 불구하고 두 번이나 엎었다.

 

처음 엎은것은 분석이 아닌 머신러닝 + 웹 프로젝트가 되어버릴 것 같았고, 데이터를 구하고 처리하기에 시간이 촉박했기에 팀원들과 상의 후 플랜 B를 진행하기로 했다.

 

음악 관련, 운세 관련 사용자 로그데이터를 얻는건 사실상 불가능했다. 그래서 비교적 많이 뿌려져 있는 공공데이터를 이용하여 노인 관련 분석 프로젝트로 방향을 틀었다.

하지만 여기에서도 난관에 부딪혔다. 품질이 좋은 데이터는 직접 관련 기관에 가서 분석을 하고 결과만 가지고 나와야 했다. 그 외에는 분석을 하기에는 이미 특정 목적을 위해 수집된 데이터들이었다. 노래 데이터는 크롤링이라도 하면 메타데이터를 구할 수 있었지만 이번 같은 경우에는 오프라인 기반 데이터이다보니 더욱 난이도가 높아졌다.

문제 정의 또한 정확하지 않았다. 문제 정의를 위한 가설을 위한 가설을 위한 가설을 증명하는 느낌이라 이번에도 팀원들과 상의 후 플랜 B를 기획하던 도중 나왔던 캐글의 데이터셋으로 방향을 다시한번 틀기로 했다.

 

캐글은 그간 항상 접해왔기 때문에 외국의 데이터, 생성된 데이터가 아닌 한국의 데이터로 분석을 해보고 싶은 욕심이 있었다.

아쉬운 마음은 뒤로하고 빠르게 진행중에 있다.

확실히 목표 설정이 예전보다 빠르고 의미있는 목표를 설정하게 된 것 같다.

몇개월 전만 해도 수많은 차트를 찍어내며 이해하기 쉬운걸 고르곤 했는데, 이제는 이거랑 이거랑 차트를 그려야겠다. 하면서 진행한다. 정체된 것 같아 조금은 걱정이었는데 내가 내 생산력에 조금 놀랐다.

 

이전 프로젝트에서 아쉬웠던 부분들이 다시 발생하지 않는걸 목표로 진행해야겠다.

두번이나 엎은만큼 더욱.