프로그래머스/데이터분석 데브코스 프로젝트5 나는 왜 프로젝트를 두번이나 엎었는가. 최근 데이터 분석 프로젝트를 진행하며 엄청 좋은 기획이었음에도 불구하고 두 번이나 엎었다. 처음 엎은것은 분석이 아닌 머신러닝 + 웹 프로젝트가 되어버릴 것 같았고, 데이터를 구하고 처리하기에 시간이 촉박했기에 팀원들과 상의 후 플랜 B를 진행하기로 했다. 음악 관련, 운세 관련 사용자 로그데이터를 얻는건 사실상 불가능했다. 그래서 비교적 많이 뿌려져 있는 공공데이터를 이용하여 노인 관련 분석 프로젝트로 방향을 틀었다.하지만 여기에서도 난관에 부딪혔다. 품질이 좋은 데이터는 직접 관련 기관에 가서 분석을 하고 결과만 가지고 나와야 했다. 그 외에는 분석을 하기에는 이미 특정 목적을 위해 수집된 데이터들이었다. 노래 데이터는 크롤링이라도 하면 메타데이터를 구할 수 있었지만 이번 같은 경우에는 오프라인 기반.. 2024. 6. 11. ML 예측 모델 구현 프로젝트 셀프리뷰 xgboost 모델 구현, 학습 notebookhttps://www.kaggle.com/code/arinmu/pubg-xgb/notebook pubg xgbExplore and run machine learning code with Kaggle Notebooks | Using data from PUBG Finish Placement Prediction (Kernels Only)www.kaggle.com EDA, 전처리 과정 notebookhttps://www.kaggle.com/code/arinmu/pubg-eda pubg edaExplore and run machine learning code with Kaggle Notebooks | Using data from PUBG Finish Placement.. 2024. 5. 15. 프로그래머스 데이터분석 데브코스 2차 프로젝트 자료 2024. 4. 16. 프로그래머스 데이터분석 데브코스 1차 프로젝트 셀프리뷰 프로젝트 목표는 데이터셋을 구해서 SQL과 Excel, Tableau 같이 지금까지 과정에서 배운걸 사용하여 분석을 진행하는 것이다. 2024년 3월 11일부터 2024년 3월 20일까지 약 10일간 진행하였다. 처음은 아래 링크의 데이터셋으로 분석을 진행했다. https://www.kaggle.com/datasets/ayushparwal2026/online-ecommerce Online-eCommerce buying and selling of goods or services over the world. www.kaggle.com 단순히 보았을때 결측치가 적었고 데이터셋 이해하기가 쉬울것 같아서 조원들에게 이 데이터셋을 사용해서 진행하자고 했다. 하지만 유의미한 결과를 찾기 힘들었고, 데이터가 잘못 적재.. 2024. 3. 25. 프로그래머스 데이터분석 데브코스 1차 프로젝트 자료 Query with count_r_c as( SELECT FORMAT_TIMESTAMP('%Y-%m', o.created_at) AS year_month, count(case when o.status = 'Returned' then 1 end) as returned, count(case when o.status = 'Cancelled' then 1 end)as cancelled, count(case when o.gender = 'F' then 1 end) as order_by_female, count(case when o.gender = 'M' then 1 end) as order_by_male FROM `bigquery-public-data.thelook_ecommerce.orders` o group .. 2024. 3. 25. 이전 1 다음