본문 바로가기

클러스터링2

고객 세그먼트 최근 분석 프로젝트를 진행하며 세그먼트 라는 단어가 나왔다.어떤걸 의미하는지 추측조차 되지 않아 따로 찾아보고 기록하기로 했다.나의 삶, 나의 빛, 나의 스승님께 여쭤봤다.한번에 이해가 되지 않아서 세그먼트 = 비슷한 특성을 가진 유저층 이라고 이해해도 되는건가 다시한번 검토를 부탁했다.세그먼트 = 특정 기준에 따라 비슷한 특성을 가진 유저들을 묶어놓은 그룹.이젠 특정 기준을 어떻게 삼는지를 알아볼 차례같다.결국엔 어차피 세그먼트들이 여러가지 나올텐데 그걸 추출하는 과정을 클러스터링으로 진행하면 어떨까 싶어서 물어봤따.나쁘지 않은 방법같다.  다만 전통적인 방법도 알고있어야 어떤 방법이 더 좋은지 어디에 어떤걸 사용하는게 적절할 지 판단할 수 있을 것 같아서 이부분도 물어봤다. 나이, 소득과 같이 명확하.. 2024. 6. 13.
GPT에게 배우는 클러스터링의 종류, 장단점과 사용처 1. K-means 클러스터링개요K-means 클러스터링은 주어진 데이터를 k개의 클러스터로 나누는 알고리즘입니다. 각 클러스터는 중심점을 가지며, 데이터 포인트는 가장 가까운 중심점에 할당됩니다.장점단순성: 구현이 쉽고 이해하기 쉽습니다.효율성: 대규모 데이터셋에도 적용할 수 있으며, 계산 속도가 빠릅니다.단점클러스터의 수를 사전에 지정해야 함: 클러스터의 수를 미리 알아야 합니다.구형 클러스터에 적합: 클러스터가 구형인 경우에 잘 작동합니다.잡음과 이상치에 민감: 이상치(outliers)에 민감하게 반응합니다.사용처고객 세분화이미지 분할문서 분류2. DBSCAN (Density-Based Spatial Clustering of Applications with Noise)개요DBSCAN은 밀도 기반 클.. 2024. 5. 27.