본문 바로가기

분류 전체보기136

SQL lv3 오랜 기간 보호한 동물(2) with dd as ( SELECT i.ANIMAL_ID as ANIMAL_ID, DATEDIFF(o.DATETIME, i.DATETIME) as dd FROM ANIMAL_INS i JOIN ANIMAL_OUTS o on i.ANIMAL_ID = o.ANIMAL_ID ) SELECT i.ANIMAL_ID, i.NAME FROM ANIMAL_INS i join dd on i.ANIMAL_ID = dd.ANIMAL_ID ORDER BY dd.dd desc limit 2 조회 시 ID와 NAME만 출력하기 위해 with 절 사용하여 key인 animal_id 컬럼과 DATEDIFF 사용한 컬럼으로 dd를 만들었다. 이후 id와 이름만 조회하고 with절과 join 하여 내림차순 정렬 후, 2개만 출력하기 위.. 2024. 4. 22.
GPT에게 고유벡터와 고유값 배우기 2024. 4. 22.
프로그래머스 데이터분석 데브코스 11-1 (선형대수) 선형대수 수 들이 모여있는 개념과 관련된 식을 연구하는 수학의 한 분야 수가 모여 있다는 것은 벡터 혹은 행렬이라고 함 수를 다루는 많은 학문 (데이터, 공학, 과학적 분석 등)에서 수의 연산을 빠르고 효과적으로 하기 위해 사용하는 도구 수의 집합을 기하학적인 형상으로 적용 하여 표현 시각적이고 직관적으로 수의 값을 이해 할 수 있음 기하학적으로 의미를 갖는 다양한 변환을 수학적으로 정의할 수 있음(회전, 스케일링 등) 수의 집합 : 스칼라, 벡터 행렬, 텐서 숫자는 특정한 방향으로 줄을 서듯 모일 수 있음 방향을 보통 차원이라고 부름 숫자들이 얼마나 모이는지에 따라 크기가 정해짐 스칼라 : 다른 숫자와 함꼐하지 않고 홀로 존재하는 수 벡터 : 한쪽 방향(차원)으로만 숫자가 모인 형태 → 1차원 행렬 :.. 2024. 4. 22.
프로그래머스 데이터분석 데브코스 11-1 (머신러닝의 기초) 머신러닝 데이터에서 지식을 추출하는 방법 머신 스스로가 데이터를 바탕으로 그 안에 있는 특징과 패턴을 찾아냄 특징과 패턴을 바탕으로 새로운 데이터에 대한 추론을 진행 명시적 프로그램 : 규칙 기반 전문가 시스템 (Rule-Based Expert System) 장점 처리 과정을 사람이 이해하기 쉬움 작은 데이터에서 효과적 단점 특정 규칙은 한 분야나 작업에 국한 변경에 대응이 어려움 규칙 설계 시 해당 문야의 전문가가 필요 머신러닝 명시적 프로그램의 한계를 극복할 수 있는 기법 데이터 내부에서 자주 발생하는 특징과 패턴을 감지 그러한 특징과 패턴을 Feture 문제를 해결하기 위한 판단 기준을 시스템 스스로 찾아냄 장점 예상치 못한 상관 관계를 파악하는데 탁월 특정 도메인에서 전문가가 필수로 필요하지 않음.. 2024. 4. 22.
SQL lv4 보호소에서 중성화 한 동물 SELECT i.ANIMAL_ID, i.ANIMAL_TYPE, i.NAME FROM ANIMAL_INS i JOIN ANIMAL_OUTS o on i.ANIMAL_ID = o.ANIMAL_ID where i.SEX_UPON_INTAKE != o.SEX_UPON_OUTCOME ORDER BY 1; ID, type, 이름을 출력하기 위한 select와 들어올 당시 중성화가 안되었지만 나갈 당시 중성화 된 동물 은 Upon 필드의 값이 다를것이기에 where 절에 비교문으로 처리하고 이름순으로 조회하기 위해 order by 사용했다. 2024. 4. 19.
프로그래머스 데이터분석 데브코스 10-3 (마케팅 지표) 접점 (Tuch Point) 제품/서비스를 고객에게 노출시키는 다양한 방법 크게 오프라인과 온라인 접점으로 나뉨 고객이 우리 서비스를 접하게 되는 다양한 방법, 혹은 경로 보통 온라인에 중점을 주지만 매장 방ㅁ누 혹은 Tv/신문광고와 같은 오프라인 접점도 존재 온라인 접점을 포커스로 진행 고객 접점 경로의 시간순 기록이 디지털 마케팅 데이터 분석의 시작 접점들은 페이스북, 구글, 네이버와 같은 마케팅 플랫폼이 되며 이를 채널이라고 부르기도 함 접점 = Touch Point = 채널 디지털 마케팅 디지털 접점(온라인)에 우리 서비스/제품에 대한 광고를 내는 것 이는 보통 캠페인이란 형태로 행해지고 구체적인 타켓 고객층을 갖고 시작 회사에 따라서는 다수의 접점에서 동시에 동일한 목적을 갖는 마케팅을 시작 크.. 2024. 4. 19.
SQL lv2 성분으로 구성한 아이스크림 총 주문량 SELECT I.INGREDIENT_TYPE, SUM(H.TOTAL_ORDER) FROM FIRST_HALF H INNER JOIN ICECREAM_INFO I ON I.FLAVOR = H.FLAVOR GROUP BY 1 두 테이블간 키로 join 하여 아이스크림 성분 타입 group by 진행했다. 2024. 4. 19.
프로그래머스 데이터분석 데브코스 10-3 (이커머스 지표) 서비스 사용 고객 활성 (Active) 정의 사용자가 활성 상태에 관한 명확한 정의가 중요 -> 지표 사전의 필요성 단순 로그인을 활성으로 볼 것인가? 아니라면 어떤 행동을 의미있는 행동이라 볼 것인가 DAU (Daily Active User) WAU (Weekly Active User) MAU (Monthly Active User) 잔존율/이탈율/수명 잔존율 = 재방문율 = 재구매율 사실 이 지표는 구독 기반 B2B 비지니스에서 더 중요 사용자 이탈율 보통 월 기준으로 사용자가 우리 서비스를 이탈하는지 여부를 보는 지표 반대는 사용자 잔존율 고객 잔존율은 고객이 계속해서 서비스를 사용하는 비율 고객 이탈율 = 1 - 고객 잔존율 고객 이탈을 예측할 수 있다면 이메일 마케팅등을 통해 재소통 시도가 가능 .. 2024. 4. 17.
프로그래머스 데이터분석 데브코스 10-3 (좋은 지표의 특성, 지표) 다양한 지표들을 배워서 글 하나에 다 적기보다는 나누어 적는게 낫다고 판단했다. 지표(KPI)는 왜 필요한가? 목표 설정과 집중 성과 측정 의사 결정 동기 부여 및 책임감 리소스 할당 (우선 순위) 추상적인 목표를 가시적이고 측정 가능한 목표로 전환 조직이 진행 상황을 추적하여 정보에 입각한 의사 결정 KPI(Key Performance Indicator) 조직 내에서 달성하고자 하는 중요한 목표 보통 정량적인 숫자가 선호됨 예를 들면 매출액, 혹은 유로회원의 수/비율 명확한 정의가 중요함 -> 지표 사전이 필요 KPI의 수는 적을수록 좋음 The Less is More Primary vs Secondary 잘 정의된 KPI -> 현재 상황을 알고 더 나은 계획 가능 정량적이기에 시간에 따른 성과를 추적.. 2024. 4. 17.