전체 글131 sql 조건에 맞는 도서와 저자 이름 출력하기 SELECT b.BOOK_ID, a.AUTHOR_NAME, DATE_FORMAT(b.PUBLISHED_DATE, '%Y-%m-%d') as PUBLISHED_DATE from book b inner join AUTHOR a on a.AUTHOR_ID = b.AUTHOR_ID where b.CATEGORY = '경제' order by 3 두 테이블간 공통된 컬럼인 AUTHOR_ID 컬럼을 기준으로 JOIN 했다. 출력을 timestamp가 아닌 yyyy-mm-dd 형식으로 출력하기 위해 DATE_FORMAT 사용했다. 카테고리 필터링을 위해 where절 사용했다. 2024. 4. 5. sql 조건에 맞는 아이템들의 가격의 총 합 구하기 select sum(PRICE) as TOTAL_PRICE from ITEM_INFO where RARITY = 'LEGEND' 가격의 총합을 위해 sum, 컬럼명 지정을 위해 as 희귀도를 필터링 하기 위해 where절 사용했다. 2024. 4. 5. 프로그래머스 데이터분석 데브코스 8-4 https://arin-nya.tistory.com/52 기초 통계 함수 바퀴 다시만들기 (1) 프로그래머스 데이터분석 데브코스 진행중에 통계, 확률쪽 이해도 잘 안되고 머리에 쉽게 정착하지 못해서 바퀴 다시만들기를 시작했다. 과정을 이해하기 위해 일부러 길게 작성한 부분도 있다 arin-nya.tistory.com 요번주 통계, 확률쪽 이해가 잘 되지 않아 기본적인 함수들의 정의를 코드로 구현하여 다른 포스트에 정리하였다. 전세계적으로 참 핫한 ML의 기본적인 부분을 배웠다. 수식도 많고 시각자료도 많아 반드시 기억해야 할것같은 부분, 이전에 비슷한 문제로 고통받았던 부분만 정리할 예정이다. 데이터 모델링의 정의 주어진 데이터에서 사용하고자 하는 x, 알고싶은 값 y가 있을 때 y = f(x) 라는 함.. 2024. 4. 4. 기초 통계 함수 바퀴 다시만들기 (1) 프로그래머스 데이터분석 데브코스 진행중에 통계, 확률쪽 이해도 잘 안되고 머리에 쉽게 정착하지 못해서 바퀴 다시만들기를 시작했다. 과정을 이해하기 위해 일부러 길게 작성한 부분도 있다. 평균 def mean(n) : a = sum(n) m = a/len(n) return m 중앙값 def middle(n): sorted_n = sorted(n) len_n = len(sorted_n) if len_n %2 == 0 : return (sorted_n[len_n//2-1] + sorted_n[len_n//2]) /2 else : return (sorted_n[len_n//2]) mode / 최빈값 def mode(n) : a = {} for i in n : if i in a : a[i] += 1 else : .. 2024. 4. 4. 프로그래머스 데이터분석 데브코스 8-3 8-2에 배운 내용들은 주로 확률, 통계에 관한 내용이었는데 수식이 너무 많고 이해를 제대로 하지 못한 상태여서 기본적인 개념들 바퀴를 다시 만드는 작업을 하며 익히는 중이다. 8-3에서는 python의 matplotlib, seaborn 라이브러리에 대해 배웠다. matplotlib은 어째서인지 가장 처음 접한 라이브러리여서 익숙했다. seaborn의 존재는 알았지만, 산점도 히트맵 같은 기술이 그간 필요한 경우가 없었어서 접하지 못했었다. 가볍게 새로 알게된 부분들만 정리하겠다. 시각화 데이터 분석 결과를 plot이나 graph등을 통해 시각적으로 전달하는 방법 통계수치를 사용한 정량적 분석이 정확한 분석 내용을 전달하는데 강점이 있다면, 시각화는 데이터 분석 내용을 한눈에 볼 수 있게 내용을 효과적.. 2024. 4. 3. 프로그래머스 데이터분석 데브코스 8-1 5주차 프로젝트를 진행하며 분석에 대한 지식이 많이 부족하다는것을 다시한번 알게되었다. 어떻게 해결해야 할까 싶었는데 마침 8주차 강의가 분석에 관한 지식들인 것 같아서 즐겁다. 그래서인지 평소보다 정리가 정성스럽게 되었다. 데이터 분석을 해야 하는 이유. 데이터를 정리, 변환, 조작, 검사 하여 인사이트를 추출하는 작업. 의사결정 판단 기준이 주관적인 직감 에서 객관적인 데이터로. 주어진 데이터로 문제를 해결할 수 있을지 없을지 가늠 하는것 또한 데이터 분석이다. 분석보다는 어떻게 해결할지에 대한 고민이 중요 데이터 분석 프로세스 문제 정의 풀고자 하는 문제가 명확하지 않으면 데이터 분석은 무용지물 큰 문제를 작은 단위의 문제로 궁극적으로 해결하고자 하는 문제가 무엇인가. 해당 문제를 일으키는 원인이 .. 2024. 4. 1. 행복 기쁨 2024. 3. 31. 프로그래머스 데이터분석 데브코스 7-5 레퍼런스의 지진해일이 드디어 지나갔다. 계속 써보면서 계속 찾아보는것이 더 빠르게 익혀지기에 기억에 남는, 진짜 찾아보지 않는이상 모르는, 새로 접한것들을 가볍게 정리할 예정이다. 조건문 df[df['A'] > 3] 이렇게 사용하면 df['A']에서 3 이상인 것들만 추출한다. 또한 여기서 df['A'] > 3은 'A' 컬럼의 각 요소에 대해 > 3이라는 조건을 벡터화 방식으로 적용하고, 그 결과는 각 요소가 조건을 만족하는지 여부에 따른 Boolean 값의 시리즈가 된다. 벡터화 연산 벡터화 연산을 배우지는 않았지만 강력한 기능인 것 같아서 정리하려고 한다. predictions = rf.predict(ds_test) n_predictions = (predictions > 0.5).astype(bool.. 2024. 3. 29. 프로그래머스 데이터분석 데브코스 7-2 pandas 2일차, Series에 대해 배웠다. pandas 하면 Dataframe을 주로 접했기에 Series를 접할일이 크게 없었다. numpy array나 Series로 반환되는게 있을때면 to_list 사용한 후 list로 작업하거나 다시 DataFrame으로 만들어서 작업했었다. 그래서인지 오늘 강의 내용에서 신선한 충격을 준 것들이 몇가지 있었다. 오늘 내가 새롭게 배운것들을 가볍게 정리해 보겠다. 강의 중 실습하는 과정이 있었는데 그중에서 막혔던, 새로운 방법들이 있었던것을 간추렸다. df = pd.read_csv("TopRichestInWorld.csv", usecols=["Age"]).squeeze() df.index = pd.read_csv("TopRichestInWorld.csv",.. 2024. 3. 26. 이전 1 ··· 7 8 9 10 11 12 13 ··· 15 다음