본문 바로가기

데이터분석6

[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 8주차 학습일지 이번 주는 SQL 문법 구조를 정리하고, 실습으로는 orders.csv 파일을 MySQL 데이터베이스에 직접 업로드하는 과정을 수행했다. 특히 csv 데이터를 DB로 옮기는 작업은 예전부터 궁금했던 부분이었는데, 실제 코드로 구현하면서 이해할 수 있었다. 1. SQL 종류DML (데이터 조작): SELECT, INSERT, UPDATE, DELETEDDL (데이터 정의): CREATE, DROP, ALTERDCL (권한 제어): GRANT, REVOKE2. SELECT 문 흐름작성 순서:SELECT → FROM → JOIN → WHERE → GROUP BY → HAVING → ORDER BY → LIMIT실행 순서:FROM → JOIN → WHERE → GROUP BY → HAVING → SELECT →.. 2025. 4. 20.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 3주차 학습일지 이번주차는 셀레늄을 활용한 크롤링을 학습했다.네이버 부동산, 맛집 크롤링, 구글 뉴스 수집, 구글 플레이스토어 리뷰 수집,  DBPIA 논문 수집, SRT 예매 등을 진행했다. 가장 많은 개념이 들어가있는 구글 플레이 스토어 리뷰를 정리해보겠다. 1. 우선 selenium 라이브러리를 불러온다from selenium import webdriverfrom selenium.webdriver.common.by import By 2. 다음으로 webdriver를 사용해서 크롬드라이버를 실행한다.browser = webdriver.Chrome() 3. 이제 크롤링하고자하는 곳의 링크를 가져온다.url = 'https://play.google.com/store/apps/details?id=com.coupang.mo.. 2025. 3. 21.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 3주차 학습일지 이번 주차부터 본격적으로 파이썬 강의가 시작됐습니다. 파이썬은 자주 사용했었지만 기초를 탄탄히 하자는 생각으로 강의에 임하고 있습니다. 실제로 강의를 듣다 보니 중간중간 비어 있는 부분이 있었네요. 이번 주에는 파이썬 첫 주차인 만큼 파이썬의 기초 문법에 대해 학습했습니다. 1. 파이썬 자료형 (Data Type)1. 숫자형 (Number) : 파이썬에서 숫자형 데이터 타입은 숫자 데이터를 표현하기 위해 사용됩니다. 주요 타입은 다음과 같습니다.정수(int) : 소수점 없는 숫자실수(float) : 소수점을 표함한 숫자a = 10 # 정수b = 3.14 # 실수 2. 문자형 (String) : 문자형은 큰 따옴표("") 또는 작은 따옴표('')에 감싸져 있는 형태입니다.text = "H.. 2025. 3. 14.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 2주차 학습일지 1. 기초 통계변량, 도수, 상대 도수, 도수분포표, 히스토그램이번 주 학습에서는 변량(Variable)과 도수(Frequency), 상대 도수(Relative Frequency)의 개념을 학습하였다. 변량은 데이터의 개별 값들을 의미하며, 도수는 특정 변량이 나타나는 횟수, 상대 도수는 전체 데이터에서 해당 변량의 비율을 의미한다. 이를 정리하여 도수분포표를 만들고, 이를 시각적으로 표현하는 히스토그램을 활용하는 방법을 익혔다.평균, 분산, 표준편차 개념평균(Mean)은 데이터의 중심 값을 나타내며, 분산(Variance)은 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 측정하는 값이다. 표준편차(Standard Deviation)는 분산의 제곱근으로, 데이터의 흩어진 정도를 직관적으로 이해하는 데 유.. 2025. 3. 7.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 1주차 학습일지 커널 아카데미 데이터 분석가 부트캠프가 시작됐습니다.1주차는 빅데이터에 대한 대략적인 개념에 대해 학습하고 엑셀 공부로 이루어져있습니다. 1.  엑셀 기초상대참조 : 함수를 복사 / 붙여 넣기 할때 참조된 셀이 함께 이동하는 참조  절대참조 : 함수를 복사/붙여넣기 해도 참조된 셀이 이동하지 않는 참조 상황에 따라서 상대참조와 절대참조를 적절하게 사용해야한다.  2. 엑셀 함수 COUNT 함수 : 특정 범위에서 "숫자 데이터"가 들어가 있는 셀의 개수 파악=COUNT(C5:C12) COUNTA 함수 : 특정 범위에서 데이터가 들어가 있는 셀(비어 있지 않은 셀)의 개수 파악=COUNTA(C5:C12) COUNTBLANK 함수 : 특정 범위에서 비어있는 셀의 개수 파악=COUNTBLANK(C5:C12) C.. 2025. 2. 28.
RFM 분석: 고객 세분화를 위한 핵심 전략 RFM 분석이란? RFM 분석은 고객의 구매 행동을 기반으로 고객을 세분화하는 기법으로, Recency(최근성), Frequency(빈도), Monetary(금액) 세 가지 지표를 활용합니다. 기업은 이 분석을 통해 고객 가치를 평가하고, 맞춤형 마케팅 전략을 수립할 수 있습니다. RFM 지표 정의Recency(최근성) : 고객이 마지막으로 구매한 날짜Frequency (빈도) : 일정 기간 동안 고객이 구매한 횟수Monetary (금액) : 일정 기간 동안 고객이 소비한 총 금액 일반적으로 고객의 구매 빈도와 금액만으로 충성도를 판단하는 것은 한계가 있습니다. 예를 들어, 구매 금액이 높더라도 오랫동안 구매하지 않은 고객은 브랜드에 대한 관심이 줄어들었을 가능성이 있습니다. 반면, 최근 지속적으로 구매.. 2025. 2. 25.