본문 바로가기

패스트캠퍼스데이터분석부트캠프6

[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 13주차 학습일지 이번주는 태블로 강의가 계속 진행됐다. 이중축, 파이차트, 지도 등 태블로에서 사용할 수 있는 다양한 기능들에 대해서 학습했다. 태블로에서 기본적으로 제공되는 SuperStore에서 Returned Sales 관려된 시트를 만들고 대시보드를 제작했다. 태블로는 파이차트 기능은 제공하지만 도넛차트 기능은 제공하지 않는다. 그래서 일종의 꼼수? 를 사용해야한다. 열 선반에 MIN(1)을 두가지를 만들면 도넛차트 두개가 만들어지게 된다. 그 다음에 필터마다 색깔을 지정하고 가운데에 들어갈 차트를 하얀색으로 만들어서 이중축을 설정하면 파이차트안에 하얀색 원이 들어가게 되어 도넛차트처럼 보이게 된다. 이제 다음주부터 태블로 프로젝트가 진행되는데 태블로로 데이터 분석 프로젝트는 진행해본적이 없어서 약간 걱정되.. 2025. 5. 26.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 8주차 학습일지 이번 주는 SQL 문법 구조를 정리하고, 실습으로는 orders.csv 파일을 MySQL 데이터베이스에 직접 업로드하는 과정을 수행했다. 특히 csv 데이터를 DB로 옮기는 작업은 예전부터 궁금했던 부분이었는데, 실제 코드로 구현하면서 이해할 수 있었다. 1. SQL 종류DML (데이터 조작): SELECT, INSERT, UPDATE, DELETEDDL (데이터 정의): CREATE, DROP, ALTERDCL (권한 제어): GRANT, REVOKE2. SELECT 문 흐름작성 순서:SELECT → FROM → JOIN → WHERE → GROUP BY → HAVING → ORDER BY → LIMIT실행 순서:FROM → JOIN → WHERE → GROUP BY → HAVING → SELECT →.. 2025. 4. 20.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 7주차 학습일지 이제 데이터 분석가의 핵심 역량인 SQL을 배우기 시작했다. DBMS란? : Database Management System의 약자로 데이터를 체계적으로 저장, 검색, 수정할 수 있게 해주는 소프트웨어 시스템을 의미한다.사람들이 주로 사용하는건 관계형 DBMS -> 대표적으로 MySQL, DBeaver, Oracle등이 있다. SQL은 DBMS를 조작하고 절의하기 위한 표준 언어이다.구분명령어역할데이터 정의 (DDL)CREATE, DROP테이블 구조 정의 및 삭제데이터 조작 (DML)SELECT, INSERT, UPDATE, DELETE테이블 내 데이터 조회 및 변경데이터제어 (DCL)GRANT, REVOKE권한 부여 및 회수트랜잭션 제어 (TCL)COMMIT, ROLLBACK작업 저장/취소 등 제어 S.. 2025. 4. 13.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 3주차 학습일지 이번주차는 셀레늄을 활용한 크롤링을 학습했다.네이버 부동산, 맛집 크롤링, 구글 뉴스 수집, 구글 플레이스토어 리뷰 수집,  DBPIA 논문 수집, SRT 예매 등을 진행했다. 가장 많은 개념이 들어가있는 구글 플레이 스토어 리뷰를 정리해보겠다. 1. 우선 selenium 라이브러리를 불러온다from selenium import webdriverfrom selenium.webdriver.common.by import By 2. 다음으로 webdriver를 사용해서 크롬드라이버를 실행한다.browser = webdriver.Chrome() 3. 이제 크롤링하고자하는 곳의 링크를 가져온다.url = 'https://play.google.com/store/apps/details?id=com.coupang.mo.. 2025. 3. 21.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 3주차 학습일지 이번 주차부터 본격적으로 파이썬 강의가 시작됐습니다. 파이썬은 자주 사용했었지만 기초를 탄탄히 하자는 생각으로 강의에 임하고 있습니다. 실제로 강의를 듣다 보니 중간중간 비어 있는 부분이 있었네요. 이번 주에는 파이썬 첫 주차인 만큼 파이썬의 기초 문법에 대해 학습했습니다. 1. 파이썬 자료형 (Data Type)1. 숫자형 (Number) : 파이썬에서 숫자형 데이터 타입은 숫자 데이터를 표현하기 위해 사용됩니다. 주요 타입은 다음과 같습니다.정수(int) : 소수점 없는 숫자실수(float) : 소수점을 표함한 숫자a = 10 # 정수b = 3.14 # 실수 2. 문자형 (String) : 문자형은 큰 따옴표("") 또는 작은 따옴표('')에 감싸져 있는 형태입니다.text = "H.. 2025. 3. 14.
[패스트캠퍼스] 커널 아카데미 데이터 분석 부트캠프 18기 2주차 학습일지 1. 기초 통계변량, 도수, 상대 도수, 도수분포표, 히스토그램이번 주 학습에서는 변량(Variable)과 도수(Frequency), 상대 도수(Relative Frequency)의 개념을 학습하였다. 변량은 데이터의 개별 값들을 의미하며, 도수는 특정 변량이 나타나는 횟수, 상대 도수는 전체 데이터에서 해당 변량의 비율을 의미한다. 이를 정리하여 도수분포표를 만들고, 이를 시각적으로 표현하는 히스토그램을 활용하는 방법을 익혔다.평균, 분산, 표준편차 개념평균(Mean)은 데이터의 중심 값을 나타내며, 분산(Variance)은 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 측정하는 값이다. 표준편차(Standard Deviation)는 분산의 제곱근으로, 데이터의 흩어진 정도를 직관적으로 이해하는 데 유.. 2025. 3. 7.