일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 프로젝트
- 러닝스푼즈
- tableau
- Python
- trouble shooting
- 데이터분석
- Tableau Desktop Specialist
- 파이썬
- 유데미코리아
- 코테
- 실습
- 취업부트캠프
- 회고록
- 2024년
- 쿼리테스트
- 부트캠프후기
- 프리온보딩
- 데이터분석가
- 태블로
- 유데미부트캠프
- SQL
- 유데미
- 자격증준비
- 자격증
- 데이터시각화
- AICE
- 코딩테스트
- MySQL
- 스타터스부트캠프
- 프로그래머스
- Today
- Total
목록데이터시각화 (10)
신이 되고 싶은 갓지이

Day2는 Tableau의 계산식에 대한 내용이었다. 태블로의 계산식에서는 행과 집계의 차이에 대해서 이해해야한다. 태블로에서는 자동으로 측정값 집계가 되어있는데 이는 측정값 집계가 풀려있을 때와는 차이를 보인다. ✔️ 행 수준의 계산식 모든 행에 대해 계산 수 결과값을 집계 [수익] / [매출] 모든 행에 대해 결과 값이 실체와되기 때문에 처리 로직을 다시 실행할 필요가 없음 ✔️ 집계 수준 계산식 각 필드 값을 집계한 후에 계산 SUM([수익]) / SUM([매출]) View에 사용된 차원에 따라 집계값이 달라지기 때문에 Tableau 데이터 추출에서 실체화 될 수 없음 이 두 차이때문에 많이 발생하는 오류가 바로 '집계 인수 및 집계되지 않은 인수를 이 함수와 혼합할 수 없습니다.' 라는 계산식 ..

2023.04.24~2023.04.28 학습 일지 이번주에는 저번주의 수업을 마지막으로 수업이 끝났고, 그동안 배운것을 총 집합하여 해커톤을 진행했다. 우리조는 주제를 정하는데 정말 많은 시간이 걸리고 힘든 시간을 걸렸지만 결국 '다독자 이용 현황을 기반으로 한 도서 선택 카테고리 추가 방안'에 대한 주제를 잡아 분석을 진행했다. 진행하면서 하나 걱정이었덤 부분은 결론적으로 나오는 시각화가 많지 않으며 거의 대부분 리스트 형태인것이 매우 아쉬웠고, 이를 좀 덜 없어보이게(?) 하기위해서는 디자인과 심미적인 부분이 매우 중요했는데 이런 부분이 잘 되지 않은것 같아 아쉬웠다. PPT제작에 신경을 쓰다보니 Tableau 대시보드에는 많이 신경을 쓰지 못 했는데 결과가 100% 마음에 들게 나오지 않아서 하루만..

2023.04.17~2023.04.21 학습 일지 저번주에 이어 이번주에도 Postgre SQL을 마저 공부하고 마지막 3일은 미니 프로젝트를 진행했다. ✔️ 교집합&차집합 1. INTERSECT : 교집합 개념. TableA와 TableB에서 select 하는 컬럼은 동일해야한다. 2. EXCEPT : 차집합 개념. TableA기준으로 TableB에는 없거나 내용이 같지 않은 데이터를 리턴. TableA와 TableB에서 select 하는 컬럼은 동일해야한다. ✔️ Decil 분석 Decil 분석은 데이터를 10단계로 분할하여 중요도를 파악하는 방법이다. 고객의 총 매출액 기준으로 정렬 상위부터 10%씩 나누어 10개의 그룹 할당 (ntile함수 사용) decil별 매출합계 decil별 구성비 de..

2023.03.27~2023.03.31 학습 일지 이번주는 여러 심화 그래프를 만들어보았다. 많이 메뉴얼하기에 자동화하기 힘들고, 만들기 어렵다는 단점이 있지만 다른 기본 그래프에 비해 비교적 화려하기에 많이 사용된다고 한다. 또한 마지막 파이널 해커톤을 위해 다음주 자격증 시험을 준비하기 전에 마지막으로 간이 해커톤을 진행해보았다. ✔️ 분석가로서 발생 할 수 있는 오류 1. 만약 대부분의 경우에 다 동일한 흐름을 갖는데 일부분만 흐름에 안 맞는다면? → 데이터 자체가 문제인 경우도 있지만 그보다도 국가적인 차원(세금, 정책 등) 또는 시장 흐름상 그러한 경우가 생길 수 도 있다. 이럴떈 생각이나 가설 없이 그냥 있는 그대로 객관적으로 보여줘라. 다 알려고 하지말고, 다 알수도 없다. 2. 분석 전..

2023.03.20~2023.03.24 학습 일지 이번주에는 지난주 동안 진행한 프로젝트에 대한 전반적인 피드백으로 발표시 중요한 포인트와 여러 함수에 대해서 배우고 배운 함수들을 복습해보고 스스로 대시보드를 만들어보는 개인 학습이 많았다. ✔️ 발표시 중요한 point ⭐️문제 정의 파트⭐️ : 이부분이 제일 중요하다! 여기서 발표 전체적인 흐름이 시작되고 발표 전반적인 평가가 판가름 나는 경우가 많다. 발표는 두괄식으로 : 발표할때는 줄줄이 설명식이 아닌 결론 부터 언급하는 것이 좋다. 처음 발표시 간단하게 분석 데이터 셋에 대해 설명하자. 불리한 그래프는 사용하지 말자. 불리할거같으면 숫자만 언급 하는 식으로 유리한 쪽으로만 보여주는것이 낫다. ✔️ primary 함수 window : sum, av..
1. 서울시 코로나19 확진자 동선 추이¶ 데이터 준비하기¶ In [2]: import pandas as pd import matplotlib.pyplot as plt 폰트 및 언어 확인하기¶ In [42]: plt.plot([1,2,3],[4,5,6]) plt.title('그래프') plt.show() In [41]: # 그래프를 노트북 안에 그리기 위해 설정 %matplotlib inline # 필요한 패키지와 라이브러리 가져온다. import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.font_manager as fm # 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처 mpl.rcParams['axes.unicode_m..

2023.02.27~2023.03.03 학습 일지 1️⃣ 디자인 씽킹 데이터 드리븐 이번주는 디자인 씽킹의 마지막 수업이 진행되는 주였다. 비록 3일이지만 3일동안 앞으로 데이터분석을 시작하는데 어떻게 접근을 해야할지, 분석을 진행할 때 어떤 시각으로 데이터를 봐야하는지에 대해 배웠고, 앞으로 분석실무를 할때 큰 도움이 될 것으로 생각된다. 디자인 씽킹 데이터 드리븐 마지막 수업인 16일차 날에는 마지막으로 각 조별로 정한 주제에 대해 해결 프로토타입을 만들어보고 발표를 하는 시간이었다. 발표이후 1등 팀에게는 상품이 있을 예정이었는데 정말 아쉽게도 우리 팀은 1등을 하지는 못했다. 그래도 다른 팀들의 다양한 문제정의와 그에대한 해결방안들을 들어보고 우리 팀 또한 발표 이후 다양한 비판과 더 좋은 방향 ..

2023.02.20~2023.02.24 학습 일지 이번주는 본격적으로 R에 대해서 공부해보는 기간이었다. 또한 데이터 드리븐 디자인 씽킹을 공부하는 한주였다. 이제까지 데이터분석가가 되기 위한 하드스킬의 기초를 다지고 소프트 스킬 또한 배워보는 시간이었다. 1. R 데이터 처리 과정에서 R의 역할, R Strudio의 사용법, 데이터 타입, 자료 구조, 변수, 함수, 패키지에 대해 공부해봤다. 패키지는 R이 다양한 통계 패키지를 제공함으로서 강력한 데이터 분석 툴이 될 수 있게 한다. [STARTERS TIL] DAY 11 (23.02.20) 1. 데이터 처리과정에서 R의 역할 1. 데이터 처리 과정 -5단계 과정으로 정의 1... blog.naver.com 조건문, 반복문, 사용자 정의 함수, 데이터 ..