일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 인과추론
- 야구
- 데이터분석
- n8n
- 전환분석
- EDA
- aha-moment
- PyGWalker
- DataAnalysis
- 프롬프트
- 신기효과
- productanalysis
- 벅슨의역설
- DataAnalyst
- 트위먼의법칙
- 아하모먼트
- 주가데이터
- 데이터
- pandasai
- retentioneering
- 데이터분석가
- 글또
- 시각화
- 성장
- gapminder
- data-analysis
- 분석한스푼
- 프롬프트엔지니어링
- data
- 데이터디스커버리플랫폼
목록시각화 (3)
데이터 생존 로그

해당 게시글에서는 득점과 상관성이 높은 특성을 찾아내는 과정을 담았습니다. 야구에서 공격하는 팀의 최종 목적은 최대한 많은 득점을 내는 것이다. 홈런을 많이 때려내서 득점을 만들던, 많은 안타와 도루를 통해 득점을 만들던 상대 팀보다만 많은 득점을 하는 팀이 승리한다. 야구는 기록의 스포츠인 만큼, 다양한 지표를 가지고 있다. 그래서 해당 게시글에서는 다양한 지표 중, 득점과 가장 높은 상관성을 가지는 특성이 무엇이 있는지 찾아보고자 한다. 저번 게시글에서 크롤링했던 지표를 활용해서 분석해보자. 저번 게시글 - https://analyst-ggom-chi-kim.tistory.com/9 야구 데이터셋 크롤링하기 (with. 스탯티즈, BeautifulSoup) 해당 게시글은 스탯티즈(링크)에서 야구(KB..

Kanaries에서 태블로 스타일의 파이썬 패키지인 PyGWalker를 만들었다. 정제가 깔끔하게 완료된 테이블을 요리조리 EDA 해볼 때 유용할 것 같다. 바로 활용해보자! 패키지를 install 해줍시다. pip install pygwalker 그 후 import 해주면 활용준비 끝 import pandas as pd import pygwalker as pyg 해당 게시글에서 활용할 데이터는 갭마인더에서 가져왔으며, 세 가지 필드만 뽑아서 활용할 것이다. 필드명 데이터 타입 country string income int life int 이제 데이터까지 준비되었으니 실행시켜보자 data = pd.read_csv('./preprocessed.csv') pyg.walk(data) X축, Y축, 활용가능한 ..

이전글: 2023.02.21 - [📊 분석 한 스푼 🥄] - 00. 분석으로 진수성찬을 만들어보자🍚🍖 00. 분석으로 진수성찬을 만들어보자🍚🍖 배경 데이터 분석가로써 벌써 반 년을 일했다. 분석 취준 시절과 얼마 안되는 분석가로써의 업무를 경험하면서 내 성장은 항상 하드스킬에만 초점이 맞춰져있었다. 이제 조금씩 분석 업무도 진 analyst-ggom-chi-kim.tistory.com 세상은 개발도상국과 선진국으로 나뉠까? 책 [팩트풀니스]를 읽었다. 첫 챕터의 내용은 대충 이랬다. 다수의 사람들은 세상이 선진국과 개발도상국으로 나뉜다고 생각한다. 하지만 그건 오래 전의 일이고, 현재는 4단계로 나눌 수 있다. 위 내용을 읽으면서 다양하고 복잡한 호기심과 의심점이 생겼지만 크게 두 가지로 정리해보면 다음..