일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 분석한스푼
- n8n
- pandasai
- DataAnalyst
- retentioneering
- 신기효과
- 전환분석
- productanalysis
- 데이터분석
- 주가데이터
- aha-moment
- 프롬프트엔지니어링
- 시각화
- 데이터
- EDA
- 데이터디스커버리플랫폼
- 프롬프트
- data-analysis
- 데이터분석가
- DataAnalysis
- 성장
- 벅슨의역설
- 트위먼의법칙
- gapminder
- 글또
- data
- PyGWalker
- 인과추론
- 아하모먼트
- 야구
목록야구 (2)
데이터 생존 로그

해당 게시글에서는 득점과 상관성이 높은 특성을 찾아내는 과정을 담았습니다. 야구에서 공격하는 팀의 최종 목적은 최대한 많은 득점을 내는 것이다. 홈런을 많이 때려내서 득점을 만들던, 많은 안타와 도루를 통해 득점을 만들던 상대 팀보다만 많은 득점을 하는 팀이 승리한다. 야구는 기록의 스포츠인 만큼, 다양한 지표를 가지고 있다. 그래서 해당 게시글에서는 다양한 지표 중, 득점과 가장 높은 상관성을 가지는 특성이 무엇이 있는지 찾아보고자 한다. 저번 게시글에서 크롤링했던 지표를 활용해서 분석해보자. 저번 게시글 - https://analyst-ggom-chi-kim.tistory.com/9 야구 데이터셋 크롤링하기 (with. 스탯티즈, BeautifulSoup) 해당 게시글은 스탯티즈(링크)에서 야구(KB..

해당 게시글은 스탯티즈(링크)에서 야구(KBO) 데이터셋을 크롤링(BeautifulSoup)하여 csv로 만드는 과정을 다룹니다. 개요 MLB는 데이터셋을 api로 제공해주지만, KBO는 그렇지 않다. 그래서 스탯티즈라는 야구 통계 사이트의 데이터를 직접 크롤링해야한다. 환경은 코랩을 활용했으며, beautifulsoup4를 이용했다. 거두절미하고 시작하자. 받고자 하는 데이터 한 시즌을 치룬 팀들의 타격지표를 보고자 한다. 아래 링크를 참조하면 바로 이해할 수 있다. http://www.statiz.co.kr/stat.php?mid=stat&re=0&ys=1982&ye=2023&se=0&te=&tm=&ty=0&qu=auto&po=0&as=&ae=&hi=&un=&pl=&da=1&o1=WAR_ALL_ADJ..