일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- data_analyst
- 트위먼의법칙
- EDA
- data
- 데이터분석
- 아하모먼트
- PyGWalker
- 벅슨의역설
- 데이터디스커버리플랫폼
- productanalysis
- 성장
- gapminder
- 데이터
- 글또
- data-analysis
- pandasai
- 야구
- retentioneering
- 데이터분석가
- soft-skill
- aha-moment
- 신기효과
- 프롬프트엔지니어링
- 프로덕트분석
- 분석한스푼
- 시각화
- 프롬프트
- sankey
- ChatGPT
- 주가데이터
목록통계💡 (2)
데이터 생존 로그
첫 데이터 분석가로 입사했을 때 나의 꿈은 '이 조직에서 몰랐던 엄청난 사실을 발견해서 알려줘야지!'였다. 그리고 모든 데이터 분석가가 저 정도는 할 줄 알았다. 데이터 분석가로 일하게 된지 1년 반 정도가 지난 지금, 저 꿈이 누구나 할 수 있는 쉬운 일이라고 생각하지 않는다. 인사이트(라고 말하기엔 거창하긴 하지만..)로 가는 길은 멀고 험난하며, 그 길 도중엔 데이터 분석가를 홀리기 쉬운 여러가지 함정들이 도사리고 있기 때문! 그래서 이번 게시글에선 데이터 분석가가 빠지기 쉬운 함정 세 가지에 대해 다뤄보고자 한다. 개인적으로 많이 당할뻔(?)했던 함정 세 가지를 차례대로 담아보았다! 트위먼의 법칙(Twyman's Law) 데이터가 특이하거나 흥미로울수록, 특정 오류로 인한 결과일 가능성이 높다. ..
해당 게시글에서는 벅슨의 역설(Berkson's paradox)을 알기 쉽게 담았습니다. 상황 가정 심슨은 아이스크림집 사장님이다. 바닐라 아이스크림을 사면 초코 아이스크림을 50%에 살 수 있는 할인쿠폰을 기획하려고 한다. 데이터셋 데이터 기반으로 의사결정하는걸 좋아하는 심슨은 손님의 입맛을 파악하기 위해 초콜릿 아이스크림과 바닐라 아이스크림에 대한 선호도를 조사해놓았다. 또한 설문조사에 참여한 손님이 실제로 아이스크림을 구매해봤는지에 대한 데이터도 가지고 있다. 즉, 심슨이 가지고 있는 데이터셋은 다음과 같은 형태를 가지고 있다. 컬럼명 설명 타입 VanillaTaste 바닐라맛 아이스크림 선호도 정수형 (0~25) ChocTaste 초콜릿맛 아이스크림 선호도 정수형 (0~25) Shopped 아이스..