반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터분석가
- 데이터분석
- 글또
- EDA
- 벅슨의역설
- DataAnalysis
- 프롬프트
- 성장
- data-analysis
- productanalysis
- 인과추론
- 신기효과
- retentioneering
- 분석한스푼
- DataAnalyst
- n8n
- 프롬프트엔지니어링
- aha-moment
- 시각화
- 아하모먼트
- 주가데이터
- 전환분석
- pandasai
- 트위먼의법칙
- 데이터
- PyGWalker
- data
- gapminder
- 데이터디스커버리플랫폼
- 야구
Archives
목록2025/01 (1)
데이터 생존 로그
데이터를 해석하고 분석할 때, 가장 주의해야 하는 것이 편향이다.대부분의 데이터는 편향을 담고 있고, 이를 기반으로 단순 집계한 통계량에도 편향이 섞여있을 수 밖에 없다. 한 가지 예시를 들어보자!우리가 인스타그램의 데이터 분석가라고 가정해 보자.그리고 다음과 같은 분석 결과를 보게 되었다.릴스를 1회라도 올린 유저가 그렇지 않은 유저에 비해 팔로워 수가 더 많다.(통계적 유의)따라서 '릴스 업로드 유무'는 '팔로워 수'의 요인이라고 볼 수 있다. 우리는 위 분석 결과를 '통계적으로 유의'하기 때문에 받아들여야 할까? 당연히 아니다. 애초에 릴스를 1회라도 올린 유저는 다른 활동 역시 활발하게 할 확률이 높고(게시글, 댓글, 좋아요 등),이에 따라 팔로워 수가 높을 수도 있기 때문이다. 즉, '팔로워 ..
통계💡
2025. 1. 19. 19:49