일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- productanalysis
- 인과추론
- 성장
- 데이터분석
- 시각화
- 데이터디스커버리플랫폼
- pandasai
- 트위먼의법칙
- n8n
- retentioneering
- 야구
- aha-moment
- gapminder
- 전환분석
- 벅슨의역설
- 분석한스푼
- data
- 프롬프트
- data-analysis
- PyGWalker
- DataAnalysis
- DataAnalyst
- 프롬프트엔지니어링
- 데이터
- 신기효과
- 데이터분석가
- 주가데이터
- EDA
- 글또
- 아하모먼트
데이터 생존 로그
PandasAI: 판다스, AI를 만나다. 본문
Intro
해당 게시글은 Pandas에 AI를 입힌 PandasAI에 대해 소개합니다.
Pandas는 Data Handling과 Visualization에 많이 활용된다.
PandasAI는 Pandas에 Open AI API를 붙혀서,
문장으로 데이터에 대한 질의응답 및 시각화를 할 수 있는 파이썬 라이브러리이다.
활용 준비
활용 준비 방법은 간단하다.
pandasai를 설치해주고 import 해준다.
pip install pandasai
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
그리고 발급받은 Open AI API key만 입력해주면 활용 준비 끝!
OPENAI_API_KEY = "발급받은 Open AI API key"
llm = OpenAI(api_token=OPENAI_API_KEY)
pandas_ai = PandasAI(llm)
기능① - 데이터에 대한 질의응답
예시로 활용할 DataFrame을 생성해주자
df = pd.DataFrame({
"name": ["Kim", "Lee", "Park", "Choi", "Han", "Lim", "Gwon", "Gil", "Yoo"],
"age": [13, 15, 20, 28, 34, 40, 51, 59, 68],
"income": [0, 10, 20, 200, 280, 500, 550, 540, 400]
})
위 테이블에서 가장 젊은 사람은 Kim으로, 13살이다.
이 질문을 영어로 바꿔서 물어보자.
pandas_ai.run(df, prompt='Who is the youngest person? and how old is him?')
결과는 다음과 같다.
테이블 내에서 가장 젊은 사람을 찾고, 그 나이를 옳게 대답했다.
기능② - 시각화
이번엔 간단한 시각화를 해보자
사람별 소득을 아래 코드를 활용해서 그려보았다.
pandas_ai.run(df, "Plot the histogram of names showing for each the income, using different colors for each bar")
결과는 다음과 같다.
원하는대로 올바르게 Bar Chart를 생성했으며,
다른 색깔로 표현해달라는 의미도 잘 이해한 것으로 보인다.
느낀 점
- 아직 만들어진지 얼마안된 라이브러리여서인지, 오류가 많은 듯하다.
- 한글을 활용해보려 했으나 듣질 않는다.
- 분석가의 hard skill이 조금씩 ai로 가능한 부분이 많아지는 것 같다.
- hard skill을 돕는 좋은 tool을 빠르게 배우고, soft skill을 키워나가는데 더 노력을 해야겠다.
출처 및 자세한 내용은 아래 repo를 참고하시면 된다.
https://github.com/gventuri/pandas-ai
GitHub - gventuri/pandas-ai: Pandas AI is a Python library that integrates generative artificial intelligence capabilities into
Pandas AI is a Python library that integrates generative artificial intelligence capabilities into Pandas, making dataframes conversational - GitHub - gventuri/pandas-ai: Pandas AI is a Python libr...
github.com
'생존 도구🏹' 카테고리의 다른 글
[Streamlit] 간단한 대시보드 배포하기(with. KBO 타격지표) (0) | 2023.07.02 |
---|---|
[야구] 스탯티즈 데이터셋 크롤링하기 (with. BeautifulSoup) (0) | 2023.06.12 |
ChatGPT랑 같이 EDA해보기 (with. 프롬프트 엔지니어링) (0) | 2023.06.04 |
Datahub: 추출에 쫓기는 데이터 분석가에게 희망이 될 상인가? (0) | 2023.03.25 |
PyGWalker: 태블로를 머금은 파이썬 (1) | 2023.03.07 |