데이터 생존 로그

PandasAI: 판다스, AI를 만나다. 본문

생존 도구🏹

PandasAI: 판다스, AI를 만나다.

분석가 베어그릴스 2023. 5. 4. 23:16

Intro

해당 게시글은 Pandas에 AI를 입힌 PandasAI에 대해 소개합니다.

곰 이미지 너무 귀엽다..

 

Pandas는 Data Handling과 Visualization에 많이 활용된다.

 

PandasAI는 Pandas에 Open AI API를 붙혀서,
문장으로 데이터에 대한 질의응답 및 시각화를 할 수 있는 파이썬 라이브러리이다.


활용 준비

활용 준비 방법은 간단하다.

 

pandasai를 설치해주고 import 해준다.

pip install pandasai
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI

 

그리고 발급받은 Open AI API key만 입력해주면 활용 준비 끝!

OPENAI_API_KEY = "발급받은 Open AI API key"
llm = OpenAI(api_token=OPENAI_API_KEY)
pandas_ai = PandasAI(llm)

기능① - 데이터에 대한 질의응답

예시로 활용할 DataFrame을 생성해주자

df = pd.DataFrame({
    "name": ["Kim", "Lee", "Park", "Choi", "Han", "Lim", "Gwon", "Gil", "Yoo"],
    "age": [13, 15, 20, 28, 34, 40, 51, 59, 68],
    "income": [0, 10, 20, 200, 280, 500, 550, 540, 400]
})

 

위 테이블에서 가장 젊은 사람은 Kim으로, 13살이다.

이 질문을 영어로 바꿔서 물어보자.

pandas_ai.run(df, prompt='Who is the youngest person? and how old is him?')

 

결과는 다음과 같다.

이거 보고 살짝 놀랐다..

테이블 내에서 가장 젊은 사람을 찾고, 그 나이를 옳게 대답했다.


기능② - 시각화

이번엔 간단한 시각화를 해보자

사람별 소득을 아래 코드를 활용해서 그려보았다.

pandas_ai.run(df, "Plot the histogram of names showing for each the income, using different colors for each bar")

 

결과는 다음과 같다.

원하는대로 올바르게 Bar Chart를 생성했으며,

다른 색깔로 표현해달라는 의미도 잘 이해한 것으로 보인다.


느낀 점

  • 아직 만들어진지 얼마안된 라이브러리여서인지, 오류가 많은 듯하다.
  • 한글을 활용해보려 했으나 듣질 않는다.
  • 분석가의 hard skill이 조금씩 ai로 가능한 부분이 많아지는 것 같다.
  • hard skill을 돕는 좋은 tool을 빠르게 배우고, soft skill을 키워나가는데 더 노력을 해야겠다.

 

 

출처 및 자세한 내용은 아래 repo를 참고하시면 된다.

https://github.com/gventuri/pandas-ai

 

GitHub - gventuri/pandas-ai: Pandas AI is a Python library that integrates generative artificial intelligence capabilities into

Pandas AI is a Python library that integrates generative artificial intelligence capabilities into Pandas, making dataframes conversational - GitHub - gventuri/pandas-ai: Pandas AI is a Python libr...

github.com

 

반응형
Comments