pandas-ai

Chat with your database or your datalake (SQL, CSV, parquet). PandasAI makes data analysis conversational using LLMs and RAG.

Visit WebsiteView on GitHub
23.4k
Stars
+1951
Stars/month
2
Releases (6m)

Overview

PandasAI 是一个 Python 库,通过自然语言接口实现对话式数据分析。它利用大型语言模型 (LLM) 和 RAG 技术,让用户可以用简单的自然语言提问来查询和分析数据,无需编写复杂的 SQL 或 pandas 代码。该工具支持多种数据格式,包括 CSV、SQL 数据库和 parquet 文件,使数据分析变得更加直观和易用。PandasAI 不仅能回答关于数据的问题,还能自动生成图表和可视化,帮助用户更好地理解数据模式。它特别适合非技术用户进行数据探索,同时也为技术用户提供了快速数据分析的便捷方式。通过与 OpenAI 等 LLM 服务集成,PandasAI 将传统的数据分析工作流程转换为自然的对话体验,大大降低了数据分析的技术门槛。

Pros

  • + 自然语言接口让非技术用户也能轻松进行数据分析和查询
  • + 支持多种数据格式(CSV、SQL、parquet)和多个数据框架的联合查询
  • + 能自动生成图表和可视化,将分析结果以直观的方式呈现

Cons

  • - 需要配置外部 LLM 服务的 API 密钥,增加了设置成本和依赖性
  • - Python 版本限制在 3.8-3.11 之间,对环境有特定要求
  • - 依赖外部 LLM 服务可能存在延迟和服务可用性问题

Use Cases

Getting Started

1. 安装库:使用 pip install pandasai pandasai-litellm 安装必要包;2. 配置 LLM:初始化 LiteLLM 并设置 OpenAI API 密钥,配置 PandasAI 使用该模型;3. 开始对话:加载 CSV 数据文件,使用 df.chat() 方法用自然语言提问分析数据