pandas-ai
Chat with your database or your datalake (SQL, CSV, parquet). PandasAI makes data analysis conversational using LLMs and RAG.
23.4k
Stars
+1951
Stars/month
2
Releases (6m)
Overview
PandasAI 是一个 Python 库,通过自然语言接口实现对话式数据分析。它利用大型语言模型 (LLM) 和 RAG 技术,让用户可以用简单的自然语言提问来查询和分析数据,无需编写复杂的 SQL 或 pandas 代码。该工具支持多种数据格式,包括 CSV、SQL 数据库和 parquet 文件,使数据分析变得更加直观和易用。PandasAI 不仅能回答关于数据的问题,还能自动生成图表和可视化,帮助用户更好地理解数据模式。它特别适合非技术用户进行数据探索,同时也为技术用户提供了快速数据分析的便捷方式。通过与 OpenAI 等 LLM 服务集成,PandasAI 将传统的数据分析工作流程转换为自然的对话体验,大大降低了数据分析的技术门槛。
Pros
- + 自然语言接口让非技术用户也能轻松进行数据分析和查询
- + 支持多种数据格式(CSV、SQL、parquet)和多个数据框架的联合查询
- + 能自动生成图表和可视化,将分析结果以直观的方式呈现
Cons
- - 需要配置外部 LLM 服务的 API 密钥,增加了设置成本和依赖性
- - Python 版本限制在 3.8-3.11 之间,对环境有特定要求
- - 依赖外部 LLM 服务可能存在延迟和服务可用性问题
Use Cases
- • 业务分析师通过自然语言查询销售数据和收入趋势,无需学习 SQL
- • 数据科学家快速探索新数据集,通过对话方式了解数据分布和特征
- • 非技术团队成员创建数据可视化报告,直接描述需要的图表类型
Getting Started
1. 安装库:使用 pip install pandasai pandasai-litellm 安装必要包;2. 配置 LLM:初始化 LiteLLM 并设置 OpenAI API 密钥,配置 PandasAI 使用该模型;3. 开始对话:加载 CSV 数据文件,使用 df.chat() 方法用自然语言提问分析数据