23.0k
Stars
+1913
Stars/month
0
Releases (6m)
Overview
DeepSeek-Coder是一系列专门为编程任务设计的大语言模型,从零开始在2万亿token上训练,其中87%为代码数据,13%为中英文自然语言数据。该模型提供1B到33B参数的多种规格,采用16K窗口大小进行项目级代码训练,支持填空任务和项目级代码补全。模型在HumanEval、MultiPL-E、MBPP、DS-1000和APPS等多个编程基准测试中表现出色,支持80多种编程语言,包括Python、Java、C++、JavaScript、Go、Rust等主流语言以及各种领域特定语言。DeepSeek-Coder特别擅长理解项目上下文和代码结构,能够进行智能的代码补全和填充,是开源代码模型中的顶尖选择。
Pros
- + 支持80多种编程语言,覆盖范围极广,从主流语言到领域特定语言应有尽有
- + 提供1B到33B多种参数规格,用户可根据计算资源和性能需求灵活选择
- + 采用16K窗口大小和项目级训练,能够理解较长的代码上下文和项目结构
Cons
- - 大参数版本对计算资源要求较高,可能需要专业的GPU硬件支持
- - 作为生成式AI模型,可能产生不完全正确或不安全的代码,需要人工审查
Use Cases
- • 项目级代码补全和智能提示,提高开发效率
- • 代码填空和缺失部分补充,辅助代码重构和修复
- • 多语言编程项目支持,为使用多种编程语言的复杂项目提供一致的代码辅助
Getting Started
1. 从Hugging Face下载适合您计算资源的模型版本(1B-33B);2. 搭建推理环境并加载模型;3. 开始使用代码补全和填空功能进行编程辅助