DeepSeek-Coder

DeepSeek Coder: Let the Code Write Itself

open-sourceagent-frameworks
Visit WebsiteView on GitHub
23.0k
Stars
+1913
Stars/month
0
Releases (6m)

Overview

DeepSeek-Coder是一系列专门为编程任务设计的大语言模型,从零开始在2万亿token上训练,其中87%为代码数据,13%为中英文自然语言数据。该模型提供1B到33B参数的多种规格,采用16K窗口大小进行项目级代码训练,支持填空任务和项目级代码补全。模型在HumanEval、MultiPL-E、MBPP、DS-1000和APPS等多个编程基准测试中表现出色,支持80多种编程语言,包括Python、Java、C++、JavaScript、Go、Rust等主流语言以及各种领域特定语言。DeepSeek-Coder特别擅长理解项目上下文和代码结构,能够进行智能的代码补全和填充,是开源代码模型中的顶尖选择。

Pros

  • + 支持80多种编程语言,覆盖范围极广,从主流语言到领域特定语言应有尽有
  • + 提供1B到33B多种参数规格,用户可根据计算资源和性能需求灵活选择
  • + 采用16K窗口大小和项目级训练,能够理解较长的代码上下文和项目结构

Cons

  • - 大参数版本对计算资源要求较高,可能需要专业的GPU硬件支持
  • - 作为生成式AI模型,可能产生不完全正确或不安全的代码,需要人工审查

Use Cases

Getting Started

1. 从Hugging Face下载适合您计算资源的模型版本(1B-33B);2. 搭建推理环境并加载模型;3. 开始使用代码补全和填空功能进行编程辅助