开源项目使用教程：OpenCoder-llm-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01183/article/details/147085248

开源项目使用教程：OpenCoder-llm

OpenCoder-llm The Open Cookbook for Top-Tier Code Large Language Model 项目地址: https://gitcode.com/gh_mirrors/op/OpenCoder-llm

1. 项目介绍

OpenCoder-llm 是一个开源的代码大型语言模型（LLM）项目，旨在提供一种开放和可复制的代码生成与理解能力。该项目包括 1.5B 和 8B 基础及聊天模型，支持英文和中文两种语言。OpenCoder-llm 从零开始预训练，使用了 2.5 万亿个标记，其中 90% 为原始代码，10% 为代码相关网页数据，并在超过 4.5M 的高质量 SFT 示例上进行监督微调，最终达到了顶级代码 LLM 的性能。

2. 项目快速启动

首先，确保你已经安装了 Python 和必要的库。以下是一个快速启动示例，展示如何使用 OpenCoder-llm 模型生成代码。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 选择模型
model_name = "infly/OpenCoder-8B-Instruct"

# 加载模型和分词器
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto",
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

# 创建输入消息
messages = [
    {
        'role': 'user',
        'content': "编写一个快速排序算法的 Python 代码。"
    }
]

# 应用聊天模板并获取输入
inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

# 生成代码
outputs = model.generate(inputs, max_new_tokens=512, do_sample=False)

# 解码输出结果
result = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)

# 打印结果
print(result)