swift-Swift资源资源-CSDN下载

共846个文件

py：460个

sh：210个

md：79个

需积分: 1 109 浏览量 2025-08-01 07:07:02 上传评论收藏 15.29MB ZIP 举报

在计算机编程领域，Swift语言自2014年被苹果公司推出以来，因其安全、现代且性能优越的特性，迅速成为开发iOS、macOS、watchOS和tvOS应用的首选语言之一。Swift语言的设计哲学强调简洁性和安全性，它支持面向对象和函数式编程范式，并采用了当今流行的语言的一些特性，例如类型推断、闭包和泛型。Swift的推出标志着苹果公司致力于使开发者的工作更加高效、安全，同时也给开发者社区带来了一股新鲜的活力。 Swift语言的开发环境和工具链，包括了集成开发环境（IDE）Xcode，它提供了丰富的库和框架支持，方便开发者使用Swift语言进行应用开发。在使用Swift进行开发的过程中，代码的组织、测试和部署等环节都有相应的工具和最佳实践来指导。例如，使用Swift Package Manager进行项目的依赖管理，使用Playgrounds测试代码片段，以及利用自动引用计数（ARC）自动管理内存。对于开源项目而言，良好的项目结构是其成功的关键。项目中通常包含的文件都有其特定的作用。例如： - setup.cfg：这是一个配置文件，用于配置Python项目的.setup.py脚本行为。 - .gitignore：此文件指示Git版本控制系统忽略未跟踪的文件，通常包含编译生成的文件、编辑器备份文件等，以便不将这些文件纳入版本控制。 - MANIFEST.in：这个文件用来指定Python分发包中应包含哪些非代码文件。 - LICENSE：包含项目的许可协议，告知用户可以如何使用和分发项目代码。 - Makefile：在Unix-like系统中，Makefile文件定义了一系列规则来自动化编译、构建和安装程序。 - README_CN.md 和 README.md：这些文件为项目提供了一个介绍文档，通常包含项目的安装指南、使用说明和贡献指南。 - CODE_OF_CONDUCT.md 和 CONTRIBUTING.md：这两个文件分别定义了项目的行为准则和贡献指南，指导社区成员如何参与项目。 - setup.py：这是Python包安装程序的核心文件，它包含了安装和构建包所需的所有指令和元数据。上述文件构成了一份典型的开源项目的基础文件结构，它们各自扮演着重要的角色，使得项目维护、分发和协作成为可能。通过这些文件的合理组织和运用，开源项目可以吸引更多的贡献者，同时确保项目能够健康和有序地发展。此外，为了促进Swift语言的社区发展和交流，社区中还存在大量资源和工具，例如Swift开源库、教程、博客和社区论坛等。这些资源的存在，不仅降低了学习和使用的门槛，也为开发者提供了展示自己作品和交流经验的平台，进一步推动了Swift语言的应用和普及。 Swift作为一种现代、安全且性能卓越的编程语言，不仅得到了苹果官方的强力支持，也受到了全球开发者的青睐。而良好的开源项目结构和丰富的社区资源，则为Swift的推广和应用提供了强大的支撑，使得Swift成为了当今编程语言领域一颗璀璨的新星。开发者在享受Swift带来的编程乐趣和高效生产的同时，也应当注重项目管理、社区参与和资源利用，以实现个人和社区的共同进步。

资源推荐

资源详情

资源评论

收起资源包目录

swift-Swift资源（846个子文件）

make.bat 764B

setup.cfg 754B

alpaca.csv 87B

swift_single.csv 66B

alpaca2.csv 55B

swift_pre.csv 27B

.gitignore 2KB

MANIFEST.in 218B

zh.ipynb 9KB

self-cognition-sft.ipynb 8KB

ocr-sft.ipynb 8KB

infer.ipynb 6KB

infer.ipynb 4KB

web-ui.jpg 178KB

web-ui-en.jpg 171KB

discord_qr.jpg 71KB

math.json 422KB

dataset_info.json 22KB

tuner.json 7KB

zero3.json 1KB

zero3_offload.json 1KB

zero1.json 835B

zero2.json 835B

zero2_offload.json 834B

fsdp_offload.json 787B

zero0.json 732B

agentflan.json 660B

swift_multi.json 211B

alpha_umi.json 181B

sft.json 164B

react.json 156B

infer.json 151B

qwen.json 135B

hermes.json 44B

ignore_empty_think.json 41B

multi_modal_2.jsonl 604B

chatml.jsonl 490B

conversations.jsonl 483B

multi_modal_1.jsonl 453B

multi_modal_3.jsonl 452B

sharegpt.jsonl 286B

alpaca.jsonl 224B

swift_multi.jsonl 207B

swift_single.jsonl 139B

swift_pre.jsonl 66B

LICENSE 11KB

Makefile 638B

Makefile 359B

Supported-models-and-datasets.md 222KB

支持的模型和数据集.md 221KB

Command-line-parameters.md 70KB

命令行参数.md 59KB

Frequently-asked-questions.md 58KB

常见问题整理.md 54KB

Megatron-SWIFT-Training.md 29KB

Pre-training-and-Fine-tuning.md 27KB

Megatron-SWIFT训练.md 25KB

Custom-dataset.md 23KB

README_CN.md 23KB

预训练与微调.md 22KB

自定义数据集.md 21KB

Inference-and-deployment.md 19KB

推理和部署.md 17KB

Qwen3-Best-Practice.md 16KB

GRPO多模态训练.md 16KB

GRPO-Multi-Modal-Training.md 15KB

GRPO.md 15KB

Qwen3最佳实践.md 15KB

GRPO完整流程.md 15KB

Agent-support.md 13KB

Evaluation.md 13KB

评测.md 12KB

Agent支持.md 12KB

GRPO.md 12KB

Pluginization.md 11KB

GRPO.md 10KB

插件化.md 10KB

multi_turn.md 10KB

NPU-support.md 9KB

Use-tuners.md 9KB

多轮训练.md 9KB

NPU支持.md 9KB

Reinforced-Fine-tuning.md 8KB

使用tuners.md 8KB

Embedding.md 8KB

GRPO-Code-Training.md 7KB

GRPO代码训练.md 7KB

Rapidly-Training-VL-model.md 7KB

快速训练VL模型.md 7KB

Embedding训练.md 7KB

强化微调.md 7KB

reward_function.md 6KB

RLHF.md 6KB

Quick-start.md 6KB

奖励函数.md 6KB

ReleaseNote3.0.md 5KB

Custom-model.md 5KB

CODE_OF_CONDUCT.md 5KB

快速开始.md 5KB

人类对齐.md 5KB

共 846 条

# Copyright (c) Alibaba, Inc. and its affiliates. # Part of the implementation is borrowed from huggingface/trl. import concurrent.futures import inspect import os import re import time from collections import defaultdict, deque from concurrent.futures import Future from contextlib import contextmanager, nullcontext from copy import copy, deepcopy from dataclasses import asdict, dataclass, field from functools import partial from math import ceil from queue import Queue from types import MethodType from typing import Any, Callable, Dict, List, Optional, Tuple, Union import datasets import torch import torch.nn as nn import transformers from accelerate.utils import broadcast_object_list, gather, gather_object, is_peft_model, set_seed from packaging import version from torch.nn import ModuleList from torch.utils.data import DataLoader from transformers import PreTrainedModel, TrainerCallback from transformers.trainer import Trainer from trl import GRPOTrainer as HFGRPOTrainer from trl.extras.profiling import profiling_context, profiling_decorator from trl.models import prepare_deepspeed from trl.trainer.callbacks import SyncRefModelCallback from trl.trainer.grpo_trainer import nanmax, nanmin, nanstd from swift.llm import (InferRequest, MultiModelKeys, RequestConfig, RolloutInferRequest, RowPreprocessor, Template, get_model_arch, to_device) from swift.llm.infer.protocol import ChatCompletionResponse from swift.llm.model.utils import get_llm_model from swift.llm.template.template_inputs import StdTemplateInputs from swift.plugin import loss_scale_map, multi_turns, orms, rm_plugins from swift.plugin.multi_turn import MultiTurnScheduler from swift.utils import (JsonlWriter, empty_cache, get_current_device, get_device, get_logger, is_vllm_available, is_wandb_available, seed_worker, unwrap_model_for_generation) from ..mixin import SwiftMixin from .rlhf_mixin import RLHFTrainerMixin from .utils import _ForwardRedirection, patch_lora_merge, patch_lora_unmerge from .vllm_client import VLLMClient del HFGRPOTrainer.__init__ del HFGRPOTrainer.log logger = get_logger() if is_wandb_available(): import wandb InputsType = List[Dict[str, Union[torch.Tensor, Any]]] # tuple: (messages, finish_reason) OutputsType = List[Tuple[List[Dict], str]] class GRPOCallback(TrainerCallback): def __init__(self, trainer): self.trainer = trainer # offload original_modules to cpu, to save memory def on_train_begin(self, args, state, control, **kwargs): self.trainer.queue = self.trainer.train_queue train_dataloader = getattr(state, 'train_dataloader', None) or kwargs.get('train_dataloader') self.trainer._prefetch(train_dataloader) @dataclass class DataCache: inputs: List[Dict] = field(default_factory=list) outputs: List[Dict] = field(default_factory=list) def identity_data_collator(features): return features class GRPOTrainer(RLHFTrainerMixin, SwiftMixin, HFGRPOTrainer): executor = concurrent.futures.ThreadPoolExecutor(max_workers=1) def __init__(self, model: Optional[Union[PreTrainedModel, nn.Module]] = None, ref_model: Optional[Union[PreTrainedModel, nn.Module]] = None, reward_model: Optional[List[Union[PreTrainedModel, nn.Module]]] = None, reward_funcs: Optional[List[Union[str, Callable]]] = None, *_args, **kwargs): from swift.trainers.rlhf_arguments import GRPOConfig args: GRPOConfig = kwargs['args'] self.args = args # for async generate self.train_queue = Queue() self.eval_queue = Queue() self.processing_class = kwargs.get('template').tokenizer if not isinstance(reward_funcs, list): reward_funcs = [reward_funcs] if reward_funcs: for i, reward_func in enumerate(reward_funcs): if reward_func in orms: reward_func_class = orms[reward_func] reward_func_args = list(inspect.signature(reward_func_class.__init__).parameters) reward_func_kwargs = { key: getattr(args, key) for key in reward_func_args if key not in ['self', 'args', 'kwargs'] and hasattr(args, key) } if 'tokenizer' in reward_func_args: reward_func_kwargs['tokenizer'] = self.processing_class reward_funcs[i] = reward_func_class(**reward_func_kwargs) elif not callable(reward_func): raise ValueError(f'reward_function {reward_func} is not implemented in swift.llm.plugin') self.reward_funcs = reward_funcs self.reward_func_names = [] for reward_func in reward_funcs: if inspect.isfunction(reward_func): reward_func_name = reward_func.__name__ else: reward_func_name = reward_func.__class__.__name__ self.reward_func_names.append(reward_func_name) self.reward_model_plugins = [None] * len(self.reward_funcs) if reward_model is not None: reward_template = kwargs.pop('reward_template') reward_plugins = args.reward_model_plugin if reward_plugins is None: reward_plugins = ['default'] * len(reward_model) assert len(reward_plugins) == len(reward_model), ( f"The number of 'reward_model_plugin' ({len(reward_plugins)}) does not match " f"the number of 'reward_model' ({len(reward_model)}). " "Please provide a corresponding 'reward_model_plugin' for each 'reward_model'.") for rm, rm_plugin, rm_template in zip(reward_model, reward_plugins, reward_template): # Set encoding mode train(see details in Template.encode). # Set max_length to None to disable truncation, as the input length has already been truncated earlier. rm_template.set_mode('train') rm_template.max_length = None if rm_plugin not in rm_plugins: raise ValueError(f'rm_plugin {rm_plugin} is not implemented in swift.llm.plugin') self.reward_model_plugins.append(rm_plugins[rm_plugin](model=rm, template=rm_template)) self.reward_funcs.append(rm) self.reward_func_names.append(rm.config._name_or_path.split('/')[-1]) if not self.reward_funcs: raise ValueError('You must specify reward_funcs or reward_model') # Reward weights if args.reward_weights is not None: if len(args.reward_weights) != len(reward_funcs): raise ValueError(f'Number of reward weights ({len(args.reward_weights)}) must match number of reward ' f'functions ({len(reward_funcs)})') self.reward_weights = torch.tensor(args.reward_weights, dtype=torch.float32) else: self.reward_weights = torch.ones(len(reward_funcs), dtype=torch.float32) self.multi_turn_scheduler = None if self.args.multi_turn_scheduler: if isinstance(self.args.multi_turn_scheduler, str): assert self.args.multi_turn_scheduler in multi_turns multi_turn_scheduler = multi_turns[self.args.multi_turn_scheduler](max_turns=self.args.max_turns) self.multi_turn_scheduler: MultiTurnScheduler = multi_turn_scheduler else: assert isinstance(multi_turn_scheduler, MultiTurnScheduler) self.multi_turn_scheduler: MultiTurnScheduler = self.args.multi_turn_scheduler self.num_generations = args.num_generations self.temperature = args.temperature self.vllm_mode = args.vllm_mode self.vllm_gpu_memory_utilization = args.vllm_gpu_memory_utilization # only applies to colocation

评论收藏

内容反馈