词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 可选 — 通过 hermes skills install official/mlops/axolotl 安装 |
| 路径 | optional-skills/mlops/training/axolotl |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖项 | axolotl, torch, transformers, datasets, peft, accelerate, deepspeed |
| 平台 | linux, macos |
| 标签 | Fine-Tuning, Axolotl, LLM, LoRA, QLoRA, DPO, KTO, ORPO, GRPO, YAML, HuggingFace, DeepSpeed, Multimodal |
./build/all_reduce_perf -b 8 -e 128M -f 2 -g 3fsdp_version: 2
fsdp_config:
offload_params: true
state_dict_type: FULL_STATE_DICT
auto_wrap_policy: TRANSFORMER_BASED_WRAP
transformer_layer_cls_to_wrap: LlamaDecoderLayer
reshard_after_forward: truecontext_parallel_size 应为 GPU 总数的因数,例如:context_parallel_sizecontext_parallel_size=4 时:每步仅处理 2 个不同批次(每个批次跨 4 块 GPU 拆分)- 若每块 GPU 的 micro_batch_size 为 2,全局批次大小将从 16 降至 4context_parallel_size=4save_compressed: true 可启用压缩格式保存模型,效果如下:- 磁盘空间占用减少约 40% - 保持与 vLLM 的兼容性以加速推理 - 保持与 llmcompressor 的兼容性以进行进一步优化(例如:量化)save_compressed: trueintegrations 文件夹中。只要安装在 Python 环境的某个包中,可位于任意位置。参见此示例仓库:https://github.com/axolotl-ai-cloud/diff-transformerintegrationssample['input_ids'] 为 list[int] - 批量数据:sample['input_ids'] 为 list[list[int]]utils.trainer.drop_long_seq(sample, sequence_len=2048, min_sequence_len=2)references/ 中包含完整文档:view 读取特定参考文件。getting_started 或 tutorials 参考文件入手,了解基础概念。