词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!

| 来源 | 可选 — 通过 hermes skills install official/mlops/peft 安装 |
| 路径 | optional-skills/mlops/peft |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖 | peft>=0.13.0, transformers>=4.45.0, torch>=2.0.0, bitsandbytes>=0.43.0 |
| 平台 | linux, macos, windows |
| 标签 | Fine-Tuning, PEFT, LoRA, QLoRA, Parameter-Efficient, Adapters, Low-Rank, Memory Optimization, Multi-Adapter |
| 秩 | 可训练参数量 | 显存 | 质量 | 适用场景 |
|---|---|---|---|---|
| 4 | ~3M | 极低 | 较低 | 简单任务、原型验证 |
| 8 | ~7M | 低 | 良好 | 推荐起始点 |
| 16 | ~14M | 中等 | 更好 | 通用微调 |
| 32 | ~27M | 较高 | 高 | 复杂任务 |
| 64 | ~54M | 高 | 最高 | 领域适配、70B 模型 |
| 方法 | 可训练参数占比 | 显存 | 速度 | 最适场景 |
|---|---|---|---|---|
| LoRA | 0.1–1% | 低 | 快 | 通用微调 |
| QLoRA | 0.1–1% | 极低 | 中等 | 显存受限场景 |
| AdaLoRA | 0.1–1% | 低 | 中等 | 自动秩选择 |
| IA3 | 0.01% | 极小 | 最快 | 少样本适配 |
| Prefix Tuning | 0.1% | 低 | 中等 | 生成控制 |
| Prompt Tuning | 0.001% | 极小 | 快 | 简单任务适配 |
| P-Tuning v2 | 0.1% | 低 | 中等 | NLU 任务 |
| 方法 | GPU 显存 | 可训练参数量 |
|---|---|---|
| 完整微调 | 60+ GB | 8B(100%) |
| LoRA r=16 | 18 GB | 14M(0.17%) |
| QLoRA r=16 | 6 GB | 14M(0.17%) |
| IA3 | 16 GB | 800K(0.01%) |
| 方法 | Tokens/秒 | 相对完整微调 |
|---|---|---|
| 完整微调 | 2,500 | 1x |
| LoRA | 3,200 | 1.3x |
| QLoRA | 2,100 | 0.84x |
| 模型 | 完整微调 | LoRA | QLoRA |
|---|---|---|---|
| Llama 2-7B | 45.3 | 44.8 | 44.1 |
| Llama 2-13B | 54.8 | 54.2 | 53.5 |