词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!

| 来源 | 可选 — 通过 hermes skills install official/mlops/simpo 安装 |
| 路径 | optional-skills/mlops/simpo |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖项 | torch, transformers, datasets, trl, accelerate |
| 平台 | linux, macos, windows |
| 标签 | Post-Training, SimPO, Preference Optimization, Alignment, DPO Alternative, Reference-Free, LLM Alignment, Efficient Training |
mistral-7b-base-simpo.yaml):llama3-8b-instruct-simpo.yaml):