词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 可选 — 通过 hermes skills install official/mlops/nemo-curator 安装 |
| 路径 | optional-skills/mlops/nemo-curator |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖项 | nemo-curator, cudf, dask, rapids |
| 平台 | linux, macos |
| 标签 | Data Processing, NeMo Curator, Data Curation, GPU Acceleration, Deduplication, Quality Filtering, NVIDIA, RAPIDS, PII Redaction, Multimodal, LLM Training Data |
| 操作 | CPU(16 核) | GPU(A100) | 加速比 |
|---|---|---|---|
| 模糊去重(8TB) | 120 小时 | 7.5 小时 | 16× |
| 精确去重(1TB) | 8 小时 | 0.5 小时 | 16× |
| 质量过滤 | 2 小时 | 0.2 小时 | 10× |