词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 来源 | 可选 — 通过 hermes skills install official/mlops/modal 安装 |
| 路径 | optional-skills/mlops/modal |
| 版本 | 1.0.0 |
| 作者 | Orchestra Research |
| 许可证 | MIT |
| 依赖 | modal>=0.64.0 |
| 平台 | linux, macos, windows |
| 标签 | Infrastructure, Serverless, GPU, Cloud, Deployment, Modal |
modal run hello_gpu.py| 组件 | 用途 |
|---|---|
App | 函数和资源的容器 |
Function | 带计算规格的无服务器函数 |
Cls | 带生命周期 hook 的基于类的函数 |
Image | 容器镜像定义 |
Volume | 用于模型/数据的持久存储 |
Secret | 安全凭证存储 |
| 命令 | 描述 |
|---|---|
modal run script.py | 执行后退出 |
modal serve script.py | 开发模式,支持热重载 |
modal deploy script.py | 持久化云端部署 |
| GPU | 显存 | 最适用于 |
|---|---|---|
T4 | 16GB | 经济型推理、小型模型 |
L4 | 24GB | 推理,Ada Lovelace 架构 |
A10G | 24GB | 训练/推理,比 T4 快 3.3 倍 |
L40S | 48GB | 推荐用于推理(最佳性价比) |
A100-40GB | 40GB | 大型模型训练 |
A100-80GB | 80GB | 超大型模型 |
H100 | 80GB | 最快,支持 FP8 + Transformer Engine |
H200 | 141GB | 从 H100 自动升级,4.8TB/s 带宽 |
B200 | 最新 | Blackwell 架构 |
| 装饰器 | 使用场景 |
|---|---|
@modal.fastapi_endpoint() | 简单函数 → API |
@modal.asgi_app() | 完整 FastAPI/Starlette 应用 |
@modal.wsgi_app() | Django/Flask 应用 |
@modal.web_server(port) | 任意 HTTP 服务器 |
| 问题 | 解决方案 |
|---|---|
| 冷启动延迟 | 增大 container_idle_timeout,使用 @modal.enter() |
| GPU 内存溢出 | 使用更大 GPU(A100-80GB),启用梯度检查点 |
| 镜像构建失败 | 固定依赖版本,检查 CUDA 兼容性 |
| 超时错误 | 增大 timeout,添加检查点 |