Serverless 服务
简介
Serverless 功能允许用户在无需管理底层服务器的情况下,按需使用 GPU 算力。
Serverless 一览
1. 进入 Serverless 一览页面
点击左侧菜单【Serverless 列表】即可进入 Serverless 一览。
新增 Serverless 实例
1. 进入 Serverless 新增页面
进入 Serverless 一览。
点击左上角【新增 Serverless】按钮进入新增 Serverless 页面。
2. 填写基本信息
- 输入Serverless 名称:为您的服务定义一个易于识别的名称。
3. 选择数据中心和 GPU 规格
- 选择数据中心:根据需求选择最合适的数据中心。
- 选择GPU 规格:根据应用需求选择合适的 GPU 规格。
4. 设置 Worker 基本信息
- 确定活跃的 Worker 数量:设置至少需要保持运行的 Worker 数量。
- 设置最大 Worker 数量:定义在高负载时最大的 Worker 数量。
- 配置空闲时长:设置 Worker 在空闲状态下多久后会被回收。
5. 配置伸缩策略
- 选择请求数量伸缩或请求等待时间伸缩作为伸缩策略。
6. 模板和存储设置
- 模板:选择需要部署的模板。
- 挂载存储:选择需要挂载的存储。
7. 环境变量设置
- 环境变量:设置 Worker 启动时所需的环境变量。
8. 提交新增
- 检查所有设置,确认无误后点击新增按钮。
编辑 Serverless 实例
1. 进入 Serverless 编辑页面
- 鼠标移入 Serverless 卡片右上角【操作】按钮,点击【编辑】进入编辑 Serverless 页面。
- Serverless 详情页,鼠标移入右上角【操作】按钮,点击【编辑】进入编辑 Serverless 页面。
2. 修改基本信息
- 输入Serverless 名称:为您的服务定义一个易于识别的名称。
3. 修改 Worker 基本信息
- 确定活跃的 Worker 数量:设置至少需要保持运行的 Worker 数量。
- 设置最大 Worker 数量:定义在高负载时最大的 Worker 数量。
- 配置空闲时长:设置 Worker 在空闲状态下多久后会被回收。
4. 配置伸缩策略
- 选择请求数量伸缩或请求等待时间伸缩作为伸缩策略。
5. 环境变量设置
- 环境变量:设置 Worker 启动时所需的环境变量。
6. 提交编辑
- 检查所有设置,确认无误后点击编辑按钮。
删除 Serverless 实例
1. 从 Serverless 一览页删除
鼠标移入 Serverless 卡片右上角【操作】按钮。
点击【删除】,弹出删除提示框,点击【确定】按钮,删除 Serverless 示例。
2. 从 Serverless 详情页删除
鼠标移入 Serverless 详情页右上角【操作】按钮。
点击【删除】,弹出删除提示框,点击【确定】按钮,删除 Serverless 示例。
Serverless 详情页
1. 进入 Serverless 详情页
点击 Serverless 卡片进入 Serverless 实例详情页。
点击 Serverless 右上角【操作】->【详情】进入 Serverless 详情页。
2. 总览
Serverless 基本信息及运行状态。
运行时长和消耗费用。
端点的进入信息。
实例配置信息。
请求统计、吞吐量、耗时统计图表。
3. Worker
各 Worker 的基本信息及运行状态。
点击【详情】可查看当前 Worker 的具体状态。
详情:运行时长、消耗费用、启动时间、状态统计图表。
状态统计图表:CPU 使用量、显存使用量、内存、功率。
4. 记录
操作记录。
消费记录。
5. 运行日志
运行日志。
6. API 秘钥
API 秘钥列表。
点击【创建秘钥】按钮,可创建新的 API 秘钥。
点击【删除】按钮,可删除 API 秘钥。