Loading Search...
Crater
快速开始

交互式作业

开箱即用的 Jupyter Lab,交互式作业的创建和管理等相关内容

交互式作业功能为用户提供了开箱即用的 Jupyter Lab 和 Web IDE ,本文档旨在阐述交互式作业的创建和管理等相关内容。

创建交互式作业

可在 “平台概览” 页面或 “我的作业” -> ”交互式作业“ 页面点击 ”新建 Jupyter Lab“ 按钮,进入 Jupyter Lab 的新建页面。

“新建 Jupyter Lab” 页面可以对交互式作业进行各项设置

  • 作业名称
  • 作业资源(包括 CPU 核数、内存使用量、是否使用 GPU、以及选择所使用的 GPU 型号)
  • 容器镜像
  • 设置数据挂载目录
  • 添加环境变量
  • 其他选项
    • 接收状态通知
    • 启用节点选择功能

交互式作业各项设置可采用导入配置文件进行,已经设置完成的作业也可以导出配置文件,示例如下:

{
  "version": "20240528",
  "type": "jupyter",
  "data": {
    "taskname": "DL-bench-test",
    "cpu": 2,
    "gpu": {
      "count": 1,
      "model": "nvidia.com/a100"
    },
    "memory": 4,
    "image": "harbor.act.buaa.edu.cn/crater-images/nvidia-pytorch:24.08-py3",
    "volumeMounts": [
      {
        "type": 1,
        "subPath": "liuxw24",
        "mountPath": "/home/liuxw24"
      }
    ],
    "envs": [],
    "observability": {
      "tbEnable": false
    },
    "nodeSelector": {
      "enable": false
    }
  }
}

可以看到提交的作业已经成功运行。

管理已创建作业

  • 点击作业名称可以跳转至作业详情页
  • 详情:跳转至作业详情页
  • 克隆:可使用当前作业配置克隆作业(方便用户重复提交类似配置的作业)
  • 停止:停止当前作业,并释放所占用资源

点击“克隆”可以看到如下页面:

可以看到自动创建了和被克隆作业相同配置的作业(自动填充),用户可以略作调整后提交。

作业详情页

作业详情页包含了作业所属账户、作业创建者、作业状态、创建时间、开始时间、完成时间等基本信息。

同时提供所种对作业进行监控与管理的方式。

作业 YAML

  • 作业 YAML:点击可以查看作业 YAML 文件

资源监控

  • 资源监控:点击跳转至作业 Grafana 监控页面

交互式页面

  • 交互式页面:点击跳转至 Jupyter Notebook

Terminal

  • Terminal:点击进入作业 Web Terminal

外部访问

日志与诊断

  • 日志与诊断:查看作业日志,便于故障定位与分析

Edit on GitHub