跳到主要内容

部署

部署: 如果模型已进行打包构建操作,部署操作可以将模型发布到集群中。

提示

如果还没有可部署的模型,请先参考 模型构建

创建模型部署

点击右上角 创建 按钮进行模型部署页面。 deployment list

请根据页面提示项依次输入部署内容 deployment create 其中:

  • 部署模版: 快速生成部署的模版。
  • 部署名称: 部署名称。
  • 工作空间: 工作空间将保存模型部署过程中的日志及模型访问日志等信息;工作空间挂载的路径为:/catan
  • 服务名版本: 选择已成功打包的模型及版本,服务名及版本号在租户内唯一。
  • CPU: 部署模型所需要的CPU资源,如果选择数字1代表使用1个核心的CPU资源。
  • GPU: 部署模型所需要的GPU资源,如果选择数字1代表使用1张卡的GPU资源。
  • 内存: 部署模型所需要的内存资源,如果选择数字1代表使用1G内存资源。
  • 副本数: 部署模型所需要的副本,如果选择数字2代表使用2个副本部署资源。

确认提交部署

系统将根据您所选择的资源和副本情况进行计算部署资源所需要的费用。 deployment create

提交部署后等待模型部署的状态反馈。 deployment wait

大约需要20秒左右,模型将部署到AILines中 deployment done

续约模型部署

提示

续约部署将计算您选择的续约时长延长部署到期的时间。
如果您的部署内容已经到期,续约将从当前续约日开始计费。

deployment renew

扩容模型部署

提示

扩容操作扩大或缩小您部署的资源,并且按照您当前部署内容的到期时间重新计算费用。

deployment expend

释放模型部署

提示

释放模型操作将释放当前部署的模型,同时将根据模型部署到到期时间返还费用。
请注意:如果您的部署已由 开放API服务 发布,将不得释放。如果您需要释放资源,则请在 开放API服务 中下线相关资源,参看:开放API服务

deployment release

deployment release confirm

操作历史

deployment history

查看日志

deployment logs

查看监控

deployment mon