Skip to content

我的大模型

概述

"我的大模型"是平台的服务部署模块之一,为用户提供便捷的模型部署和管理中心。在这里,您可以统一管理所有已部署的推理服务,包括基于平台预置模型部署的服务,以及基于您自己训练模型部署的个性化服务。

登录到平台,在左侧功能列选择【我的大模型】,进入模型管理界面。

您可以查看所有模型的状态,支持创建新的模型,设置模型参数和资源配置,并可以对模型进行部署、编辑和删除等操作。同时,平台提供完整的服务共享机制,让您能够便捷地与其他用户共享您的模型。

创建我的大模型

从训练任务生成模型

如果您在训练列表已经有训练完成的训练任务,可以直接点击【生成模型】,将训练的模型保存到"我的大模型"当中。

从训练任务生成模型

手动创建模型

也支持在"我的大模型"列表中点击【创建我的大模型】创建模型:

  1. 输入模型名称
  2. 选择是否共享
  3. 输入标签和模型描述
  4. 选择模型来源

手动创建模型

部署我的大模型

详情页部署

支持在模型详情页中直接部署:

详情页部署入口

详情页部署操作

快捷部署

也支持直接点击部署按钮进行部署:

快捷部署按钮

部署配置

输入服务名称,分配合适的资源即可完成部署:

部署配置

提示:资源分配可参考资源参考表格,确保为模型分配合适的计算资源。

资源参考表1

资源参考表2

后续操作

体验模型服务

模型部署后的体验具体步骤可参考:体验中心

使用和调试

模型部署后的使用和调试具体步骤可参考:服务管理

使用建议

  1. 模型管理:为模型设置清晰的名称和描述,便于后续查找和使用
  2. 资源共享:根据需要合理设置模型的共享状态,促进团队协作
  3. 资源分配:参考平台提供的资源参考表,为模型分配合适的计算资源
  4. 版本控制:对重要模型进行版本管理,确保模型一致性
  5. 性能监控:部署后持续监控模型服务的性能表现

通过"我的大模型"功能,您可以:

  • 集中管理所有自定义模型
  • 快速部署和发布模型服务
  • 实现模型的版本控制和迭代
  • 促进模型资源的共享和复用
  • 简化模型服务的运维管理