我的大模型
概述
"我的大模型"是平台的服务部署模块之一,为用户提供便捷的模型部署和管理中心。在这里,您可以统一管理所有已部署的推理服务,包括基于平台预置模型部署的服务,以及基于您自己训练模型部署的个性化服务。
登录到平台,在左侧功能列选择【我的大模型】,进入模型管理界面。
您可以查看所有模型的状态,支持创建新的模型,设置模型参数和资源配置,并可以对模型进行部署、编辑和删除等操作。同时,平台提供完整的服务共享机制,让您能够便捷地与其他用户共享您的模型。
创建我的大模型
从训练任务生成模型
如果您在训练列表已经有训练完成的训练任务,可以直接点击【生成模型】,将训练的模型保存到"我的大模型"当中。

手动创建模型
也支持在"我的大模型"列表中点击【创建我的大模型】创建模型:
- 输入模型名称
- 选择是否共享
- 输入标签和模型描述
- 选择模型来源

部署我的大模型
详情页部署
支持在模型详情页中直接部署:


快捷部署
也支持直接点击部署按钮进行部署:

部署配置
输入服务名称,分配合适的资源即可完成部署:

提示:资源分配可参考资源参考表格,确保为模型分配合适的计算资源。


后续操作
体验模型服务
模型部署后的体验具体步骤可参考:体验中心
使用和调试
模型部署后的使用和调试具体步骤可参考:服务管理
使用建议
- 模型管理:为模型设置清晰的名称和描述,便于后续查找和使用
- 资源共享:根据需要合理设置模型的共享状态,促进团队协作
- 资源分配:参考平台提供的资源参考表,为模型分配合适的计算资源
- 版本控制:对重要模型进行版本管理,确保模型一致性
- 性能监控:部署后持续监控模型服务的性能表现
通过"我的大模型"功能,您可以:
- 集中管理所有自定义模型
- 快速部署和发布模型服务
- 实现模型的版本控制和迭代
- 促进模型资源的共享和复用
- 简化模型服务的运维管理

