常见问题解答
资源与算力相关问题
选择大模型训练时,当前资源不足怎么办?
我们当前默认每个用户最大算力用量为两张 GPU 卡。当部分模型需要的算力资源超出最大限额时,您可以直接与我们联系,申请提供更多算力支持。
建议操作:
- 检查当前任务所需的资源配额
- 优化模型配置以适应现有资源
- 如需更多资源,请联系客服申请扩容
算力使用账单什么时候可以查看?
针对按量计费的任务,账单更新和扣费机制如下:
实时扣费:
- 系统每 5 分钟统计一次用量
- 从账户余额进行预扣除
- 当余额不足以满足下一个 5 分钟的费用时,系统会提示用户余额不足,请及时充值
账单展示:
- 系统会延迟一天显示用户前一天使用的用量数据和计费数据
- 按天进行统计和展示
账单争议处理: 若您对账单有疑议,可直接与我们联系进行核实和处理。
任务创建问题
为什么我创建一个训练任务时,显示创建失败?
为保证资源的有效使用,我们默认每个用户最大可使用算力是 2 张算力卡。当用户选择模型超出最大用量时,可能会因为所需资源超出使用范围而使得任务运行失败。
可能原因:
- 所选模型需要的 GPU 资源超过用户配额限制
- 系统资源暂时不足
- 配置参数超出允许范围
- 账户余额不足
解决方法:
- 检查并调整资源配置,确保不超过用户配额
- 选择资源需求较低的训练方法(如 LoRA、QLoRA)
- 确保账户有足够余额
- 如需更多资源,请联系客服申请扩容
其他常见问题
如何提高训练效率?
- 选择合适的训练方法:根据资源情况选择 LoRA 或 QLoRA 等高效训练方法
- 优化数据集:确保数据质量和格式正确
- 合理设置参数:根据数据集大小调整训练轮次和学习率
- 充分利用共享资源:使用平台提供的共享模型和数据集
模型部署失败怎么办?
- 检查模型文件是否完整
- 确认资源配置是否满足模型要求
- 查看部署日志了解具体错误信息
- 如问题持续存在,请联系技术支持
如遇到其他未列出的问题,请直接与我们联系获取技术支持。

