Skip to content

常见问题解答

资源与算力相关问题

选择大模型训练时,当前资源不足怎么办?

我们当前默认每个用户最大算力用量为两张 GPU 卡。当部分模型需要的算力资源超出最大限额时,您可以直接与我们联系,申请提供更多算力支持。

建议操作

  1. 检查当前任务所需的资源配额
  2. 优化模型配置以适应现有资源
  3. 如需更多资源,请联系客服申请扩容

算力使用账单什么时候可以查看?

针对按量计费的任务,账单更新和扣费机制如下:

实时扣费

  • 系统每 5 分钟统计一次用量
  • 从账户余额进行预扣除
  • 当余额不足以满足下一个 5 分钟的费用时,系统会提示用户余额不足,请及时充值

账单展示

  • 系统会延迟一天显示用户前一天使用的用量数据和计费数据
  • 按天进行统计和展示

账单争议处理: 若您对账单有疑议,可直接与我们联系进行核实和处理。

任务创建问题

为什么我创建一个训练任务时,显示创建失败?

为保证资源的有效使用,我们默认每个用户最大可使用算力是 2 张算力卡。当用户选择模型超出最大用量时,可能会因为所需资源超出使用范围而使得任务运行失败。

可能原因

  1. 所选模型需要的 GPU 资源超过用户配额限制
  2. 系统资源暂时不足
  3. 配置参数超出允许范围
  4. 账户余额不足

解决方法

  1. 检查并调整资源配置,确保不超过用户配额
  2. 选择资源需求较低的训练方法(如 LoRA、QLoRA)
  3. 确保账户有足够余额
  4. 如需更多资源,请联系客服申请扩容

其他常见问题

如何提高训练效率?

  1. 选择合适的训练方法:根据资源情况选择 LoRA 或 QLoRA 等高效训练方法
  2. 优化数据集:确保数据质量和格式正确
  3. 合理设置参数:根据数据集大小调整训练轮次和学习率
  4. 充分利用共享资源:使用平台提供的共享模型和数据集

模型部署失败怎么办?

  1. 检查模型文件是否完整
  2. 确认资源配置是否满足模型要求
  3. 查看部署日志了解具体错误信息
  4. 如问题持续存在,请联系技术支持

如遇到其他未列出的问题,请直接与我们联系获取技术支持。