常见问题解答

资源与算力相关问题

选择大模型训练时，当前资源不足怎么办？

我们当前默认每个用户最大算力用量为两张 GPU 卡。当部分模型需要的算力资源超出最大限额时，您可以直接与我们联系，申请提供更多算力支持。

建议操作：

检查当前任务所需的资源配额
优化模型配置以适应现有资源
如需更多资源，请联系客服申请扩容

算力使用账单什么时候可以查看？

针对按量计费的任务，账单更新和扣费机制如下：

实时扣费：

系统每 5 分钟统计一次用量
从账户余额进行预扣除
当余额不足以满足下一个 5 分钟的费用时，系统会提示用户余额不足，请及时充值

账单展示：

系统会延迟一天显示用户前一天使用的用量数据和计费数据
按天进行统计和展示

账单争议处理：若您对账单有疑议，可直接与我们联系进行核实和处理。

任务创建问题

为什么我创建一个训练任务时，显示创建失败？

为保证资源的有效使用，我们默认每个用户最大可使用算力是 2 张算力卡。当用户选择模型超出最大用量时，可能会因为所需资源超出使用范围而使得任务运行失败。

可能原因：

所选模型需要的 GPU 资源超过用户配额限制
系统资源暂时不足
配置参数超出允许范围
账户余额不足

解决方法：

检查并调整资源配置，确保不超过用户配额
选择资源需求较低的训练方法（如 LoRA、QLoRA）
确保账户有足够余额
如需更多资源，请联系客服申请扩容

其他常见问题

如何提高训练效率？

选择合适的训练方法：根据资源情况选择 LoRA 或 QLoRA 等高效训练方法
优化数据集：确保数据质量和格式正确
合理设置参数：根据数据集大小调整训练轮次和学习率
充分利用共享资源：使用平台提供的共享模型和数据集

模型部署失败怎么办？

检查模型文件是否完整
确认资源配置是否满足模型要求
查看部署日志了解具体错误信息
如问题持续存在，请联系技术支持

如遇到其他未列出的问题，请直接与我们联系获取技术支持。