金融界2024年10月24日消息,国家知识产权局信息显示,中国移动通信有限公司研究院及中国移动通信集团有限公司申请一项名为“一种模型训练方法、装置、计算机设备及存储介质”的专利,公开号 CN 118796547 A,申请日期为 2023年12月。

专利摘要显示,本申请提供了一种模型训练方法、装置、计算机设备及存储介质,其中,所述训练方法包括:在模型训练过程中,每一次迭代完成模型状态更新之后,根据当前迭代次数选择备份计算节点,并将当前的模型状态信息存储至所述备份计算节点;当模型训练中断时,获取中断之前最近一次迭代的次数;再根据所述最近一次迭代的次数,从对应的备份计算节点中获取模型状态信息;根据所获取的模型状态信息进行接续训练。本申请通过设置备份计算节点对每一次模型训练中间状态进行保存,实现了在不影响训练任务的前提下对模型状态的连续备份,使得当训练过程异常中断时也能以最新迭代的参数恢复,从而节约了模型训练时间,提高了模型训练效率。

追加内容

本文作者可以追加内容哦 !