深度学习模型的云边协同训练和部署*

  作者:吴子强,刘敏,张义伟,李松珂(中国电子科技集团公司第四十一研究所,安徽蚌埠 233000) 时间:2022-12-22来源:电子产品世界

编者按:将云边协同技术应用到深度学习模型的训练和部署,可以解决目前工业质检领域深度学习模型训练和部署方法的不足,使模型的训练和部署更加安全、高效、智能化、低成本。

*基金项目:安徽省科技重大专项项目,基于5G通信的运化视觉检测系统研发(202003a05020002)。

0   引言

从“工业4.0”到“中国制造2025”,在国家大力提倡和发展工业生产智能制造的环境下,人工智能工业质检解决方案将全面赋能工业生产制造。目前视觉检测系统凭借其独特的优势逐渐替代人工检测方式,广泛应用于生产流水线中。与传统方式相比,深度学习可以在训练过程中自学习相关属性,省去特征工程环节,识别精度更高、更加灵活。

深度学习模型的训练往往要进行大量数据的处理工作,对硬件的内存和计算能力要求较高,因此需要在资源充足的数据中心完成。在视觉检测系统中,检测器本身从硬件成本和检测实时性考虑,都不适合充当数据中心。而在工厂内各车间、产线部署服务器单独进行模型训练,既效率低,也无法实现模型的统一管理和部署。收集大量的样本数据送往云端数据中心进行模型训练则存在两个主要的弊端。一方面,将所有产线数据传输到云端会给核心网络带来沉重负担,造成服务延时。另一方面,大量的原始数据通过广域网传输容易泄露用户数据隐私,违背用户意愿。

随着工业互联网和边缘计算[2]的发展,将云边协同[3]技术应用到深度学习模型的训练和部署,可以解决目前工业质检领域深度学习模型训练[4]和部署方法的不足,使模型的训练和部署更加安全、高效、智能化、低成本。

1671707313640241.png

1   系统架构组成

为了推动工业质检领域深度学习技术的应用,本文提供了一种深度学习模型的云边协同训练和部署方法,为了实现上述目的采用如下技术方案,通过工业视觉检测系统实现检测模型的自动化训练和部署,具体系统架构组成如下。

1)如图1 所示,工业视觉检测系统包括检测器、边缘服务器、中心云服务器组成。

2)如图2 所示,中心云服务器Web 应用执行分布式任务处理。在收到控制终端的控制命令后,发布异步任务(训练或部署模型),发布定时任务更新任务执行进度,任务信息立即放入消息队列中,任务执行单元从消息队列中依次取出任务执行,并存储执行结果。

1671707411279870.png

3)如图3 所示,模型训练任务流程。模型的训练配置数据,包括训练集、验证集生成器配置、模型尺寸、迭代次数、分类种类配置,以及数据预处理、预训练权重、回调函数、模型微调等项目配置,通过前端传递到中心云服务器后端,后端将任务消息放入Redis 队列,任务执行单元从队列取出并解析任务信息,向保持长连接的边缘服务器发送任务,同时开启定时任务,获取任务执行进度,如图4 所示。边缘服务器接收到任务之后,采集相应检测器存储的原始数据,采集完成后按照任务要求,开展模型训练,如图5 所示。在回调函数中每次训练Batch 开始的时候记录训练进度、模型精度和损失值,向中心云服务器定时返回模型训练进度和训练效果。模型训练完成,可自动上传至中心云服务器进行进一步的评估测试。

1671707481707253.png

1671710419138903.png

图4 中心云服务器模型训练配置界面

1671710450282044.png

图5 边缘服务器模型训练执行界面

4)如图6 所示,模型部署任务流程。模型的部署配置数据,包括指定产线、指定检测器、指定品牌模型等项目配置,通过前端传递到中心云服务器后端,后端将任务消息放入Redis 队列,任务执行单元从队列取出并解析任务信息,向保持长连接的边缘服务器发送任务,同时开启定时任务,获取任务执行进度。边缘服务器接收到任务之后,向指定检测器发送训练好的模型文件。向中心云服务器定时返回模型下发进度。检测器接收完成模型文件,放入指定的品牌参数文件夹下,检测器执行加载模型。边缘服务器向中心云服务器返回模型部署成功消息。

通过上面具体实施方式,所述技术领域的技术人员可容易地实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,实现不同的技术方案。

1671710553141301.png


2   部署方法

云边协同的模型训练和部署方法操作步骤如下:

1)检测器由工控机、单片机、图像采集通讯组件、光源控制电路、编码器信号采集电路等部分组成,工厂内各产线检测器调用深度学习模型对产品质量进行实时检测,此外检测器还负责将历史数据传送到该产线的边缘服务器中。

2)边缘服务器与中心云服务器保持长连接,在收到中心云服务模型训练命令后,解析命令,获取任务参数信息,采集指定检测器存储数据,进行模型训练。同时定时更新训练进度、训练精度、训练损失值等过程信息给中心云服务器。

3)边缘服务器与中心云服务器保持长连接,在收到中心云服务模型部署命令后,解析命令,向检测器下发训练好的模型文件。同时定时更新模型下发进度、检测器加载模型进度等过程信息给中心云服务器。

4)中心云服务器搭建Web 应用,接收用户的远程控制,向中心云服务器发送模型训练和部署命令,以及接收中心云服务器返回信息,向用户显示任务执行情况。

3   结束语

通过云边协同的方式训练和部署深度学习模型,可以实现模型更加便捷地发布到检测设备,确保生产车间数据不出厂,降低了网络负载和数据泄露风险。同时,充分利用边缘服务器硬件资源,可视化和自动化的深度学习模型训练和部署,有利于推动深度学习在智能制造、工业质检领域的商业化应用。基于这种检测方法可以开发出应用于各种工业视觉检测系统,具有广泛的应用空间。

参考文献:

[1] 曲春光.分布式深度学习训练优化设计与实现[D].重庆:西南大学,2020:14-17.

[2] 刘建瓯.基于边缘计算的计算和网络融合系统架构设计和实现[D].西安:西安电子科技大学,2020:17-19.

[3] 崔羽飞,张云勇,张第,等.基于云边协同的工业互联网实践[J].电信科学.2020(2):110-115.

[4] 王海川.面向边缘智能的模型训练服务部署和任务卸载研究[D].合肥:中国科学技术大学,2020:16-33.

(本文来源于必威娱乐平台 杂志2022年12月期)

关键词: 云边协同 深度学习 服务器部署 202212

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版