(12)发明专利申请
(10)申请公布号 CN 109460792 A(43)申请公布日 2019.03.12
(21)申请号 201811353403.9(22)申请日 2018.11.14
(71)申请人 深圳市威富视界有限公司
地址 518100 广东省深圳市宝安区西乡街
道前进二路展丰工业园B2栋2楼(72)发明人 张少林 宁欣 石园
(74)专利代理机构 北京超凡志成知识产权代理
事务所(普通合伙) 11371
代理人 逯恒(51)Int.Cl.
G06K 9/62(2006.01)G06K 9/00(2006.01)
权利要求书2页 说明书10页 附图3页
CN 109460792 A(54)发明名称
一种基于图像识别的人工智能模型训练方法及装置(57)摘要
本发明提供一种基于图像识别的人工智能模型训练方法及系统,其中,该人工智能模型训练方法包括:获取基准样本集、注册样本集以及验证集;以GoogLeNet网络结构和基准样本集为依据训练原始人工智能模型;对原始人工智能模型进行优化迭代训练,得到至少一个优化人工智能模型;输入验证集,得到原始准确率以及与至少一个优化准确率;判断至少一个优化准确率中是否存在一个满足限制条件的最优准确率;当最优准确率存在的时候,确定最优准确率对应的优化人工智能模型为最优人工智能模型。可见,本发明所描述的基于图像识别的人工智能模型训练方法能够通过使用该人工智能模型以人工智能的手段来提高图像识别的效率、精度,并降低图像识别的成本。
CN 109460792 A
权 利 要 求 书
1/2页
1.一种基于图像识别的人工智能模型训练方法,其特征在于,包括:获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像;
以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型;以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;
在所述原始人工智能模型和所述至少一个优化人工智能模型中输入所述验证集,计算出与所述原始人工智能模型对应的原始准确率以及与所述至少一个优化人工智能模型一一对应的至少一个优化准确率;
判断所述至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与所述原始准确率差值的绝对值小于预设阈值的最优准确率;
当所述最优准确率存在的时候,确定所述最优准确率对应的优化人工智能模型为最优人工智能模型。
2.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述正常图像、特殊图像以及其它图像皆属于人脸图像。
3.根据权利要求2所述的人工智能模型训练方法,其特征在于,所述基准样本集中包括多组正常图像,其中,每组正常图像包括同一位用户的三个人脸图像,且所述三个人脸图像中至少具有一张与预设图像要求相符的人脸图像。
4.根据权利要求1所述的人工智能模型训练方法,所述基准样本集包括多组正样本集,其特征在于,所述以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型的步骤包括:
在所述基准样本集中获取多组正样本集;
通过GoogLeNet网络结构提取与所述多组正样本集对应的特征集;以所述多组正样本集包括的每组正样本集和所述特征集为依据,获取与所述每组正样本集对应负样本,并组合所有负样本为负样本集;
以预设损失函数和所述负样本集为依据,对所述多组正样本集进行权重更新,得到原始人工智能模型。
5.根据权利要求1所述的人工智能模型训练方法,其特征在于,所述以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型的步骤包括:
以预设比例获取所述所述基准样本集和所述注册样本集中的样本,得到优化样本集;以预设优化模型和所述优化样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;其中,
所述预设优化模型是以所述GoogLeNet网络结构、Triplet Loss函数为基础的优化模型。
6.一种基于图像识别的人工智能模型训练装置,其特征在于,包括获取模块、训练模
2
CN 109460792 A
权 利 要 求 书
2/2页
块、优化模块、验证模块、判断模块以及确定模块,其中,
所述获取模块用于获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像;
所述训练模块用于以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型;
所述优化模块用于以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;
所述验证模块用于在所述原始人工智能模型和所述至少一个优化人工智能模型中输入所述验证集,计算出与所述原始人工智能模型对应的原始准确率以及与所述至少一个优化人工智能模型一一对应的至少一个优化准确率;
所述判断模块用于判断所述至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与所述原始准确率差值的绝对值小于预设阈值的最优准确率;
所述确定模块用于当所述最优准确率存在的时候,确定所述最优准确率对应的优化人工智能模型为最优人工智能模型。
7.根据权利要求6所述的人工智能模型训练装置,其特征在于,所述正常图像、特殊图像以及其它图像皆属于人脸图像。
8.根据权利要求6所述的人工智能模型训练装置,其特征在于,所述训练模块包括获取单元、提取单元以及训练单元,其中,
所述获取单元用于在所述基准样本集中获取多组正样本集;
所述提取单元用于通过GoogLeNet网络结构提取与所述多组正样本集对应的特征集;所述获取单元还用于以所述多组正样本集包括的每组正样本集和所述特征集为依据,获取与所述每组正样本集对应负样本,并组合所有负样本为负样本集;
所述训练单元用于以预设损失函数和所述负样本集为依据,对所述多组正样本集进行权重更新,得到原始人工智能模型。
9.一种计算机设备,其特征在于,包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述计算机设备执行根据权利要求1至5中任一项所述的一种基于图像识别的人工智能模型训练方法。
10.一种计算机可读存储介质,其特征在于,其存储有权利要求9所述的计算机设备中所使用的计算机程序。
3
CN 109460792 A
说 明 书
一种基于图像识别的人工智能模型训练方法及装置
1/10页
技术领域
[0001]本发明涉及人工智能领域,具体而言,涉及一种基于图像识别的人工智能模型训练方法及装置。
背景技术
[0002]图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。传统的图像识别方法,通常是利用各种软件对图片进行不同方面的处理进行识别的。可见,传统的图像识别方法需要通过大量的工作才能识别出图像来,并且后期工作还需由工作人员参与,使得图像识别的主观性较强,并且人力成本较高,同时还伴随着精度不高的问题;另一方面,图像识别通常是基于固定比例进行识别的,这就使得在比例不同的情况下,图像识别的难度与工作量将呈指数倍增长,识别精度将大幅下降。发明内容
[0003]鉴于上述问题,本发明提供了一种基于图像识别的人工智能模型训练方法及装置,能够通过使用该人工智能模型以人工智能的手段来提高图像识别的效率、精度,并降低图像识别的成本。
[0004]为了实现上述目的,本发明采用如下的技术方案:[0005]第一方面,本发明提供了一种基于图像识别的人工智能模型训练方法,包括:[0006]获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像;以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型;
[0007]以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;
[0008]在所述原始人工智能模型和所述至少一个优化人工智能模型中输入所述验证集,计算出与所述原始人工智能模型对应的原始准确率以及与所述至少一个优化人工智能模型一一对应的至少一个优化准确率;[0009]判断所述至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与所述原始准确率差值的绝对值小于预设阈值的最优准确率;[0010]当所述最优准确率存在的时候,确定所述最优准确率对应的优化人工智能模型为最优人工智能模型。
[0011]作为一种可选的实施方式,所述正常图像、特殊图像以及其它图像皆属于人脸图像。
4
CN 109460792 A[0012]
说 明 书
2/10页
作为一种可选的实施方式,所述基准样本集中包括多组正常图像,其中,每组正常
图像包括同一位用户的三个人脸图像,且所述三个人脸图像中至少具有一张与预设图像要求相符的人脸图像。
[0013]作为一种可选的实施方式,所述基准样本集包括多组正样本集,其中,所述以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型的步骤包括:[0014]在所述基准样本集中获取多组正样本集;
[0015]通过GoogLeNet网络结构提取与所述多组正样本集对应的特征集;[0016]以所述多组正样本集包括的每组正样本集和所述特征集为依据,获取与所述每组正样本集对应负样本,并组合所有负样本为负样本集;[0017]以预设损失函数和所述负样本集为依据,对所述多组正样本集进行权重更新,得到原始人工智能模型。
[0018]作为一种可选的实施方式,所述以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型的步骤包括:
[0019]以预设比例获取所述所述基准样本集和所述注册样本集中的样本,得到优化样本集;
[0020]以预设优化模型和所述优化样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;其中,[0021]所述预设优化模型是以所述GoogLeNet网络结构、Triplet Loss函数为基础的优化模型。
[0022]第二方面,本发明提供了一种基于图像识别的人工智能模型训练装置,包括获取模块、训练模块、优化模块、验证模块、判断模块以及确定模块,其中,[0023]所述获取模块用于获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像;
[0024]所述训练模块用于以GoogLeNet网络结构和所述基准样本集为依据训练原始人工智能模型;
[0025]所述优化模块用于以预设优化模型、所述基准样本集以及所述注册样本集为依据,对所述原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;
[0026]所述验证模块用于在所述原始人工智能模型和所述至少一个优化人工智能模型中输入所述验证集,计算出与所述原始人工智能模型对应的原始准确率以及与所述至少一个优化人工智能模型一一对应的至少一个优化准确率;
[0027]所述判断模块用于判断所述至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与所述原始准确率差值的绝对值小于预设阈值的最优准确率;[0028]所述确定模块用于当所述最优准确率存在的时候,确定所述最优准确率对应的优化人工智能模型为最优人工智能模型。
5
CN 109460792 A[0029]
说 明 书
3/10页
作为一种可选的实施方式,所述正常图像、特殊图像以及其它图像皆属于人脸图作为一种可选的实施方式,所述训练模块包括获取单元、提取单元以及训练单元,所述获取单元用于在所述基准样本集中获取多组正样本集;
所述提取单元用于通过GoogLeNet网络结构提取与所述多组正样本集对应的特征
像。
[0030]
其中,
[0031][0032]
集;
所述获取单元还用于以所述多组正样本集包括的每组正样本集和所述特征集为
依据,获取与所述每组正样本集对应负样本,并组合所有负样本为负样本集;[0034]所述训练单元用于以预设损失函数和所述负样本集为依据,对所述多组正样本集进行权重更新,得到原始人工智能模型。[0035]第三方面,本发明提供了一种计算机设备,所述计算机设备包括存储器以及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述计算机设备执行本发明第一方面所述的一种基于图像识别的人工智能模型训练方法。[0036]第四方面,本发明提供了一种计算机可读存储介质,其存储有本发明第三方面所述的计算机设备中所使用的计算机程序。
[0037]根据本发明提供的基于图像识别的人工智能模型训练方法及装置,可以优先获取各种样本数据,并根据该样本数据进行训练得到原始人工智能模型,并对原始人工智能模型进行优化迭代得到多个优化迭代过程中的至少一个优化人工智能模型,在获取到至少一个优化人工智能模型之后,利用没用过的样本数据对原始人工智能模型和至少一个优化人工智能模型进行验证,得到相应的准确率,并在保证至少一个优化人工智能模型准确率要高于原始人工智能模型的准确率的同时,还兼顾至少一个优化人工智能模型准确率要与原始人工智能模型的准确率之间的差值不会大于极限阈值的情况下,获取到一个最优的人工智能模型。可见,实施这种实施方式,能够通过预设的神经网络架构、指定的样本集以及相应的优化模型来获取最优的人工智能模型,从而使得该人工智能模型在应用的过程中,可以提高图像识别的效率与精度,并降低图像识别的成本。[0038]为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明
[0039]为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明范围的限定。
[0040]图1是本发明第一实施例提供的一种基于图像识别的人工智能模型训练方法的流程示意图;
[0041]图2是本发明第二实施例提供的一种基于图像识别的人工智能模型训练方法的流程示意图;
[0042]图3是本发明第三实施例提供的一种基于图像识别的人工智能模型训练装置的结构示意图。
6
[0033]
CN 109460792 A
说 明 书
4/10页
具体实施方式
[0043]下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。[0044]针对现有技术中的问题,本发明提供了一种基于图像识别的人工智能模型训练方法,该方法可以优先获取各种样本数据,并根据该样本数据进行训练得到原始人工智能模型,并对原始人工智能模型进行优化迭代得到多个优化迭代过程中的至少一个优化人工智能模型,在获取到至少一个优化人工智能模型之后,利用没用过的样本数据对原始人工智能模型和至少一个优化人工智能模型进行验证,得到相应的准确率,并在保证至少一个优化人工智能模型准确率要高于原始人工智能模型的准确率的同时,还兼顾至少一个优化人工智能模型准确率要与原始人工智能模型的准确率之间的差值不会大于极限阈值的情况下,获取到一个最优的人工智能模型。可见,实施这种实施方式,能够通过预设的神经网络架构、指定的样本集以及相应的优化模型来获取最优的人工智能模型,从而使得该人工智能模型在应用的过程中,可以提高图像识别的效率与精度,并降低图像识别的成本。下面通过实施例进行描述。[0045]其中,上述的技术方法还可以采用相关的软件或硬件加以实现,对此本实施例中不再多加赘述。针对该基于图像识别的人工智能模型训练方法及装置,下面通过实施例进行描述。
[0046]实施例1
[0047]请参阅图1,是本实施例提供的一种基于图像识别的人工智能模型训练方法的流程示意图,该基于图像识别的人工智能模型训练方法包括以下步骤:[0048]S101、获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像。[0049]本实施例中,阶元系统是用于把自然界分为植物、动物和矿物三界的大系统,同时该系统还在动植物界下,设有纲、目、属、种四个级别,得到了分类的阶元系统。其中,阶元系统可以表明一种类别的物体,且是自然界公认的一类。[0050]本实施例中,正常图像、特殊图像以及其它图像皆属于人脸图像。[0051]本实施例中,基准样本集中包括多组正常图像,其中,每组正常图像包括同一位用户的三个人脸图像,且三个人脸图像中至少具有一张与预设图像要求相符的人脸图像。[0052]本实施例中,正常图像是相对于特殊图像来说的,其中正常图像是普遍图像,特殊图像是具有明显特征或具有普通图像不具有的特征的图像;其它图像对特征没有任何要求,只要不在基准样本集、注册样本集中即可。[0053]本实施例中,基准样本集、注册样本集以及验证集是预存好的大数据样本集合。
7
CN 109460792 A[0054]
说 明 书
5/10页
本实施例中,该训练方法中的样本数据可以是来源于实际生活场景,具体可以为
手机拍摄的照片或视频中的图像。[0055]作为一种可选的实施方式,基准样本集、注册样本集中都是以样本组为单位的,其中,每个样本组包括同一个人的多张照片,其中一张照片是身份证照片。[0056]作为一种优选的实施方式,每个样本组包括同一个人的三张照片。[0057]本实施例中,基准样本集为不包含特定注册人的样本集,该基准样本集主要用来训练原始人工智能模型,用于进行基本的动态人脸识别。[0058]本实施例中,优选的基准样本集约包括20万人,60万张照片。[0059]本实施例中,注册样本集是特定注册人的样本集,该注册样本集用来学习特定人之间的差异,从而优化基本模型,进而训练出更适应注册人的优化人工智能模型。[0060]本实施例中,注册样本集约包括1000人,3000张照片。[0061]本实施例中,验证集中的人没有出现在基准样本集和注册样本集中,该样本集主要用来测试优化人工智能模型是否偏离,并判断人工智能模型的使用准确率是否在误差范围内。
[0062]本实施例中,验证集约8千人,每人2张照片。[0063]S102、以GoogLeNet网络结构和基准样本集为依据训练原始人工智能模型。[0064]本实施例中,GoogLeNet结构的主要思想在于卷积视觉网络中一个优化的局部稀疏结构怎么样能由一系列易获得的稠密子结构来近似和覆盖。上面提到网络拓扑结构是由逐层分析上一层的相关统计信息并聚集到一个高度相关的单元组中,这些簇(单元组)表达下一层的单元(神经元)并与之前的单元相连接,而靠近输入图像的底层相关的单元在一块局部区域聚集,这就意味着我们可以在一块单一区域上聚集簇来结尾,并且他们能在下一层由一层1x1的卷积层覆盖,也即利用更少的数量在更大空间扩散的簇可由更大patches上的卷积来覆盖,也将减少越来越大的区域上patches的数量。[0065]S103、以预设优化模型、基准样本集以及注册样本集为依据,对原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型。[0066]本实施例中,预设优化模型可以是以GoogLeNet网络结构为基础构建的模型,其中在GoogLeNet网络结构的基础上,还可以用损失算法或者相应的反馈算法进行优化。[0067]本实施例中,至少一个优化人工智能模型是获取的多个人工智能模型的结果;是训练过程的多个结果的结合。[0068]S104、在原始人工智能模型和至少一个优化人工智能模型中输入验证集,计算出与原始人工智能模型对应的原始准确率以及与至少一个优化人工智能模型一一对应的至少一个优化准确率。[0069]本实施例中,至少一个优化准确率用于评价优化人工智能模型的优化程度。[0070]实施这种实施方式,可以获取优化人工智能模型的优化率,从而对人工智能模型进行评价。
[0071]S105、判断至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与原始准确率差值的绝对值小于预设阈值的最优准确率;若是,则执行步骤S106;若否,则结束本流程。
[0072]本实施例中,优化准确率大于原始准确率说明优化人工智能模型是在好的存在变
8
CN 109460792 A
说 明 书
6/10页
化的。
本实施例中,至少一个优化准确率与原始准确率差值的绝对值小于预设阈值说明
优化人工智能模型是成功的,偏差合理的。[0074]本实施例中,预设阈值用于表示至少一个优化准确率与原始准确率差值的绝对值是否超出偏差的偏差临界值。[0075]实施这种实施方式,可以在上述限定条件下,得到最优的最优准确率。[0076]S106、确定最优准确率对应的优化人工智能模型为最优人工智能模型。[0077]本实施例中,步骤S106是指,当最优准确率存在的时候,确定最优准确率对应的优化人工智能模型为最优人工智能模型。[0078]实施这种实施方式,可以确定出最优人工智能模型,从而完成人工智能模型的训练。
[0079]作为一种可选的实施方式,在获取到最优人工智能模型之后,该方法还可以包括:[0080]获取相应的测试集,该测试集仅仅用于测试该最优人工智能模型的各种属性。[0081]实施这种实施方式,可以表示出该最优人工智能模型的效果。[0082]在图1所描述的基于图像识别的人工智能模型训练方法中,可以优先获取各种样本数据,并根据该样本数据进行训练得到原始人工智能模型,并对原始人工智能模型进行优化迭代得到多个优化迭代过程中的至少一个优化人工智能模型,在获取到至少一个优化人工智能模型之后,利用没用过的样本数据对原始人工智能模型和至少一个优化人工智能模型进行验证,得到相应的准确率,并在保证至少一个优化人工智能模型准确率要高于原始人工智能模型的准确率的同时,还兼顾至少一个优化人工智能模型准确率要与原始人工智能模型的准确率之间的差值不会大于极限阈值的情况下,获取到一个最优的人工智能模型。可见,实施图1所描述的基于图像识别的人工智能模型训练方法,能够通过预设的神经网络架构、指定的样本集以及相应的优化模型来获取最优的人工智能模型,从而使得该人工智能模型在应用的过程中,可以提高图像识别的效率与精度,并降低图像识别的成本。[0083]实施例2
[0084]请参阅图2,图2是本实施例提供的一种基于图像识别的人工智能模型训练方法的流程示意图。如图2所示,该基于图像识别的人工智能模型训练方法包括以下步骤:[0085]S201、获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像。[0086]本实施例中,正常图像、特殊图像以及其它图像皆属于人脸图像。[0087]本实施例中,基准样本集中包括多组正常图像,其中,每组正常图像包括同一位用户的三个人脸图像,且三个人脸图像中至少具有一张与预设图像要求相符的人脸图像。[0088]S202、在基准样本集中获取多组正样本集。[0089]本实施例中,多组正样本数据可以是在基准样本集中选取的多组正样本图像对。[0090]S203、通过GoogLeNet网络结构提取与多组正样本集对应的特征集。[0091]本实施例中,通过GoogLeNet网络结构构成的神经网络获取较多且准确的特征集,
9
[0073]
CN 109460792 A
说 明 书
7/10页
该特征集中的特征可以是上述多组正样本集中多个图像中包括所有特征。[0092]S204、以多组正样本集包括的每组正样本集和特征集为依据,获取与每组正样本集对应负样本,并组合所有负样本为负样本集。[0093]本实施例中,负样本是指与一组正样本集的特征最为相近的样本。[0094]本实施例中,负样本用于辅助确定出与正样本集相对应的区别特征。[0095]S205、以预设损失函数和负样本集为依据,对多组正样本集进行权重更新,得到原始人工智能模型。[0096]本实施例中,权重更新的过程是对图像不断区别的过程。[0097]S206、以预设比例获取基准样本集和注册样本集中的样本,得到优化样本集。[0098]本实施例中,预设比例可以为二比一获取基准样本集和注册样本集中的样本。[0099]S207、以预设优化模型和优化样本集为依据,对原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;其中,上述预设优化模型是以GoogLeNet网络结构、Triplet Loss函数为基础的优化模型。[0100]本实施例中,TripletLoss函数是深度学习中的一种损失函数,用于训练差异性较小的样本,如人脸等,Feed数据包括锚示例、正示例、负示例,通过优化锚示例与正示例的距离小于锚示例与负示例的距离,实现样本的相似性计算。其中,正示例为正样本集,负示例为负样本集。[0101]S208、在原始人工智能模型和至少一个优化人工智能模型中输入验证集,计算出与原始人工智能模型对应的原始准确率以及与至少一个优化人工智能模型一一对应的至少一个优化准确率。[0102]本实施例中,原始准确率用于作为基准比对的数据,至少一个优化准确率用于作为与原始准确率进行比对的数据。其中,原始准确率与至少一个优化准确率比对的结果用于表示至少一个优化人工智能模型的优化程度。[0103]S209、判断上述至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与原始准确率差值的绝对值小于预设阈值的最优准确率;若是,则执行步骤S210;若否,则结束本流程。
[0104]本实施例中,优化准确率大于原始准确率说明优化人工智能模型是在好的存在变化的。
[0105]本实施例中,至少一个优化准确率与原始准确率差值的绝对值小于预设阈值说明优化人工智能模型是成功的,偏差合理的。[0106]本实施例中,预设阈值用于表示至少一个优化准确率与原始准确率差值的绝对值是否超出偏差的偏差临界值。[0107]实施这种实施方式,可以在上述限定条件下,得到最优的最优准确率。[0108]S210、确定最优准确率对应的优化人工智能模型为最优人工智能模型。[0109]实施这种实施方式,可以确定出最优人工智能模型,从而完成人工智能模型的训练。
[0110]作为一种可选的实施方式,在获取到最优人工智能模型之后,该方法还可以包括:[0111]获取相应的测试集,该测试集仅仅用于测试该最优人工智能模型的各种属性。[0112]实施这种实施方式,可以表示出该最优人工智能模型的效果。
10
CN 109460792 A[0113]
说 明 书
8/10页
在图2所描述的基于图像识别的人工智能模型训练方法中,可以优先获取各种样
本数据,并根据该样本数据进行训练得到原始人工智能模型,并对原始人工智能模型进行优化迭代得到多个优化迭代过程中的至少一个优化人工智能模型,在获取到至少一个优化人工智能模型之后,利用没用过的样本数据对原始人工智能模型和至少一个优化人工智能模型进行验证,得到相应的准确率,并在保证至少一个优化人工智能模型准确率要高于原始人工智能模型的准确率的同时,还兼顾至少一个优化人工智能模型准确率要与原始人工智能模型的准确率之间的差值不会大于极限阈值的情况下,获取到一个最优的人工智能模型;同时使用GoogLeNet网络结构和Triplet Loss损失函数来对上述的原始人工智能模型以及至少一个优化人工智能模型进行优化,以使该方法得到一个最优的人工智能模型。可见,实施图2所描述的基于图像识别的人工智能模型训练方法,能够通过GoogLeNet网络结构、Triplet Loss损失函数、指定的样本集以及相应的优化模型来获取最优的人工智能模型,从而使得该人工智能模型在应用的过程中,可以提高图像识别的效率与精度,并降低图像识别的成本。[0114]实施例3
[0115]请参阅图3,是本实施例提供的一种基于图像识别的人工智能模型训练装置的结构示意图。
[0116]如图3所示,该基于图像识别的人工智能模型训练装置包括获取模块30、训练模块40、优化模块50、验证模块60、判断模块70以及确定模块80,其中,[0117]获取模块30用于获取基准样本集、注册样本集以及验证集;其中,所述基准样本集、注册样本集以及验证集均包括图像,所述基准样本集包括的图像被归类为正常图像,所述注册样本集包括的图像被归类为特殊图像,所述验证集包括的图像被归类为所述基准样本集和所述注册样本集皆未包括的其它图像,并且所述正常图像、所述特殊图像以及所述其它图像按照阶元系统标准皆属于同类图像;[0118]训练模块40用于以GoogLeNet网络结构和基准样本集为依据训练原始人工智能模型;
[0119]优化模块50用于以预设优化模型、基准样本集以及注册样本集为依据,对原始人工智能模型进行优化迭代训练,并获取优化迭代训练过程中存在的至少一个优化人工智能模型;
[0120]验证模块60用于在原始人工智能模型和至少一个优化人工智能模型中输入验证集,计算出与原始人工智能模型对应的原始准确率以及与至少一个优化人工智能模型一一对应的至少一个优化准确率;[0121]判断模块70用于判断至少一个优化准确率中是否存在大于原始准确率的优化准确率,且与原始准确率差值的绝对值小于预设阈值的最优准确率;[0122]确定模块80用于当最优准确率存在的时候,确定最优准确率对应的优化人工智能模型为最优人工智能模型。[0123]本实施例中,正常图像、特殊图像以及其它图像皆属于人脸图像。[0124]作为一种可选的实施方式,训练模块40包括获取单元41、提取单元42以及训练单元43,其中,
[0125]获取单元41用于在基准样本集中获取多组正样本集;
11
CN 109460792 A[0126]
说 明 书
9/10页
提取单元42用于通过GoogLeNet网络结构提取与多组正样本集对应的特征集;
[0127]获取单元41还用于以多组正样本集包括的每组正样本集和特征集为依据,获取与每组正样本集对应负样本,并组合所有负样本为负样本集;[0128]训练单元43用于以预设损失函数和负样本集为依据,对多组正样本集进行权重更新,得到原始人工智能模型。[0129]本实施例中,基于图像识别的人工智能模型训练装置与实施例1或实施例2中所描述的基于图像识别的人工智能模型训练方法相对应,并可以通过相应的模块与单元来执行该训练方法相应的步骤。[0130]可见,实施本实施例所描述的基于图像识别的人工智能模型训练装置,能够通过GoogLeNet网络结构、Triplet Loss损失函数、指定的样本集以及相应的优化模型来获取最优的人工智能模型,从而使得该人工智能模型在应用的过程中,可以提高图像识别的效率与精度,并降低图像识别的成本。[0131]此外,本发明还提供了另外一种计算机设备,该计算机设备可以包括智能电话、平板电脑、车载电脑、智能穿戴设备等。该计算机设备包括存储器和处理器,存储器可用于存储计算机程序,处理器通过运行上述计算机程序,从而使计算机设备执行上述方法或者上述装置中的各个单元的功能。
[0132]存储器可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0133]本实施例还提供了一种计算机存储介质,用于储存上述计算机设备中使用的计算机程序。
[0134]在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。[0135]另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。[0136]所描述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是
12
CN 109460792 A
说 明 书
10/10页
智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所描述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0137]以上所描述的内容,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
13
CN 109460792 A
说 明 书 附 图
1/3页
图1
14
CN 109460792 A
说 明 书 附 图
2/3页
图2
15
CN 109460792 A
说 明 书 附 图
3/3页
图3
16
因篇幅问题不能全部显示,请点此查看更多更全内容