在人工智能领域,人脸识别技术是核心开发技术,也是近年来人工智能应用最广泛的技术。目前,支付宝已经实现了刷脸登录账户,未来几年,支付软件也将实现刷脸支付等技术。
今天给大家分享一下人脸识别技术的一些基本概念。
1.人脸检测
人脸检测) 它是一种检测图像中人脸位置的技术。
人脸检测算法的输入是图片,输出是人脸帧的坐标序列(0个人脸帧或1个人脸帧或多个人脸帧)。
一般情况下,输出的人脸坐标框是一个朝上的正方形,但是有些人脸检测技术输出的是一个朝上的矩形或者是一个有旋转方向的矩形。
常见的人脸检测算法基本上是a 扫描 添加 歧视 过程,即算法扫描图像范围,然后逐个判断候选区域是否为人脸。
因此,人脸检测算法的计算速度会与图像大小和图像内容有关。
在开发过程中,我们可以设置 。输入图像大小 或者 最小字体大小限制 或者 最大面数 加速算法的方法。
面部检测结果的示例(绿色框是面部检测结果)
2.人脸注册
脸对齐) 是一种定位面部特征关键点坐标的技术。
人脸注册算法的输入是 一张脸图 添加 人脸坐标框架 ,输出五官关键点的坐标序列。
五官关键点的个数是预先设定的固定值,可以根据不同的语义定义(常见的有5、68、90等。).
目前一些效果比较好的人脸注册技术,基本都是通过深度学习框架来实现的。这些方法都是基于人脸检测的坐标框架,按照一些预设的规则推导出人脸区域,缩放到固定大小,然后计算出关键点位置。
因此,如果不考虑图像缩放的耗时过程,人脸注册算法是一个计算量固定的过程。
另外,人脸注册算法的计算时间比人脸检测或者人脸特征提取要少得多,后面会讲到。
人脸注册结果示例(右图中的绿点人脸注册结果)
3.人脸属性识别
人脸属性)识别 ;它是一种识别人脸的性别、年龄、姿势、表情等属性值的技术。
一般人脸属性识别算法的输入是 一张脸图 还有 五官关键点坐标 并且输出的是人脸对应的属性值。
人脸属性识别算法一般是根据人脸特征关键点的坐标进行人脸对齐(经过旋转、缩放、扣除等操作,将人脸调整到预定的大小和形状),然后进行属性分析。
常规的人脸属性识别算法在识别每一个人脸属性时都是一个独立的过程,即人脸属性识别只是对一类算法的统称,性别识别、年龄估计、姿态估计、表情识别都是独立的算法。
但是一些最新的基于深度学习的人脸属性识别,也具备了一个算法同时输入性别、年龄、姿势等属性值的能力。
人脸识别过程(最右边的文字是属性识别结果)
4.人脸特征提取
人脸特征提取) 它是将人脸图像转换成一系列固定长度的数值的过程。
这个数字字符串称为 脸特征) ,具有表征这张脸的能力。
人脸特征提取过程的输入也是 一张脸图 还有 五官关键点坐标 输出是对应于面部的数字串(特征)。
人脸特征提取算法会根据人脸特征关键点的坐标将人脸对齐到预定的模式,然后计算特征。
近几年的人脸特征提取算法基本都是深度学习方法占主导地位,都是固定时间的算法。
早期的人脸特征提取模型都比较大,速度比较慢,而且只用于后台服务。
但最新的一些研究可以在基本保证算法效果的前提下,将模型大小和运算速度优化到移动终端可以使用的状态。
人脸特征提取过程(最右边的数字串是 五官 )
5.人脸比较(人脸验证、人脸识别、人脸检索、人脸聚类)
脸对比) 这是一种算法来衡量两个人脸之间的相似性。
人脸匹配算法的输入是两个人脸特征(注:人脸特征是由前面的人脸特征提取算法得到的),输出是两个特征之间的相似度。【/br/】人脸验证、人脸识别、人脸检索都是在人脸比对的基础上增加一些策略来实现的。
与人脸特征提取过程相比,单张人脸比对耗时极短,几乎可以忽略不计。
基于人脸比对,可以衍生出人脸验证、人脸识别、人脸检索、人脸聚类等算法。
人脸比对过程(右边的相似度是人脸比对输出的结果)
6.人脸验证
人脸验证) 判断两张脸是不是同一个人的算法。
它的输入是两个面部特征,通过人脸比对得到两个面部特征的相似度,通过与预设的阈值比较验证两个面部特征是否属于同一个人(即相似度大于阈值,为同一个人;小于阈值是不同的)。
人脸验证流程说明(最右边 是同一个人 人脸验证的输出)
7.人脸识别
人脸识别) 是识别输入人脸图对应身份的算法。
它输入一个人脸特征,与库中登记的N个身份对应的特征一一比对,找出 一 与输入要素相似度最高的要素。
将这个最高相似度值与预设的阈值进行比较,如果大于阈值,则返回该特征对应的身份,否则返回 不在图书馆 。
人脸识别过程(正确识别 杰森 作为面部识别的结果)
8.人脸检索
人脸检索 是寻找与输入人脸相似的人脸序列的算法。
人脸检索将输入的人脸与集合中说话人的人脸进行比较,并根据比较后的相似度对集合中的人脸进行排序。
按照相似度从高到低排序的人脸序列就是人脸检索的结果。
人脸检索流程(右边绿框排序顺序为检索结果)
9.人脸聚类
面簇) 这是一种算法,根据人脸的身份将人脸分组到一个集合中。
人脸聚类还通过将一组中的所有人脸相互比较,然后分析这些相似度值,将属于同一身份的人分成一组。
在人工识别之前,我们只知道一组中的人脸属于同一个身份,而不知道确切的身份。
另外,假设集合中有n个人脸,人脸聚类的算法复杂度为O(N2)
人脸聚类过程(右边绿框按身份分组结果为聚类结果)
10.活生生的脸
the face liveness) ;是一种判断人脸图像是来自真人还是来自攻击性假体(照片、视频等)的方法。).
相对于上面提到的人脸技术,活脸不是一个简单的算法,而是一个问题的解决方案。
这种解决方案将用户交互和算法紧密结合,不同的交互方式对应完全不同的算法。
鉴于方法多种多样,只有 这里介绍方法。活生生的人脸 概念不再扩展。