一、影响图片识别的因素:
1 角度
2 光照强度
3 形状改变(物体的姿态)
4 部分遮蔽(只有半张脸)
5 背景混入
二、常规识别套路:
1 收集数据集并给定标签
2 训练一个分类器
3 测试 评估
三、K-近邻算法
CIFAR-10数据集(数据库样例)
适合用于练习
四、对图像数据怎样计算所谓的距离?
这种计算距离方式来判断,识别错误率较高。
五、超参数:(曼哈顿距离(街区距离)和欧式距离)
找到最合适的参数:
交叉验证:先把训练集切成n份(可设置),n-1作为训练,1份做验证,从n份中数据每一 份都要做一次验证集,n次迭代后取均值(消除偏高和偏低的结果),最终达到调到最优参数 的目的。
六、背景主导
使用K-近邻算距离图像分类时,是对每个像素点进行相减运算,把背景也算进去了(目标并未把图像占满),导致结果不准。所以单纯使用K-近邻不能完成图像分类的任务。