AI与Python教程

AI与Python - 计算机视觉

计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉.在本章中，您将详细了解这一点.

计算机视觉

计算机视觉是一门研究如何重建，打断和理解的学科根据场景中存在的结构的属性，来自其2D图像的3d场景.

计算机视觉层次结构

计算机视觉是分开的分为以下三个基本类别;

低级别愿景 : 它包括用于特征提取的过程图像.
中级视觉 : 它包括对象识别和3D场景解释
高级视觉 : 它包括活动，意图和行为等场景的概念性描述.

计算机视觉与图像处理

图像处理研究图像到图像的变换.图像处理的输入和输出都是图像.

计算机视觉是从图像中构建明确，有意义的物理对象描述.计算机视觉的输出是对3D场景中结构的描述或解释.

应用程序

计算机视觉在以下领域中找到应用程序 :

机器人

本地化 - 确定机器人位置自动
导航
避障障碍
装配(钉孔，焊接，涂漆)
操纵(例如PUMA机器人操纵器)
人机交互(HRI):智能机器人与人交流

药物

分类和检测(例如病变或细胞分类和肿瘤检测)
2D/3D分割
3D人体器官重建(MRI或超声)
视觉引导机器人手术

安全

生物识别(虹膜，指纹，面部识别)
监视检测某些可疑活动或行为

运输

自动驾驶汽车
安全，例如驾驶员警惕性监控

工业自动化应用

工业检查(缺陷检测)
汇编
条形码和包裹标签阅读
对象排序
文档理解(例如OCR)

安装有用的软件包

对于使用Python的计算机视觉，您可以使用名为

pip install opencv_python-X.X-cp36-cp36m-winX.whl

这里X代表你机器上安装的Python版本以及你所拥有的win32或64位.

如果您使用的是 anaconda 环境，请使用以下命令安装OpenCV :

conda install -c conda-forge opencv

读取，写入和显示图像

大多数CV应用程序需要获取图像作为输入并产生图像作为输出.在本节中，您将学习如何借助OpenCV提供的功能读取和写入图像文件.

用于读取，显示，写入图像文件的OpenCV函数

OpenCV为此目的提供以下功能 :

imread()function : 这是读取图像的功能. OpenCV imread()支持各种图像格式，如PNG，JPEG，JPG，TIFF等.
imshow()函数 : 这是在窗口中显示图像的功能.窗口自动适合图像大小. OpenCV imshow()支持各种图像格式，如PNG，JPEG，JPG，TIFF等.
imwrite()函数 : 这是写入图像的功能. OpenCV imwrite()支持各种图像格式，如PNG，JPEG，JPG，TIFF等.

示例

此示例显示了以一种格式读取图像的Python代码 : 在窗口中显示它并以其他格式写入相同的图像.考虑下面显示的步骤 :

如图所示导入OpenCV包 :

import cv2

现在，要读取特定图像，请使用imread()函数 :

image = cv2.imread('image_flower.jpg')

要显示图像，请使用 imshow()功能.您可以在其中看到图像的窗口名称为 image_flower .

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

image flower

现在，我们可以将相同的图像写入另一种格式，例如.png使用imwrite()函数 :

cv2.imwrite('image_flower.png',image)

输出True表示图像已成功写为.png文件也在同一个文件夹中.

True

注意和减去;函数destroyallWindows()只是破坏我们创建的所有窗口.

颜色空间转换

在OpenCV中，图像不会使用常规存储RGB颜色，而不是它们以相反的顺序存储，即以BGR顺序存储.因此，读取图像时的默认颜色代码是BGR. cvtColor()颜色转换函数用于将图像从一种颜色代码转换为另一种颜色代码.

示例

考虑此示例将图像从BGR转换为灰度.

导入 OpenCV 包，如图所示 :

import cv2

现在，要读取特定图像，请使用imread()函数 :

image = cv2.imread('image_flower.jpg')

现在，如果我们看到这个图像使用 imshow()函数，然后我们可以看到这个图像在BGR中.

cv2.imshow('BGR_Penguins',image)

penguine

现在，使用 cvtColor()函数将此图像转换为灰度.

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

grey penguine

边缘检测

人们在看到粗略的草图后，可以轻松识别许多物体类型及其姿势.这就是边缘在人类生活以及计算机视觉应用中发挥重要作用的原因. OpenCV提供了非常简单实用的函数，称为 Canny()，用于检测边缘.

示例

以下示例显示明确识别边缘.

导入OpenCV包如图所示 :

import cv2
import numpy as np

现在，要读取特定图像，请使用 imread()函数.

image = cv2.imread('Penguins.jpg')

现在，使用 Canny()函数用于检测已读取图像的边缘.

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))

现在，为了显示带边的图像，请使用imshow()函数.

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))

这个Python程序将创建一个ima ge名为 edges_penguins.jpg ，边缘检测.

edge penguins

人脸检测

人脸检测是计算机视觉的一个迷人应用，它使其更加逼真，也具有未来感. OpenCV具有执行面部检测的内置工具.我们将使用 Haar 级联分类器进行人脸检测.

Haar Cascade Data

我们需要使用数据哈尔级联分类器.您可以在我们的OpenCV包中找到这些数据.安装OpenCv后，您可以看到文件夹名称 haarcascades .不同的应用程序会有.xml文件.现在，复制所有这些用于不同用途，然后粘贴到当前项目下的新文件夹中.

示例

以下是使用Haar Cascade检测Amitabh Bachan面部的Python代码，如下图所示;<

ab face

导入 OpenCV 包，如下所示 :

import cv2
import numpy as np

现在，使用 HaarCascadeClassifier 检测face :

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

现在，要读取特定图像，请使用 imread()函数 :

img = cv2.imread('AB.jpg')

现在，转换它进入灰度，因为它会接受灰色图像 :

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在，使用 face_detection.detectMultiScale ，执行实际面部检测

faces = face_detection.detectMultiScale(gray, 1.3, 5)

现在，在整个脸部周围画一个矩形 :

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

这个Python程序将创建一个名为 Face_AB.jpg 的图像，如图所示

Face AB

眼睛检测

眼睛检测是计算机视觉的另一个迷人应用，它使其更具现实性和未来感. OpenCV有一个内置的工具来执行眼睛检测.我们将使用 Haar cascade 分类器进行眼睛检测.

示例

以下示例给出了Python代码使用Haar Cascade检测Amitabh Bachan的脸部，如下图所示;<

Haar AB Face

导入OpenCV包，如图所示 :

import cv2
import numpy as np

现在，使用 HaarCascadeClassifier 检测面部和负面;

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

现在，要读取特定图像，请使用 imread()功能

img = cv2.imread('AB_Eye.jpg')

现在，将其转换为灰度，因为它会接受灰色图像 :

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在借助 eye_cascade.detectMultiScale ，执行实际面部检测

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)