AI与Python - 计算机视觉

计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉.在本章中,您将详细了解这一点.

计算机视觉

计算机视觉是一门研究如何重建,打断和理解的学科根据场景中存在的结构的属性,来自其2D图像的3d场景.

计算机视觉层次结构

计算机视觉是分开的分为以下三个基本类别;

  • 低级别愿景 : 它包括用于特征提取的过程图像.

  • 中级视觉 : 它包括对象识别和3D场景解释

  • 高级视觉 : 它包括活动,意图和行为等场景的概念性描述.

计算机视觉与图像处理

图像处理研究图像到图像的变换.图像处理的输入和输出都是图像.

计算机视觉是从图像中构建明确,有意义的物理对象描述.计算机视觉的输出是对3D场景中结构的描述或解释.

应用程序

计算机视觉在以下领域中找到应用程序 :

机器人

  • 本地化 - 确定机器人位置自动

  • 导航

  • 避障障碍

  • 装配(钉孔,焊接,涂漆)

  • 操纵(例如PUMA机器人操纵器)

  • 人机交互(HRI):智能机器人与人交流

药物

  • 分类和检测(例如病变或细胞分类和肿瘤检测)

  • 2D/3D分割

  • 3D人体器官重建(MRI或超声)

  • 视觉引导机器人手术

安全

  • 生物识别(虹膜,指纹,面部识别)

  • 监视检测某些可疑活动或行为

运输

  • 自动驾驶汽车

  • 安全,例如驾驶员警惕性监控

工业自动化应用

  • 工业检查(缺陷检测)

  • 汇编

  • 条形码和包裹标签阅读

  • 对象排序

  • 文档理解(例如OCR)

安装有用的软件包

对于使用Python的计算机视觉,您可以使用名为

pip install opencv_python-X.X-cp36-cp36m-winX.whl


这里X代表你机器上安装的Python版本以及你所拥有的win32或64位.

如果您使用的是 anaconda 环境,请使用以下命令安装OpenCV :

conda install -c conda-forge opencv


读取,写入和显示图像

大多数CV应用程序需要获取图像作为输入并产生图像作为输出.在本节中,您将学习如何借助OpenCV提供的功能读取和写入图像文件.

用于读取,显示,写入图像文件的OpenCV函数

OpenCV为此目的提供以下功能 :

  • imread()function : 这是读取图像的功能. OpenCV imread()支持各种图像格式,如PNG,JPEG,JPG,TIFF等.

  • imshow()函数 : 这是在窗口中显示图像的功能.窗口自动适合图像大小. OpenCV imshow()支持各种图像格式,如PNG,JPEG,JPG,TIFF等.

  • imwrite()函数 : 这是写入图像的功能. OpenCV imwrite()支持各种图像格式,如PNG,JPEG,JPG,TIFF等.

示例

此示例显示了以一种格式读取图像的Python代码 : 在窗口中显示它并以其他格式写入相同的图像.考虑下面显示的步骤 :

如图所示导入OpenCV包 :

import cv2


现在,要读取特定图像,请使用imread()函数 :

image = cv2.imread('image_flower.jpg')


要显示图像,请使用 imshow()功能.您可以在其中看到图像的窗口名称为 image_flower .

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

image flower

现在,我们可以将相同的图像写入另一种格式,例如.png使用imwrite()函数 :

cv2.imwrite('image_flower.png',image)


输出True表示图像已成功写为.png文件也在同一个文件夹中.

True


注意和减去;函数destroyallWindows()只是破坏我们创建的所有窗口.

颜色空间转换

在OpenCV中,图像不会使用常规存储RGB颜色,而不是它们以相反的顺序存储,即以BGR顺序存储.因此,读取图像时的默认颜色代码是BGR. cvtColor()颜色转换函数用于将图像从一种颜色代码转换为另一种颜色代码.

示例

考虑此示例将图像从BGR转换为灰度.

导入 OpenCV 包,如图所示 :

import cv2


现在,要读取特定图像,请使用imread()函数 :

image = cv2.imread('image_flower.jpg')


现在,如果我们看到这个图像使用 imshow()函数,然后我们可以看到这个图像在BGR中.

cv2.imshow('BGR_Penguins',image)

penguine

现在,使用 cvtColor()函数将此图像转换为灰度.

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

grey penguine

边缘检测

人们在看到粗略的草图后,可以轻松识别许多物体类型及其姿势.这就是边缘在人类生活以及计算机视觉应用中发挥重要作用的原因. OpenCV提供了非常简单实用的函数,称为 Canny(),用于检测边缘.

示例

以下示例显示明确识别边缘.

导入OpenCV包如图所示 :

import cv2
import numpy as np


现在,要读取特定图像,请使用 imread()函数.

image = cv2.imread('Penguins.jpg')


现在,使用 Canny()函数用于检测已读取图像的边缘.

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))


现在,为了显示带边的图像,请使用imshow()函数.

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))


这个Python程序将创建一个ima ge名为 edges_penguins.jpg ,边缘检测.

edge penguins

人脸检测

人脸检测是计算机视觉的一个迷人应用,它使其更加逼真,也具有未来感. OpenCV具有执行面部检测的内置工具.我们将使用 Haar 级联分类器进行人脸检测.

Haar Cascade Data

我们需要使用数据哈尔级联分类器.您可以在我们的OpenCV包中找到这些数据.安装OpenCv后,您可以看到文件夹名称 haarcascades .不同的应用程序会有.xml文件.现在,复制所有这些用于不同用途,然后粘贴到当前项目下的新文件夹中.

示例

以下是使用Haar Cascade检测Amitabh Bachan面部的Python代码,如下图所示;<

ab face

导入 OpenCV 包,如下所示 :

import cv2
import numpy as np


现在,使用 HaarCascadeClassifier 检测face :

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')


现在,要读取特定图像,请使用 imread()函数 :

img = cv2.imread('AB.jpg')


现在,转换它进入灰度,因为它会接受灰色图像 :

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)


现在,使用 face_detection.detectMultiScale ,执行实际面部检测

faces = face_detection.detectMultiScale(gray, 1.3, 5)


现在,在整个脸部周围画一个矩形 :

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)


这个Python程序将创建一个名为 Face_AB.jpg 的图像,如图所示

Face AB

眼睛检测

眼睛检测是计算机视觉的另一个迷人应用,它使其更具现实性和未来感. OpenCV有一个内置的工具来执行眼睛检测.我们将使用 Haar cascade 分类器进行眼睛检测.

示例

以下示例给出了Python代码使用Haar Cascade检测Amitabh Bachan的脸部,如下图所示;<

Haar AB Face

导入OpenCV包,如图所示 :

import cv2
import numpy as np


现在,使用 HaarCascadeClassifier 检测面部和负面;

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')


现在,要读取特定图像,请使用 imread()功能

img = cv2.imread('AB_Eye.jpg')


现在,将其转换为灰度,因为它会接受灰色图像 :

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)


现在借助 eye_cascade.detectMultiScale ,执行实际面部检测

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)


现在,在整个脸部周围画一个矩形 :

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)


这个Python程序将创建一个名为的图像Eye_AB.jpg 眼睛检测如下所示;

Eye AB