技术门户
技术门户
机器视觉简介
什么是机器视觉?
机器视觉可以定义为硬件和软件技术的集合,这些技术为机器配备图像采集功能并允许它们自动进行决策。 简单来说,机器视觉是指用照明、镜头、相机和计算机来代替人的视觉和智能。
人类视觉擅长定性分析场景,而机器视觉则擅长定量分析。 捕捉和量化场景的能力使机器视觉成为人类视觉的合适替代品,适用于以下应用:
- 小细节检测
- 非身体接触
- 更好的安全性
- 更高的生产力
- 提高准确性
- 重复性任务的自动化
- 在危险环境中操作
与智能手机相机和傻瓜相机等消费类应用中部署的视觉系统相比,机器视觉系统具有以下优点:
- 超高速 (FPS)
- 组件可配置
- API可编程
- 极其坚固
- 机械可靠
- 在极端温度下稳定
在过去的十年中,机器视觉系统不仅在功能和复杂性方面,而且在制造和非制造应用中的更广泛采用方面都出现了爆炸式增长。 根据全球技术市场咨询公司 ABI Research 的数据,到 16.9 年,机器视觉系统的总出货量将达到 2025 万,在工业制造中创造 94 万个机器视觉系统的安装基础。
在学术界,机器视觉也被称为以工业自动化为重点的工程学科。
机器视觉系统的构建模块
利用机器视觉技术的系统主要由四个主要模块组成:
- 图像采集——机器视觉的核心在于视觉感知场景并将其转换为数字格式的能力。 图像传感器与镜头结合可以捕获光,将光子转换为电子并输出数字图像。 这种将场景转换为数字图像的过程通常称为图像采集。 图像传感器和辅助电子设备通常安装在我们称为相机的保护壳内。
- 数据传输——一旦图像被传感器获取并以数字格式(称为“像素格式”)打包,它就会被传输到外部计算设备进行进一步处理。 以下是机器视觉行业为数据传输制定的一些标准的列表:
-
- Camera Link
- CoaXpress公司
- Gige Vision
- USB3 视觉
- MIPI
- IIDC2
- 信息提取——在计算设备从传感器接收到原始图像后,对其进行预处理和分析以获取以下特征:
-
- 边缘检测
- 模式匹配
- 分类
- 用户分类
- 多维数据监测
- 零件计数
- 物体识别和定位
- 字符识别
- 条码读取
- 决策制定——使用提取的信息,通常使用 AI/ML/DL 训练的算法* 将执行决策并将控制输出发送到机器。
机器视觉与计算机视觉
在讨论图像时经常使用“机器视觉”和“计算机视觉”术语,因此了解它们背后的含义并消除任何误解非常重要。
机器视觉 | 计算机视觉 |
---|---|
“机器视觉”一词主要用于工业自动化领域 | “计算机视觉”一词主要用于深度学习/人工智能的背景下 |
机器视觉主要与图像的预处理和基于规则的特征提取有关 | 计算机视觉主要与图像的后处理和基于学习的特征提取有关 |
机器视觉总是涉及用于捕获图像和数据传输的相机系统 | 可能涉及也可能不涉及摄像系统 |
机器视觉可能涉及也可能不涉及 GPU 处理和云计算 | 大型计算机视觉模型通常需要 GPU 处理和云计算 |
机器视觉的目标是使机器能够通过视觉感知周围环境来自动做出决策 | 计算机视觉的目标是通过从一组图像中学习特征来训练人工智能模型,然后做出预测 |