用于对象检测的五种流行的计算机视觉注释工具

时间：2023-11-29 本站点击：1

计算机视觉是人工智能的一个子集，专注于教机器如何正确解释来自图片、视频帧和其他来源的数据。我们通常需要使用带注释的数据来监控深度学习模型，以利用当代计算机视觉技术。为了使用对象检测和识别等计算机视觉技术，需要使用这些对象的特定图像实例训练 ML 模型并标记它们。

以下是五种常用的计算机视觉注释工具，用于对训练数据集进行对象识别和标记。

LabelImg

LabelImg 是一个开源的用于图像处理和标注的标注工具。它是用 Python 开发的，并有一个用 Qt 构建的图形用户界面。这是一种快速且免费的标记图像的方法。使用此标记工具完成的注释以 PASCAL VOC XML 格式保存。

Computer Vision Annotation Tool (CVAT)

Computer Vision Annotation Tool (CVAT) 是由 Intel 创建的免费图像标记程序。它也是开源的，使用 CSS、Python、Django、TypeScript 和 React 等编程语言编写。CVAT 有助于监督学习任务，如对象检测、图像分割和分类等。 CVAT 提供强大的功能，可以利用深度学习模型进行半自动注释。

视觉对象标记工具（VOTT）

微软团队创建了一个视觉对象标记工具（VOTT）来使用计算机视觉识别和注释视频和图像，并使用 TypeScript 进行编程。如果你的数据存储在 Azure Blob 存储中或者你正在使用 Bing 图像搜索，你可以直接通过他们的网站使用 VOTT。使用每个版本的安装包是本地安装 VoTT 的最便捷方式。适用于 Mac OSX 的 VoTT、适用于 Linux 的 VoTT 和适用于 Windows 的 VoTT 均作为安装包提供。

Labelme

Labelme是麻省理工学院计算机科学与人工智能实验室于2012年开发的开源标注库，它有助于使用圆形、矩形、三角形、点、线和线条对图像进行标注。Labelme 是使用 Python 编写的，对于图形界面，它使用 Qt。使用 Labelme 可以轻松完成语义分割、边界框和图像分类。

RectLabel

RectLabel 是一个图像标注工具，用于标注图片以识别和分割边界框对象。此图像注释工具可自动与一些核心 ML 模型配合使用，无需任何其他实现。Rectlabel 支持 PASCAL VOC XML 格式。支持使用骨架、多边形、边界框、线、点和三次贝塞尔曲线绘制关键点。您还可以自定义标签对话框，以便它可以与特征一起使用。

RectLabel 可以导出为 YOLO、COCO JSON 和 CSV 格式。这样，用户还可以导出索引掩码图像和分离的掩码图像，同时还可以执行图像调整大小和增强等任务。