定义计算机视觉的可解释性是一项挑战:解释像图像这样的高维输入的分类意味着什么?正如下面讨论的,两种流行的定义都涉及到显著图和决策树,但是这两种定义都有缺点。
在计算机视觉领域中并没有对视觉目标跟踪(简称跟踪,下同)的唯一定义。通常来说,跟踪的目标是视频帧或图像中的某个区域或物体,不需要其语义信息(类别等),此概念被形象地描述为“万物跟踪”。同时,也存在一些特例,通常被应用在一些特定场景中对已知类型物体的跟踪,例如工厂流水线监控中对某些特定产品的跟踪(如零部件等)。
计算机视觉技术(也被称为机器视觉)允许机器以视觉方式解释周围的世界。作为人工智能的一种形式,计算机视觉的本质上是关于数据的分析和学习,只不过需要处理的数据都是视觉数据——而不是文本或者数据。通常来说,视觉数据都是以照片或者视频的形式存在,但是也可能包含来自热像仪和红外热像仪的数据。
关注时代Java