Visión en sistemas

Al igual que sucede en el ser humano, la capacidad de visión proporciona un sofisticado mecanismo de percepción que permite a la máquina responder a su entorno de una manera inteligente y flexible. El uso de la visión y otros esquemas de percepción, están motivados por la constante necesidad de aumentar la flexibilidad y los campos de aplicación de los sistemas de robótica.

La visión artificial puede ser definida como los procesos de obtención, caracterización e interpretación de información de imágenes tomadas de un mundo tridimensional. Estos procesos, también habitualmente llamados visión por computadora, pueden a su vez ser subdivididos en seis áreas principales: 1) captación, 2) preprocesamiento, 3) segmentación, 4) descripción, 5) reconocimiento, 6) interpretación. La captación es el proceso a través del cual se obtiene una imagen visual. El preprocesamiento incluye técnicas tales como la reducción de ruido y realce de detalles. La segmentación es el proceso que divide una imagen en objetos que sean de nuestro interés. Mediante los procesos de descripción se obtienen características (por ejemplo: tamaño, forma) convenientes para diferenciar un tipo de objeto de otro. El reconocimiento es el proceso que identifica estos objetos (por ejemplo una llave inglesa, un tornillo, un soporte de motor). Finalmente, la interpretación le asocia un significado a un conjunto de objetos reconocidos.

Es conveniente agrupar estas diversas áreas de acuerdo con la complicación y delicadeza que lleva aparejada su implementación. Se consideran tres niveles de procesamiento: visión de bajo, medio y alto nivel. Debido a que no existen unas fronteras entre estos tres niveles, se utiliza un marco de trabajo útil para categorizar los diversos procesamientos que componen un sistema de visión artificial. Así se asocia a la visión de bajo nivel aquellos procesos que son primarios en el sentido de que pueden ser considerados «reacciones automáticas» sin requerir ningún tipo de inteligencia. Con este enfoque se trata como visión de bajo nivel a la percepción y el preprocesamiento.

Asociaremos a la visión de nivel intermedio aquellos procesos que extraen, caracterizan y etiquetan componentes de la imagen que se obtiene de la visión de bajo nivel. En estos términos, la segmentación, la descripción y el reconocimiento de objetos individuales pertenecen a la visión de nivel intermedio. La visión de alto nivel se refiere a procesamientos que tratan de emular la cognición. Mientras que los algoritmos de bajo y medio nivel conllevan un espectro de actividades bastante bien definidas, nuestro conocimiento ycomprensión de los procesos de visión de alto nivel son considerablemente más difusos y especulativos, estas limitaciones dan lugar a la formulación de limitaciones e idealizaciones que tienen como objeto reducir la complejidad de esta tarea.