Ciencia y Tecnología

Computadora aprende a predecir cuándo un ser humano va a abrazar a otro

29 Jul 2016 – 04:16 PM EDT

Actualmente hay sistemas de aprendizaje automático tan avanzados que son capaces de detectar objetos en una escena aunque presenten dificultades para identificar que se encuentran ellos haciendo en ese momento.

Publicidad

Esto podría cambiar gracias a los pasos que están dando los investigadores de CSAIL de MIT en esa dirección pues acaban de desarrollar un algoritmo de aprendizaje automático capaz de predecir cuando dos personas se van a abrazar, estrechan manos, se besan o hacen el tradicional saludo de High Five.

Funcionamiento general

Para poder obtener un nivel de acierto óptimo se emplearon varias redes neuronales que predicen la representación visual de las personas en escena llegando luego a un consenso luego de que las predicciones se fusionen. Si la mayoría de las redes neuronales identifican, por ejemplo, un abrazo, entonces se toma como decisión final.

El algoritmo ha sido entrenado con más de 600 horas de videos de YouTube y utilizando para las pruebas series como Desperate Hopusewives, Scrubs, The Big Bang Theory y The Office para poder anticipar las interacciones humanas. Sobre esto comentó el estudiante de doctorado Carl Vondrick, quien es el primer autor del artículo presentado en la International Conference on Computer Vision and Pattern Recognition.

Publicidad

Según sus palabras, los seres humanos aprenden a anticipar este tipo de interacciones a través de la experiencia por lo trataron de imbuirle a una computadora lo mismo, viendo grandes cantidades de videos un terminal es capaz de ganar experiencia prediciendo estos comportamientos.

El algoritmo creado predice con éxito una de cuatro interacciones, más del 43% de las representaciones visuales puestas a prueba (los humanos aciertan un 71%) lo que supera considerablemente a algoritmos similares que estudiaban los píxeles individuales de una imagen para obtener un futuro fotorrealista y resultaron ser imprácticos en aplicaciones a gran escala.

Ventajas

Si el algoritmo es refinado, la técnica podría tener fuertes implicaciones en el campo de la robótica y la inteligencia artificial (IA). Los robots podrían ser capaces de responder a las interacciones de un ser humano, algo así como un robot educado, incluso actuar adecuadamente para atrapar a alguien que se va a caer.

Publicidad

Por otra parte, las cámaras de seguridad podrían responder ante acciones que ven y enviar una alerta a servicios médicos cuando alguien sufre un accidente o en cualquier escenario en donde se involucren entornos humanos.

Los investigadores también están pensando en usar el invento como parte de un receptor para la cabeza que pueda sugerir acciones basadas en un contexto y de esta forma nunca perderás la oportunidad de dar un abrazo o un High Five.

Publicidad