Reconocimiento de rostros,de letras en imágenes, personas famosas, edades de las personas
En este interesante artículo vamos a ver un proyecto que está haciendo Microsoft que está en prueba que permite reconocer objetos de fotografía. Si eres programador, el enlace muestra la API y código. Si no eres programador, puedes usar el enlace para hacer reconocimiento de texto, imágenes de forma gratuita.
El sistema tiene diferentes secciones como ser:
- Reconocimiento de imágenes (describir una foto, detectar edad, sexo)
- Reconocimiento de texto digital (reconocer text impreso de una foto)
- Recococimiento de texto escrito a mano (reconocer texto escrito a mano de una foto)
- Reconocimiento de famosos (reconocer nombre y apellido de personas famosos de una foto)
- Otros (reconocimiento de escenas en video, imagenes en miniatura)
Usted puede acceder al programa en el siguiente enlace:
https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/
Reconocimiento de imágenes (describir una foto, detectar edad, sexo)
Por ejemplo, la siguiente imagen tiene pan y trigo:
El programa al analizar la imagen detecta lo siguiente:
El sistema describe la foto y encuentra los siguientes elementos table (mesa), food (comida), indoor (interior), sitting (sentado), top (arriba), doughnut (donuts), small (pequeño), plate (plato), donut, wooden (de madera), white (blanco), sandwich.
En vez de pan, el sistema inteligente detecta donuts, por los colores le parece ver madera y cree ver algunos platos. Creer que es un sandwich es incorrecto, pero un error aceptable considerando que hay pan. La presencia de madera la asume por el color y ver comida.
Si ponemos una foto, al mover el cursos sobre los rostros, el sistema trata de detectar el sexo (gender) y la edad (AGE)
Por ejemplo si ponemos el cursor sobre la mujer, detecta la edad de 60 años y sexo femenino.
En la sección de faces muestra las edades y el sexo:
Voy a mandar mi foto al sistema para ver que dice:
Dice person (persona), man (hombre), indoor (interior), shirt(camisa), camera (cámara), holding (agarrando), looking (mirando), glasses (lentes), wearing (vistiendo), posing (posando).
En descripción dice: Un hombre mirando a la cámara.
Que dice si agarro un lapicero:
La descripción dice un hombre agarrando un cepillo de dientes. Se da cuenta el sistema que hay una mano, pero por la forma en que agarra el lapicero, piensa que es un cepillo de dientes:
Reconocimiento de texto
Le tomé la foto a un folder de capacitación y el sistema pudo leer el texto de la foto y convertirlo en texto a pesar de que estaba en español:
El sistema tiene algunos errores. Por ejemplo en la palabra OURSELVES, no detecta bien la E:
Como puede ver hay algunos errores al reconocer el texto:
Otro ejemplo interesante es el reconocimiento de letra escrita a mano. Primeramente le mandé una foto de mi letra a mano en español:
Prácticamente no reconoció nada. Decidí tratar de que reconozca texto en inglés escrito a mano:
El siguiente ejemplo muestra una tarjeta inclinada. No tiene muchos errores, pero requiere una revisión a mano:
Otro característica importante es la opción de poder reconocer a personas famosas. Por ejemplo puede reconocer al CEO de Microsoft Satya Nadella:
Si le pasamos la foto de Donald Trump, lo reconoce?
Si, a ver un personaje de Bolivia:
Evo Morales, reconocido. Ahora un cantante famoso que vivió en la Argentina y antiguo que convirtió al Tango en casi el himno de Argentina:
Carlos Gardel. Reconocido por el sistema. Hasta ahora muy bien. ¿Será que puede distinguir un blogger famoso de Bolivia?
No, no me reconoce. Mmmm...no es tan bueno. Pero bueno, está aprendiendo.
También se puede hacer reconocimiento de imágenes de video. Cada escena puede llegar a ser descrita con letras:
La otra opción es la de thumbnails que permite a partir de una imagen crear imágenes en diferentes tamaños y orientación:
Comentarios
Publicar un comentario