La inteligencia llega a los mapas de Google con las API Vision
La Inteligencia Artificial aplicada al reconocimiento de imágenes nos abre muchas más posibilidades para monetizar la información gráfica. Google ya se ha puesto a ello con Google Maps gracias a las API Vision. ¿Quieres ver lo que están haciendo?
Todos sabemos que Google lleva tiempo paseando por nuestras calles para sacar fotos que alimentan su servicio de Street View. Esa funcionalidad que desde Google Maps nos permite situarnos con visión panorámica con imágenes de 360 grados en un número de calles cada vez mayor, con la simple acción de desplazar su muñequito amarillo (conocido como Pegman).
Resulta de gran ayuda no sólo para colocarnos virtualmente en cualquier ubicación que nos interese, sino para localizar grandes y pequeños negocios o puntos concretos cuya dirección exacta desconocemos, pero sobre cuyo emplazamiento tenemos una vaga idea. Por lo tanto, tiene un enorme interés para sectores como el turístico, el inmobiliario o el educativo, si bien su aprovechamiento se extiende prácticamente a cualquier ámbito.
Miles de kilómetros de información gráfica… por el momento
Es un proyecto que arrancó hace ya 10 años comenzando por tan solo cinco ciudades estadounidenses, al que se incorporaron fotos de las principales ciudades españolas en octubre de 2008 y con el que han recorrido miles y miles de kilómetros desde entonces. En este momento Street View comprende más de 85 países.
En todo este tiempo se han sucedido varias generaciones de cámaras, siendo las primeras de menor resolución que las actuales, de tal manera que están repasando con las nuevas cámaras sus recorridos, como veremos más adelante, no sólo para mejorar la resolución de las imágenes obtenidas.
Para la toma de fotografías (situadas sobre coches, motos y hasta triciclos) se tiene en cuenta el clima, el horario y la temperatura. Disponen además de sistemas de medición LIDAR (Laser Imaging Detection and Ranging) con los que se miden distancias utilizadas para reconocimiento del entorno.
Pero de un tiempo a esta parte se está ampliando el análisis de los miles de millones de fotografías obtenidas, aplicando técnicas de Inteligencia Artificial para reconocimiento de imágenes.
La combinación de la Inteligencia Artificial con el Big Data
¿Para qué se puede aplicar la IA exactamente? Pues para identificar nombres de negocios en rótulos (diferenciando éstos de posibles logotipos de marcas a las que representen) e incluso en pequeñas placas de los portales, registrar los horarios comerciales (normalmente visibles a la entrada) … Y por supuesto, verificar los rótulos de las calles, y los números de los edificios y portales. Cualquier información práctica que incremente el valor de la información registrada. No nos sorprendería que en un futuro próximo se pudiera deducir a qué se dedica un determinado negocio analizando no sólo los logotipos de las marcas en su fachada, sino incluso por los artículos que tiene expuestos en su escaparate.
Hasta ahora venimos accediendo a Google Maps o Street View preguntando por direcciones concretas. Pero… ¿Qué nos parecería preguntar por un restaurante japonés que estando abierto en este momento me pudiera servir la comida a domicilio? ¿O cómo se llama esa tienda con la fachada de color verde que hace arreglos de ropa? La idea consiste en poderle preguntar a nuestro asistente personal virtual de una forma más conversacional y humana, y que éste tenga la información suficiente para poder respondernos con precisión.
Se abre sin duda un mundo de posibilidades apasionante. Las nuevas API Vision de Google Maps son capaces de clasificar rápidamente imágenes en miles de categorías, detectar objetos y caras individuales dentro de las imágenes, además de buscar y leer palabras impresas en ellas. Puedes probarlas arrastrando simplemente una foto dentro de la página que te referenciamos.
Si te interesa lo que las API de Google para el análisis de imágenes pueden aportar a tu negocio, contacta con nosotros. ¿Te animas?