A inteligência chega aos mapas da Google com API Vision
A Inteligência Artificial aplicada ao reconhecimento de imagens abre muitas mais possibilidades de monetização da informação gráfica. Google Maps já está incorporando isto por meio do API Vision. Você quer ver o que estão fazendo?
Todos sabemos que Google leva tempo passeando por nossas ruas para tirar fotos que alimentam seu serviço de Street View. Esta funcionalidade que, desde Google Maps, nos permite situar-nos com visão panorâmica com imagens de 360 graus em um número de ruas cada vez maior, com a simples ação de mover seu bonequinho amarelo (conhecido como Pegman).
É uma grande ajuda não só para nos colocar virtualmente em qualquer localização que nos interessa, mas para localizar grandes e pequenos negócios ou pontos concretos cuja direção exata desconhecemos ou temos uma vaga idéia da localização. Portanto, tem um enorme interesse para setores como turismo, imobiliário ou educacional, embora seu aproveitamento se estenda praticamente para qualquer área.
Milhares de quilômetros de informação gráfica… por enquanto
É um projeto que começou há 10 anos, iniciando com apenas cinco cidades americanas, no qual incorporaram fotos das principais cidades brasileiras em setembro de 2010 e que já percorreram milhões e milhões de quilômetros desde então. Neste momento Street View compreende mais de 85 países.
Em todo este tempo, houve várias gerações de câmeras, sendo as primeiras de menor resolução que as atuais, de tal maneira que estão repassando suas rotas com as novas câmeras, como veremos mais adiante, não só para melhorar a resolução das imagens obtidas.
Para tirar fotografias (situadas sobre carros, motos e até triciclos) se considera o clima, o horário e a temperatura. Dispoem também de sistemas de medição LIDAR (Laser Imaging Detection and Ranging) com os quais se mede distâncias utilizadas para reconhecimento do ambiente.
Mas há algum tempo está sendo ampliada a análise de bilhões de fotografias obtidas, aplicando técnicas de Inteligência Artificial para reconhecimento de imagens.
A combinação da Inteligência Artificial com o Big Data
Em que, exatamente, se pode aplicar a IA? Para identificar nomes de empresas em rótulos (diferenciando-os de possíveis logotipos de marcas que o representam) e mesmo em pequenas placas dos portais, registrar os horários comerciais (normalmente visíveis na entrada) … E, claro, verificar os rótulos das ruas, e os números dos edifícios e portais. Qualquer informação prática que incremente o valor da informação registrada. Não nos surpreenderia que, num futuro próximo, fosse possível deduzir a que se dedica um determinado negócio, analisando não só os logotipos das marcas em sua fachada, mas também, pelos artigos expostos em sua vitrine.
Até agora, vimos acessando o Google Maps ou Street View perguntando por direções concretas. Mas… O que você gostaria de pedir a um restaurante japonês, que estando aberto neste momento, pudesse servir comida a domicílio? Ou qual o nome desta loja com a fachada de cor verde que faz arranjos de roupa? A idéia consiste em poder perguntar ao nosso assistente pessoal virtual de uma forma mais coloquial e humana, e que este tenha a informação suficiente para poder nos responder com precisão.
Se abre, sem dúvida, um mundo de possibilidades apaixonantes. A nova API Vision do Google é capaz de classificar rapidamente imagens em milhares de categorias, detectar objetos e faces individuais dentro das imagens, além de pesquisar e ler palavras impressas sobre elas. Você pode experimentar simplesmente arrastando uma foto dentro da página que nos referimos.
Se você está interessado no que a API do Google para análises de imagens pode oferecer à sua empresa, entre em contato conosco. Te animas?