Logo de Huffpost

El nuevo modelo de ChatGPT puede localizar con precisión dónde se tomó una fotografía

La Inteligencia Artificial de OpenAI ha incorporado nuevas capacidades avanzadas de interpretación visual que permiten geolocalizar el origen de una imagen.


ChatGPT movil
ChatGPT |IA
Fernando García Ferrer
Fecha de actualización:

OpenAI ha mejorado las capacidades de su Inteligencia Artificial, permitiendo que su modelo ChatGPT identifique con bastante precisión el lugar donde se tomó una fotografía. Esta funcionalidad, presente en las versiones más recientes de sus modelos visuales, conocidos como ‘o3’ y ‘o4-mini’, combina análisis de imagen, razonamiento avanzado y acceso web para deducir direcciones concretas a partir de una simple fotografía.

Los modelos más recientes desarrollados por OpenAI introducen dos capacidades clave: un comportamiento autónomo similar a la de un asistente inteligente, y la habilidad de interpretar imágenes, integrando la información visual en su proceso de análisis y toma de decisiones. Esta última permite que el sistema razone con imágenes, es decir, que analice elementos visuales y los integre en su proceso lógico.

En la práctica, esto se traduce en una capacidad que hasta ahora no se había implementado en este tipo de herramientas: identificar el punto exacto en el que se sacó una fotografía. Para ello, el modelo analiza detalles como señales, rótulos, paisajes o estructuras reconocibles, y los contrasta con información disponible en la red.

"Los resultados pueden ser realmente sorprendentes"

El académico Ethan Mollick, experto en inteligencia artificial, compartió en la red social X un ejemplo práctico del funcionamiento de esta nueva herramienta. En su experimento, eliminó cualquier metadato de localización de una fotografía y solicitó al modelo que intentara deducir el lugar donde fue tomada. Según Mollick, el resultado fue increíble, ya que el sistema fue capaz de indicar una dirección concreta y mostrar la ubicación sobre un mapa.

Mollick describió este proceso como una muestra del “poder geoadivinador” del modelo o3, destacando su habilidad para ampliar partes de la imagen, leer textos visibles y utilizar motores de búsqueda externos. "Los resultados pueden ser realmente sorprendentes", afirmó.

Otras noticias interesantes

Lo más leído