ChatGPT revela ubicaciones con solo una imagen

Publicado

por

ChatGPT, con su actualizaciÃ³n mÃ¡s reciente, ha vuelto a recordarnos que lo aparentemente trivial puede ocultar una complejidad asombrosa. Y tambiÃ©n, que nuestros ojos no son los Ãºnicos capaces de leer el mundo. A veces una imagen, que a nosotros nos parece inofensiva, puede contener tantas pistas que, bien interpretadas, revelan no solo quÃ© estamos viendo, sino dÃ³nde estÃ¡bamos cuando lo vimos. Eso es exactamente lo que estÃ¡ comenzando a hacer ChatGPT, y la forma en que lo estÃ¡ logrando merece un anÃ¡lisis pausado.

La clave estÃ¡ en o3, el modelo mÃ¡s avanzado de OpenAI integrado en ChatGPT hasta la fecha. Se trata de un sistema multimodal, no limitado al lenguaje, sino capaz de integrar texto, imÃ¡genes y herramientas externas en un proceso de razonamiento unificado. Su fortaleza no reside solo en describir lo que ve, sino en deducir, inferir y razonar a partir de eso. En los Ãºltimos dÃas, esta capacidad se ha puesto a prueba a travÃ©s de un fenÃ³meno que ha explotado en redes: el geoguessing con IA.

La mecÃ¡nica es sencilla: los usuarios suben a ChatGPT imÃ¡genes sin metadatos, y el modelo intenta averiguar dÃ³nde se han tomado. Y lo que inicialmente parecÃa una prueba anecdÃ³tica ha terminado mostrando resultados que rozan lo inquietante. ChatGPT ha conseguido identificar paÃses, ciudades e incluso lugares concretos basÃ¡ndose en detalles como el tipo de pavimento, el diseÃ±o de una farola, la tipografÃa de un cartel o la vegetaciÃ³n circundante. Sin ayuda de coordenadas ni de datos ocultos, solo con razonamiento visual.

Esto es posible gracias a la arquitectura de o3, optimizada para el anÃ¡lisis profundo de imÃ¡genes. No se limita a interpretar la escena, sino que la procesa en capas: puede aislar elementos, hacer âzoom mentalâ, rotar, y comparar lo que ve con lo que sabe sobre culturas, arquitecturas o sistemas de seÃ±alizaciÃ³n. Es lo que OpenAI ha definido como pensar con imÃ¡genes, una aproximaciÃ³n que difumina la frontera entre percepciÃ³n y cogniciÃ³n en los modelos artificiales.

Por supuesto, esto plantea preguntas importantes sobre privacidad y uso responsable. Si una foto, por inocente que parezca, puede ser usada por una IA para identificar su ubicaciÃ³n, Â¿dÃ³nde trazamos el lÃmite entre capacidad tÃ©cnica y exposiciÃ³n no deseada? OpenAI asegura haber implementado medidas para limitar usos sensibles, como rechazar solicitudes relacionadas con ubicaciones privadas, pero como en tantas otras Ã¡reas de la inteligencia artificial, la cuestiÃ³n no es solo tÃ©cnica, sino Ã©tica.

Y mientras tanto, en paralelo, OpenAI tambiÃ©n ha presentado o4-mini y lo ha sumado a ChatGPT. Se trata de una evoluciÃ³n mÃ¡s ligera y eficiente que comparte muchas de las capacidades de razonamiento de o3. El ritmo es vertiginoso. La inteligencia artificial no solo estÃ¡ aprendiendo a ver, sino a entender. Y con ello, a revelarnos cuÃ¡nta informaciÃ³n hemos estado dejando a la vista sin darnos cuenta.

MÃ¡s informaciÃ³n

Meta bloquea Apple Intelligence en sus apps

WhatsApp ya prueba traducciÃ³n automÃ¡tica de mensajes

Si me dieran una cana por cada contenido que he escrito relacionado con la tecnologÃa… pues sÃ, tendrÃa las canas que tengo.

Por lo demÃ¡s, mÃºsica, fotografÃa, cafÃ©, un eReader a reventar y una isla desierta. Â¿Te vienes?

Meta bloquea Apple Intelligence en sus apps

Gemini Live llega a todos los usuarios de Android

Wikipedia abre sus puertas a la IA… y frena a los bots

OpenAI trabaja en una red social con IA

Amuse 3.0: AMD y TensorStack amplÃan la IA generativa local

Windows 11 va lento: cÃ³mo resolverlo y cÃ³mo mejorar el rendimiento

GEEKOM Mini Air12 en oferta, un mini PC muy econÃ³mico con un descuento del 40%

GeForce RTX 5060 Ti y GeForce RTX 5060, especificaciones finales, rendimiento y precio