Infraestructura

Physical AI tiene el problema de datos que los LLMs no tuvieron

Odyssey capta $1,45B para world models mientras el dato real lo juntan humanos en galpones.

Cuando los investigadores de deep learning construyeron los primeros grandes modelos de lenguaje, tenían una ventaja inédita: décadas de escritura humana disponible en internet de forma gratuita. No tuvieron que contratar a nadie para recopilar el dato; el dato ya estaba ahí, en cantidad suficiente para entrenar modelos a escala. La infraestructura costó miles de millones, pero la materia prima era prácticamente gratis. Physical AI no tiene ese privilegio, y esa asimetría define el próximo capítulo de la industria.

El dato físico no crece solo

Los sistemas de IA que operan en el mundo real —robots, vehículos autónomos, satélites con percepción propia— necesitan un tipo de dato que no existe en internet: secuencias de movimiento, retroalimentación háptica, imágenes de alta resolución en condiciones variables, y la corrección humana de cada error. Recolectar esos datos es trabajo sucio y poco glamoroso, y algunos laboratorios ya están pagando a empresas especializadas para hacerlo en condiciones que los press releases nunca mencionan.

El proceso es intensivo en trabajo humano: operadores teleoperan robots o los acompañan en entornos reales, repiten tareas cientos de veces para generar variaciones, y etiquetan cada secuencia con metadatos de alta granularidad. No hay scraping posible; no hay crawler que resuelva esto. La recolección de datos para physical AI se parece más a trabajo de manufactura repetitivo que al trabajo de ingeniería que se imagina cuando se habla de inteligencia artificial.

Los world models y el problema de escala

Mientras el dato físico se recolecta con dificultad, el capital fluye hacia las empresas que prometen sintetizarlo. Odyssey acaba de alcanzar una valuación de $1,45 mil millones respaldada por Amazon y otros inversores de peso, posicionándose como referente en world models, la siguiente generación de IA más allá de los LLMs. La apuesta de Amazon en Odyssey es coherente con su estrategia más amplia de infraestructura de IA: diversificar las apuestas antes de que el mercado decida quién gana la capa de modelos.

Los world models aprenden representaciones del mundo físico que les permiten predecir cómo reaccionan los entornos a las acciones. En teoría, con suficiente dato de entrenamiento, un world model puede permitirle a un robot generalizar a situaciones que nunca vio de forma directa. El problema es ese «suficiente dato»: sin recolección masiva de experiencia física, el world model no tiene sustrato real del que aprender. La valuación de $1,45B de Odyssey es una apuesta a que ese problema se puede resolver; los trabajadores que recolectan datos en condiciones poco glamorosas son la cadena de suministro invisible detrás de esa apuesta.

Un satélite que aprende solo: el horizonte posible

Un caso reciente ilustra hasta dónde puede llegar la IA física cuando el dato y el modelo se alinean correctamente. En abril, un satélite de observación terrestre encontró lo que buscaba de forma autónoma por primera vez en la historia: procesó imágenes a bordo, identificó el objetivo y tomó decisiones sin necesidad de instrucciones en tiempo real desde tierra.

El salto es conceptualmente importante. Un satélite con agencia propia cambia los costos operativos de la observación remota, abre la puerta a constelaciones con mayor autonomía, y demuestra que los modelos de percepción pueden desplegarse en entornos donde la latencia de comunicación hace imposible el control humano constante. Pero llegó ahí con años de datos de entrenamiento especializados, costosamente recopilados y etiquetados por humanos que raramente aparecen en los comunicados de prensa del lanzamiento. Vale notar que la escasez de compute en el mercado no es el único cuello de botella en la carrera por la IA física: el dato es igual de escaso y mucho menos sustituible.

Lo que esto implica para quienes apuestan a automatización física

Para los decision-makers que están evaluando inversiones en automatización física, robótica o sistemas autónomos, el cuello de botella no va a ser el modelo sino el dato. La pregunta que conviene hacerse antes de comprometerse con un proveedor es: ¿de dónde viene el dato de entrenamiento, quién lo recopiló, en qué condiciones, con qué escala, y qué pasa cuando el entorno de despliegue difiere del entorno de entrenamiento?

Los próximos meses van a ser reveladores: si Odyssey y sus competidores publican metodologías de recolección de datos o las mantienen como caja negra, si aparecen regulaciones laborales específicas para los trabajadores de recolección de datos físicos, y si el mercado empieza a diferenciar entre proveedores que trabajan con dato real versus dato sintético generado. La pregunta del dato va a ser tan central en physical AI como la pregunta del compute lo fue en LLMs, y llegará antes de lo esperado.

Fuentes citadas (3)