Despierta Quisqueya

La nueva Siri AI usa tecnología de Google, pero no es Gemini

Actualizado

En una reunin posterior al discurso inaugural de la WWDC, el vicepresidente senior de ingeniera de software de Apple, Craig Federighi, respondi a una pregunta que muchos usuarios de la compaa y expertos del mundo de la IA llevan hacindose desde enero. Ese mes, Apple y Google confirmaron que trabajaran juntas en el desarrollo de los nuevos modelos fundacionales de Apple. Pero si Apple iba a firmar un acuerdo con Google para mejorar su inteligencia artificial, cunto de Gemini habra realmente dentro de la nueva Siri?

La respuesta ha resultado ser prcticamente nada. Ni la aplicacin de Gemini, ni los modelos que Google vende a sus clientes, ni la infraestructura con la que los despliega, ni siquiera Google como buscador para fundamentar las respuestas que da la nueva Siri.

El acuerdo entre ambas compaas dej la sensacin de que Apple haba claudicado y entregado a un rival el cerebro de sus dispositivos. Pero lo que Federighi y su equipo detallaron en esta sesin tcnica posterior a la presentacin es que Google ha ayudado a construir la tercera generacin de los Apple Foundation Models (AFM), pero el producto que el usuario usar corre sobre la arquitectura cerrada de Apple casi siempre.

CMO EST CONSTRUIDO

El sistema arranca en el propio telfono. Cuando se habla con Siri AI (la "nueva Siri"), un reconocedor de voz en el dispositivo convierte la peticin en texto y la pasa a un "orquestador" que decide qu hacer con ella.

Algunas peticiones se resuelven en el dispositivo gracias a un nuevo modelo fundacional, AFM Core. Algunos de los telfonos y Mac ms avanzados o con ms memoria tienen acceso a un modelo local ms avanzado, AFM Core Advanced, de unos 20.000 millones de parmetros (solo se utilizan entre 1.000 y 4.000 millones en cada consulta). Este modelo ms avanzado es el que permite voces de Siri ms expresivas y un mejor reconocimiento de voz y dictado. Pero los dos, tanto AFM Core como AFM Core Advanced, son capaces de resolver varias peticiones de forma local.

Las peticiones ms complejas viajan a los servidores de Apple. Antes, el sistema puede consultar las acciones que ofrecen las apps, un ndice semntico que rastrea los datos personales del usuario o incluso lo que aparece en ese momento en la pantalla para seleccionar la informacin que viajar al servidor.

Ah est, segn Apple, la diferencia con un chatbot al uso, que normalmente requiere un acceso constante al conjunto de la informacin personal para poder dar respuestas personalizadas. Gemini puede saber muchos detalles sobre sus usuarios, pero es gracias a que en cualquier consulta tiene acceso (si el usuario se lo ha dado) a todos sus documentos de Drive, sus fotos de Google Photos o el correo de Gmail.

Siri AI, en cambio rebusca entre cientos de miles de mensajes, fotos y notas, encuentra lo relevante y al servidor slo sube el puado de datos que hace falta para responder la peticin concreta que ha hecho el usuario. Una vez respondida, esa informacin se borra de los servidores.

En los servidores, bajo control de Apple y con los procesadores M de la compaa para inferencia, viven AFM Cloud, un modelo de trabajo optimizado para coste y latencia y ADM Cloud Image, que es el modelo de imagen que hace posible el reencuadre espacial de fotos o la creacin de imgenes realistas. Estos modelos se ejecutan exactamente igual que hasta ahora hacan los modelos fundacionales de primera y segunda generacin (los presentados en 2024 y 2025) cuando las consultas tenan que salir a lo que Apple denomina una nube privada.

Cuando una pregunta exige adems informacin de actualidad o datos generales, Siri AI no consulta el buscador de Google sino un servicio propio, Apple World Knowledge. La compaa insiste en que la informacin est compartimentalizada durante el proceso. El contexto del usuario se rastrea en local y solo se sube lo imprescindible a los servidores; las preguntas de conocimiento general se resuelven sin enviar quin escribi un mensaje o cundo.

EN LA NUBE DE GOOGLE, PERO SELLADA

Estos cuatro modelos se han entrenado y refinado con la misma tecnologa que Google usa en Gemini, pero son propiedad de Apple y en el caso de AFM Cloud y ADM Cloud Image corren en los servidores de la compaa.

Hay un tercer modelo que se ejecuta en servidores, que es AFM Cloud Pro. Es el ms capaz, reservado a tareas agnticas y de razonamiento complejo. Tiene una capacidad comparable a la de los modelos llamados de "de frontera" de Gemini y es aqu donde Google tiene un papel ms relevante.

AFM Cloud Pro se ejecuta sobre GPUs de Nvidia alojadas en la nube de Google. Apple, en cualquier caso, ha extendido a esos servidores ajenos la misma filosofa de Private Cloud Compute, el sistema con el que promete que los datos suben cifrados, se procesan y se borran sin que nadie, ni siquiera Apple, pueda verlos.

Para hacerlo ha combinado las herramientas de computacin confidencial de Nvidia, Intel TDX y dos races de confianza por hardware de fabricantes distintos, de modo que si en una se descubriese una vulnerabilidad, el sistema seguira protegido. Solo Apple puede desplegar software en esas mquinas y los dispositivos nicamente dialogan con cdigo firmado por la empresa.

Esa obsesin por el control y la privacidad es, precisamente, el argumento que Apple esgrime para justificar la ausencia ms llamativa del da. La nueva Siri no llegar al iPhone ni al iPad en la Unin Europea cuando se publiquen iOS 27 y iPadOS 27 este otoo. La compaa asegura que la culpa es de la DMA, que a su juicio obligara a abrir a cualquier asistente de terceros el mismo acceso al dispositivo que tiene Siri AI. Bruselas, ha rechazado las propuestas que Apple ha hecho desde el ao pasado para encontrar una solucin de compromiso. Los europeos s tendrn Siri AI en Mac y Vision Pro. En el telfono, el dispositivo que ms datos personales guarda, no hay fecha.



source

Exit mobile version