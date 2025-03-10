El Departamento de Eficiencia Gubernamental (DOGE) ha obtenido un acceso sin precedentes a al menos siete bases de datos federales sensibles, incluidas las del Servicio de Rentas Internas (IRS) y la Administración del Seguro Social. Este acceso ha suscitado temores sobre vulnerabilidades de ciberseguridad y violaciones de la privacidad. Otra preocupación ha recibido mucha menos atención: el posible uso de los datos para entrenar los sistemas de inteligencia artificial de una empresa privada.

La secretaria de prensa de la Casa Blanca dijo que los datos gubernamentales que DOGE ha recopilado no se están utilizando para entrenar los modelos de inteligencia artificial de Musk, a pesar del control de Elon Musk sobre DOGE. Sin embargo, han surgido pruebas de que el personal de DOGE ocupa simultáneamente puestos en al menos una de las empresas de Musk.



En la Administración Federal de Aviación (FAA), los empleados de SpaceX tienen direcciones de correo electrónico del gobierno. Este empleo dual crea un conducto para que los datos federales puedan ser desviados a empresas propiedad de Musk, incluida xAI. El último modelo de chatbot de inteligencia artificial Grok de la empresa se niega llamativamente a dar una negación clara sobre el uso de dichos datos.

Como politóloga y tecnóloga familiarizada con fuentes públicas de datos gubernamentales, creo que esta posible transmisión de datos gubernamentales a empresas privadas presenta implicaciones de privacidad y poder mucho mayores de lo que identifica la mayoría de los informes. Una entidad privada con la capacidad de desarrollar tecnologías de inteligencia artificial podría usar datos gubernamentales para superar a sus competidores y ejercer una influencia masiva sobre la sociedad.

Valor de los datos gubernamentales para la IA

Para los desarrolladores de IA, las bases de datos gubernamentales representan algo similar a encontrar el Santo Grial. Mientras que empresas como OpenAI, Google y xAI dependen actualmente de información extraída de Internet pública, los repositorios gubernamentales no públicos ofrecen algo mucho más valioso: registros verificados de comportamiento humano real en poblaciones enteras.

No se trata simplemente de más datos, sino de datos fundamentalmente diferentes. Las publicaciones en las redes sociales y los historiales de navegación web muestran comportamientos seleccionados o previstos, pero las bases de datos gubernamentales capturan decisiones reales y sus consecuencias. Por ejemplo, los registros de Medicare revelan opciones y resultados de atención médica. Los datos del IRS y del Tesoro revelan decisiones financieras e impactos a largo plazo. Y las estadísticas federales de empleo y educación revelan trayectorias educativas y profesionales.

Lo que hace que estos datos sean particularmente valiosos para el entrenamiento de la IA es su naturaleza longitudinal y su fiabilidad. A diferencia de la información desordenada disponible en línea, los registros gubernamentales siguen protocolos estandarizados, se someten a auditorías periódicas y deben cumplir con los requisitos legales de precisión. Cada pago de la Seguridad Social, cada reclamación de Medicare y cada subvención federal crea un punto de datos verificado sobre el comportamiento del mundo real. Estos datos no existen en ningún otro lugar con tanta amplitud y autenticidad como en EEUU.

Lo más importante es que las bases de datos del gobierno rastrean poblaciones enteras a lo largo del tiempo, no solo usuarios activos digitalmente. Incluyen personas que nunca usan las redes sociales, no compran en línea o evitan activamente los servicios digitales. Para una empresa de IA, esto significaría entrenar sistemas sobre la diversidad real de la experiencia humana en lugar de solo las reflexiones digitales que las personas emiten en línea.

La ventaja técnica

Los sistemas de IA actuales enfrentan limitaciones fundamentales que ninguna cantidad de datos extraídos de Internet puede superar. Cuando ChatGPT o Gemini de Google cometen errores, a menudo se debe a que han sido entrenados con información que puede ser popular pero no necesariamente verdadera. Pueden decirte lo que la gente dice sobre los efectos de una política, pero no pueden rastrear esos efectos a través de poblaciones y años.

Los datos del gobierno podrían cambiar esta ecuación. Imagine entrenar un sistema de IA no solo con opiniones sobre la atención médica, sino también con resultados reales de tratamientos en millones de pacientes. Considere la diferencia entre aprender de los debates en las redes sociales sobre políticas económicas y analizar sus impactos reales en diferentes comunidades y grupos demográficos a lo largo de décadas.

Un modelo grande, de última generación, o de vanguardia, entrenado con datos gubernamentales completos podría comprender las relaciones reales entre políticas y resultados. Podría rastrear consecuencias no deseadas en diferentes segmentos de la población, modelar sistemas sociales complejos con validación del mundo real y predecir los impactos de los cambios propuestos en función de evidencia histórica. Para las empresas que buscan construir sistemas de IA de próxima generación, el acceso a estos datos crearía una ventaja prácticamente insuperable.

Control de sistemas críticos

Una empresa como xAI podría hacer mucho más con modelos entrenados con datos gubernamentales que construir mejores chatbots o generadores de contenido. Dichos sistemas podrían transformar fundamentalmente, y potencialmente controlar, cómo las personas entienden y gestionan sistemas sociales complejos. Si bien algunas de estas capacidades podrían ser beneficiosas bajo el control de agencias públicas responsables, creo que representan una amenaza en manos de una sola empresa privada.

Las bases de datos de Medicare y Medicaid contienen registros de tratamientos, resultados y costos en diversas poblaciones a lo largo de décadas. Un modelo de vanguardia entrenado con nuevos datos gubernamentales podría identificar patrones de tratamiento que tengan éxito donde otros fracasan, y así dominar la industria de la atención médica. Un modelo de este tipo podría entender cómo las diferentes intervenciones afectan a diversas poblaciones a lo largo del tiempo, teniendo en cuenta factores como la ubicación geográfica, el nivel socioeconómico y las condiciones concurrentes.

Una empresa que utilice el modelo podría influir en la política de atención médica al demostrar capacidades predictivas superiores y conocimientos a nivel de población del mercado a las compañías farmacéuticas y aseguradoras.

Los datos del Tesoro representan quizás el premio más valioso. Las bases de datos financieras del gobierno contienen detalles granulares sobre cómo fluye el dinero a través de la economía. Esto incluye datos de transacciones en tiempo real en los sistemas de pago federales, registros completos de pagos y reembolsos de impuestos, patrones detallados de distribución de beneficios y pagos a contratistas del gobierno con métricas de desempeño.

Una empresa de IA con acceso a estos datos podría desarrollar capacidades extraordinarias para la previsión económica y la predicción del mercado. Podría modelar los efectos en cascada de los cambios regulatorios, predecir vulnerabilidades económicas antes de que se conviertan en crisis y optimizar las estrategias de inversión con una precisión imposible a través de los métodos tradicionales.

Infraestructura y sistemas urbanos

Las bases de datos del gobierno contienen información sobre patrones críticos de uso de infraestructura, historiales de mantenimiento, tiempos de respuesta a emergencias e impactos del desarrollo. Cada subvención federal, inspección de infraestructura y respuesta a emergencias crea un punto de datos que podría ayudar a entrenar a la IA para entender mejor cómo funcionan las ciudades y regiones.

El poder reside en la posible interconexión de estos datos. Un sistema de IA entrenado con registros de infraestructura del gobierno entendería cómo los patrones de transporte afectan el uso de energía, cómo las políticas de vivienda afectan los tiempos de respuesta a emergencias y cómo las inversiones en infraestructura influyen en el desarrollo económico en las regiones.

Una empresa privada con acceso exclusivo obtendría una visión única de las arterias físicas y económicas de la sociedad estadounidense. Esto podría permitirle desarrollar sistemas de "ciudades inteligentes" de los que los gobiernos municipales dependerían, privatizando efectivamente aspectos de la gobernanza urbana. Cuando se combinan con datos en tiempo real de fuentes privadas, las capacidades predictivas superarían con creces lo que cualquier sistema actual puede lograr.

Los datos absolutos corrompen completamente

Una empresa como xAI, con los recursos de Musk y el acceso preferencial a través de DOGE, podría superar obstáculos técnicos y políticos mucho más fácilmente que sus competidores. Los recientes avances en el aprendizaje automático también han reducido la carga de preparar los datos para que los procesen los algoritmos, lo que convierte a los datos del gobierno en una verdadera mina de oro, que pertenece por derecho al pueblo estadounidense.

La amenaza de que una empresa privada acceda a los datos del gobierno trasciende las preocupaciones de privacidad individual. Incluso sin los identificadores personales, un sistema de inteligencia artificial que analiza patrones en millones de registros gubernamentales podría permitir capacidades sorprendentes para hacer predicciones e influir en el comportamiento a nivel de la población. La amenaza son los sistemas de inteligencia artificial que aprovechan los datos del gobierno para influir en la sociedad, incluidos los resultados electorales.

Dado que la información es poder, concentrar datos sin precedentes en manos de una entidad privada con una agenda política explícita representa un profundo desafío para la república. Creo que la pregunta es si el pueblo estadounidense puede hacer frente a la corrupción potencialmente destructora de la democracia que permitiría esa concentración. Si no, los estadounidenses deberían prepararse para convertirse en sujetos digitales en lugar de ciudadanos humanos.

*Allison Stanger es catedrática distinguida, Middlebury College .

Este artículo fue publicado inicialmente en The Conversation. Puedes leer en inglés el original.

