Light
Dark

El gobierno salvadoreño ya creó un millón de «ciudadanos virtuales» para entrenar sistemas de IA

Con apoyo de NVIDIA y la empresa tecnológica WideLabs, el gobierno desarrolló una base de datos de un millón de perfiles sintéticos (ficticios) que buscan reproducir las características demográficas de la población salvadoreña. El proyecto utiliza información y estadísticas provenientes del Censo 2024.

Según la ANIA, el conjunto de datos no incluye información real de los salvadoreños. Foto: EDH / Elaborada con IA

La Agencia Nacional de IA (ANIA), una institución gubernamental creada el año pasado, anunció la creación de una base de datos con hasta un millón de perfiles ficticios, denominados también como personas sintéticas o ciudadanos virtuales, que reúnen las características demográficas de la población salvadoreña, con representaciones de los 14 departamentos del país.

Aunque la institución utiliza el término «personas sintéticas», el proyecto consiste en una base de datos de perfiles artificiales construidos a partir de dicha información, pero no incluye avatares o réplicas digitales de ciudadanos salvadoreños reales.


Aún así, es necesario definir qué es una persona ficticia. El profesor e investigador de la Universidad Autónoma de Baja California, en México, Javier Villegas, explicó a El Diario de Hoy que “una persona sintética es una representación o imagen artificial de una persona, diseñada para ser como nosotros, con características anatómicas y fisiológicas específicas”, lo que incluye aspectos como el color de piel, forma de vestir o el rostro, y la idea es que pueda interactuar con los usuarios “de forma menos robótica”, señala.

Esta definición coincide con lo explicado en el artículo Agentes de inteligencia artificial y humanos sintéticos, publicado en la revista de la Asociación de Autores Científico-Técnicos y Académicos (ACTA) de España, y el cual sostiene que este tipo de sistemas son “una interfaz capaz de reaccionar en tiempo real a lo que dice el usuario, sincronizando expresiones faciales y lenguaje corporal”.

Puede interesarle: Informe de EMFI prevé que la economía salvadoreña crecerá menos de lo esperado

En este sentido, el conjunto de datos que anunció la ANIA, y que fue desarrollado junto a las empresas tecnológicas NVIDIA y WideLabs, va encaminado a la posibilidad de utilizar la información demográfica de los salvadoreños para alimentar el desarrollo de agentes de Inteligencia Artificial o modelos de lenguaje en IA. Según la institución, “la IA está pasando de simples chatbots a agentes que realizan tareas de varios pasos para las personas, y eso eleva el listón en cuanto a fiabilidad, coherencia y compatibilidad cultural. No podemos llegar ahí con datos traducidos de otros mercados o escritos en español genérico de otro lugar”.

Lo anterior se refiere a algo que Villegas define como “sesgo en los sistemas de IA”, es decir, que la mayoría de modelos de este tipo de tecnología están sujetos a la percepción que tienen las empresas o personas que los programan. Por ejemplo, explica, no es lo mismo un agente de IA desarrollado en Inglaterra, que uno desarrollado en Estados Unidos o China, ya que cada modelo trae precargado una serie de patrones y percepciones que se inclinan hacia la realidad del lugar donde se origina.

Por ello, es que el proyecto que anunció la ANIA, y que tiene por nombre Nemotron-Personas-El Salvador, ha retomado los datos demográficos y estadísticos que arrojó el Censo Nacional de Población y Vivienda realizado en 2024. Según Villegas, esto es importante porque un agente de IA, entonces, podría tener en su base de datos información adaptada al contexto salvadoreño, incluyendo información relacionada con modismos o expresiones salvadoreñas, o las características fisiológicas de la población, entre otros, de una forma “tropicalizada”.

Según la ANIA, este «es el primer conjunto de datos abiertos de El Salvador con ciudadanos virtuales completamente sintéticos, fundamentado en estadísticas nacionales oficiales y español salvadoreño», al mismo tiempo que sostiene que servirá «para que los equipos puedan construir y probar estos agentes sin usar los datos personales reales de nadie”.

Ese último punto es clave, ya que la institución enfatiza en que los datos del Censo de 2024 han sido utilizados para alimentar el diseño de las cerca de un millón de personas ficticias creadas, y las cuales permitirán que los agentes de IA puedan realizar pruebas y entrenarse en la forma de interactuar como si se tratara de personas reales. “Cada persona está generada artificialmente y no hay personas reales representadas, lo que la hace segura, ética y lista para usar desde el principio”, afirma la ANIA, al mismo tiempo que indica que el conjunto de datos “es gratuito para el gobierno, universidades, empresas tecnológicas emergentes e investigadores”.

poblacion centro historico comercio crisis economica
El proyecto de la ANIA recopila datos demográficos de la población salvadoreña, retomados del Censo de Población y Vivienda 2024. Foto: EDH / Archivo

Las áreas de aplicación

Teniendo claridad sobre el significado y definición de una persona sintética, o ficticia, es importante apuntar cuáles son las posibles áreas de aplicación de este tipo de perfiles. Según el artículo de la ACTA, los perfiles ficticios pueden utilizarse en sectores como el servicio al cliente, en el marketing y entretenimiento y también en el plano gubernamental a través de pruebas vinculadas con políticas públicas.

Con respecto a esto último, el artículo apunta que con las personas sintéticas se puede implementar la simulación de escenarios, es decir que “en lugar de limitarse a analizar series históricas de datos, se construyen poblaciones sintéticas compuestas por miles o millones de agentes (que representan a ciudadanos individuales), cada uno con preferencias y comportamientos definidos, para observar cómo evolucionan bajo determinadas condiciones”. 

Esto permite poder hacer pruebas sobre cómo reaccionaría una población de un país o de una localidad ante cambios como la introducción de un nuevo impuesto, por ejemplo, o analizar la respuesta de la población ante planes de educación o de cambios en los sistemas de transporte público. El hecho de que la ANIA confirme que el conjunto de datos asciende a un millón de personas ficticias, da paso a que, en teoría, se puedan realizar este tipo de simulaciones en el país, incluso, de manera estratificada por zona geográfica. No obstante, la institución no ha especificado un área particular de aplicación.

Lea también: El Índice de Precios al Consumidor alcanzó su nivel más alto desde 2009, ¿cómo afecta la economía de los hogares?

Por otro lado, el profesor Villegas señala que, más allá de las ventajas que podrían aportar estas personas sintéticas al desarrollo de sistemas o servicios basados en IA, también hay riesgos intrínsecos debido al uso que podría dársele a la tecnología de este tipo. Según el investigador, el uso de los perfiles sintéticos desde el gobierno podría servir para manipular la opinión pública de los salvadoreños o maquillar problemas que preocupan a la población antes de que escalen, incluyendo los procesos electorales, gracias a la enorme cantidad de información que podrían recopilar sobre la población.

En este punto, Villegas también señala que, aunque sea un conjunto de datos de acceso abierto, puede incluir un sesgo vinculado con quien lo desarrolla, en este caso el gobierno salvadoreño, pues los agentes de IA podrían ser utilizados incluso para recolectar información sobre los problemas que aquejan a la población, detectarlos y manipularlos mediáticamente de acuerdo con los intereses oficiales.

No obstante, el investigador aclara que estos son solo riesgos potenciales, y posibles usos inadecuados, que podría darse a los agentes de IA desarrollados con la información demográfica de los salvadoreños, pero también considera que es un proyecto “muy divertido” y con alto potencial de alcance para distintas áreas de interés.

Legales Obituarios Epaper

Patrocinado por Taboola