Redes de Élites Latinoamericanas
Proyecto de ciencia de datos sociales que analiza las redes familiares y estrategias de reproducción de las élites en América Latina. Utilizamos Wikipedia como fuente de datos para mapear conexiones familiares, alianzas matrimoniales y vínculos transnacionales que abarcan más de 500 años de historia.
Un repositorio de datos y herramientas para estudiar las élites latinoamericanas a través del análisis de redes familiares.
Scripts en Python para extraer automáticamente información biográfica, relaciones familiares y cargos políticos desde Wikipedia en español.
Archivos CSV procesados con información de más de 6,700 personas de 565 familias de élite de 10 países latinoamericanos.
Scripts en R para construir grafos familiares, calcular métricas de centralidad y detectar patrones de endogamia y alianzas matrimoniales.
Identificación de vínculos que cruzan fronteras: desde el Emperador Moctezuma hasta los Borgia, conectados con personas vivas hoy.
Organización clara y reproducible del proyecto
wiki-chile_project/ ├── data/ │ ├── raw/ # Datos crudos del scraping │ │ ├── chile/familias/ │ │ ├── argentina/familias/ │ │ └── ... │ ├── processed/ # Datos procesados │ │ └── familias/ │ │ └── _CONSOLIDADO_familias_latam.csv # ⭐ ARCHIVO PRINCIPAL │ └── manual/ # Datos agregados manualmente │ ├── scripts/ │ ├── 01_scraping/ # Extracción de Wikipedia │ ├── 02_processing/ # Limpieza y normalización │ └── 03_analysis/ # Análisis de redes │ ├── notebooks/ # Jupyter notebooks por país ├── outputs/ # Figuras, tablas, reportes │ ├── README.md # Descripción del proyecto └── WORKFLOW.md # Flujo de trabajo detallado
# Clonar el repositorio
git clone https://github.com/matdknu/familiaR-wiki.git
cd wiki-chile_project
# Instalar dependencias
pip install -r requirements.txt
# Scrapear familias de Chile
python scripts/01_scraping/scraper_wikipedia_familias.py --pais chile --listar
10 países latinoamericanos con información de familias de élite
Basado en técnicas de análisis de redes sociales
Wikipedia en español: infoboxes biográficas y categorías de familias por país.
Padres, cónyuges, hijos, hermanos - extraídos automáticamente de las biografías.
Centralidad de grado, betweenness, detección de comunidades, índices de endogamia.
Inspirado en Padgett & Ansell (1993): "Robust Action and the Rise of the Medici".