Este proyecto consiste en un bot desarrollado en Python para el minado de información en Instagram con fines de benchmark. El bot utiliza la biblioteca Selenium para la automatización del navegador y la recopilación de datos. Posteriormente, los datos recolectados son visualizados y analizados en Power BI. Este proyecto es únicamente para uso educacional y de investigación.
Este bot está diseñado exclusivamente para fines educacionales y de investigación. No debe ser utilizado para ningún propósito comercial ni para actividades que violen los términos de servicio de Instagram. El uso indebido de esta herramienta puede resultar en la suspensión de cuentas y en acciones legales.
- Python 3.8 o superior
- Web driver (preferiblemente Google Chrome)
- Power BI Desktop
selenium
pandas
openpyxl
-
Clonar el repositorio
git clone https://github.com/usuario/instagram-scraper-benchmark.git cd instagram-scraper-benchmark
-
Instalar las dependencias
pip install selenium pandas openpyxl
-
Descargar el WebDriver de Chrome
- Descargar la versión correspondiente de ChromeDriver.
- Colocar el archivo
chromedriver
en el directorio del proyecto o en una ubicación accesible desde el sistema.
-
Configuración del archivo
Config_scraper.py
Crear un archivoConfig_scraper.py
en el directorio del proyecto con el siguiente contenido:# config.py user = # insert an email registered on instragram password = # insert a password
-
Ejecución del Bot Ejecutar el script principal para iniciar el bot de minado de información BOT_v1.ipynb.
-
Exportación de los Datos
- Los datos recolectados se exportarán en formato csv (archivos
comments.csv
ygeneral.csv
) en el directorio del proyecto.
- Los datos recolectados se exportarán en formato csv (archivos
-
Importación en Power BI
- Abrir Power BI Desktop.
- Actualizar la fuente de datos.
Las contribuciones son bienvenidas. Por favor, abre un issue para discutir cualquier cambio que desees realizar.