Welcome to the Cold Case Dataset Scraper repository! This project is developed for the University of Utrecht and provides a dataset of Dutch cold cases. The repository includes both the dataset and a web scraper to ensure you always have the latest data.
This repository contains:
- A dataset of Dutch cold cases
- A web scraper script to generate and update the dataset
The web scraper is designed to fetch the latest cold case information, ensuring your dataset is always up-to-date.
- Up-to-date Data: Always have the latest information with the included web scraper.
- Easy to Use: Simple script to run and generate the dataset.
- Detailed Information: Comprehensive data on Dutch cold cases.
The dataset includes the following information for each cold case:
- Last Update (
lastupdate
) - Date of Delict (
date of delict
) - Place of Delict (
plaats delict
) - Case Number (
zaaknummer
) - Since (
sinds
) - Missing From (
vermist_uit
)
To generate or update the dataset, simply run the provided script. Make sure you have Python 3.8 or higher installed.
-
Clone the repository:
git clone https://github.com/LeoHanhart/coldcase_dataset_nl.git cd coldcase-dataset-scraper
-
Install the required dependencies:
pip install requests beautifulsoup4 pandas
-
Run the scraper script to generate the dataset:
python ColdCaseWebscraper.py
Running the script:
python ColdCaseWebscraper.py
Welkom bij de Cold Case Dataset Scraper repository! Dit project is ontwikkeld voor de Universiteit Utrecht en biedt een dataset van Nederlandse cold cases. De repository bevat zowel de dataset als een web scraper om ervoor te zorgen dat je altijd de nieuwste gegevens hebt.
Deze repository bevat:
- Een dataset van Nederlandse cold cases
- Een web scraper script om de dataset te genereren en bij te werken
De web scraper is ontworpen om de nieuwste informatie over cold cases op te halen, zodat je dataset altijd up-to-date is.
- Up-to-date Gegevens: Altijd de nieuwste informatie met de meegeleverde web scraper.
- Eenvoudig te Gebruiken: Eenvoudig script om te draaien en de dataset te genereren.
- Gedetailleerde Informatie: Uitgebreide gegevens over Nederlandse cold cases.
De dataset bevat de volgende informatie voor elke cold case:
- Laatste Update (
lastupdate
) - Datum van Delict (
date of delict
) - Plaats van Delict (
plaats delict
) - Zaaknummer (
zaaknummer
) - Sinds (
sinds
) - Vermist Uit (
vermist_uit
)
Om de dataset te genereren of bij te werken, hoef je alleen maar het meegeleverde script uit te voeren. Zorg ervoor dat je Python 3.8 of hoger hebt geïnstalleerd.
-
Clone de repository:
git clone https://github.com/LeoHanhart/coldcase-dataset-scraper.git cd coldcase-dataset-scraper
-
Installeer de vereiste dependencies:
pip install requests beautifulsoup4 pandas
-
Voer het scraper script uit om de dataset te genereren:
python ColdCaseWebscraper.py
Het script uitvoeren:
python ColdCaseWebscraper.py