Skip to content

📓 Minicurso de raspagem de dados web com Python ministrado na Semana de Tecnologia da FATEC Jundiaí

Notifications You must be signed in to change notification settings

lidimayra/raspagem-de-dados-fatec

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

49 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Raspagem de dados Web com Python @ FATEC Jundiaí

Minicurso reallizado durante a Semana de Tecnologia 2017 na Fatec Jundiaí

Nós participamos do curso Hackeando Dados Públicos usando Python com o Fernando Masanori, onde aprendemos técnicas muuuito legais e decidimos levar o nosso aprendizado para a Semana de Tecnologia da Fatec. Os exemplos utilizados continuarão disponíveis aqui.

O que é

A raspagem de dados (data scraping) é uma técnica computacional de coleta automatizada de dados. Durante o curso focaremos no web scraping, cuja finalidade consiste em extrair dados que podem ser visualizados em um navegador web.

Pré-requisitos

  • Instalação do Python 3

  • Instalação das bibliotecas. A partir do terminal de comando execute:

pip install beautifulsoup4 requests numpy scipy matplotlib

❗ Estas recomendações são necessárias para quem optar por levar o próprio notebook. Pediremos ao Nathan pra deixar os computadores do laboratório já preparados no dia! 🎊

🔸 Para os scripts que usaremos durante o minicurso, a instalação do beautifulsoup4 é suficiente. numpy, scipy e matplotlib serão utilizadas apenas em exemplos mais avançados que envolvem visualização de dados e não serão abordados durante a apresentação devido ao tempo.

Para garantir que a instalação foi realizada com sucesso, abra o console Python, faça a importação da biblioteca e chame pela classe BeautifulSoup:

>>> from bs4 import BeautifulSoup
>>> BeautifulSoup
<class 'bs4.BeautifulSoup'>

Exemplos de projetos que fazem uso de raspagem de dados:

Para saber mais:

Nossa equipe:

About

📓 Minicurso de raspagem de dados web com Python ministrado na Semana de Tecnologia da FATEC Jundiaí

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published