-
Notifications
You must be signed in to change notification settings - Fork 0
/
web_scrapping.py
50 lines (34 loc) · 1.65 KB
/
web_scrapping.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from urllib.request import urlretrieve
def get_photos_from_gallery(link,name):
# URL de la page web à partir de laquelle vous souhaitez télécharger les images
url = link
# Répertoire de destination où vous souhaitez enregistrer les images
destination_directory = "photos_test/"+name
# Créez le répertoire de destination s'il n'existe pas
if not os.path.exists(destination_directory):
os.makedirs(destination_directory)
# Obtenez le contenu de la page web
response = requests.get(url)
if response.status_code == 200:
# Utilisez BeautifulSoup pour extraire les liens des images
soup = BeautifulSoup(response.text, 'html.parser')
img_tags = soup.find_all('img')
for img_tag in img_tags:
img_url = img_tag.get('src')
# Assurez-vous que l'URL de l'image est absolu
img_url = urljoin(url, img_url)
# Téléchargez l'image et enregistrez-la dans le répertoire de destination
img_name = os.path.basename(img_url)
img_path = os.path.join(destination_directory, img_name)
try:
urlretrieve(img_url, img_path)
print(f"Image {img_name} téléchargée avec succès.")
except Exception as e:
print(f"Erreur lors du téléchargement de {img_name}: {str(e)}")
else:
print(f"La requête a renvoyé le code d'état {response.status_code}. Impossible de continuer.")
get_photos_from_gallery("https://iseplife.fr/gallery/215909","journée du vendredi")