Questo strumento ruota automaticamente le pagine capovolte in un documento PDF utilizzando OCR per rilevare l'orientamento del testo.
- Vai alla cartella
pdf_input
nel repository - Clicca sul pulsante "Add file" e seleziona "Upload files"
- Carica il tuo file PDF
- Aggiungi un messaggio di commit (es. "Aggiungi PDF da elaborare")
- Clicca su "Commit changes"
- Il workflow di GitHub Actions si avvierà automaticamente
- Una volta completato, il PDF elaborato sarà disponibile nella cartella
pdf_output
Utilizza questo metodo se hai già caricato i PDF nella cartella pdf_input
e vuoi rielaborarli:
- Vai alla scheda "Actions" del repository
- Seleziona il workflow "Process PDF Files"
- Clicca sul pulsante "Run workflow"
- (Opzionale) Modifica i parametri:
- Confidence threshold: Soglia di confidenza per il rilevamento dell'orientamento (default: 65)
- DPI: Risoluzione per la conversione del PDF in immagini (default: 200)
- Language: Lingua del documento per OCR (default: ita)
- Clicca su "Run workflow" per avviare il processo
- Una volta completato, i PDF elaborati saranno disponibili nella cartella
pdf_output
- Confidence threshold: Valore compreso tra 0 e 100 che indica la confidenza minima richiesta per ruotare una pagina. Un valore più alto richiede una maggiore certezza prima di ruotare la pagina.
- DPI: Valore che determina la risoluzione usata per convertire il PDF in immagini per l'analisi OCR. Un valore più alto fornisce risultati migliori ma rallenta l'elaborazione.
- Language: Codice lingua per il motore OCR (es. eng per inglese, ita per italiano, fra per francese, ecc.)