-
Notifications
You must be signed in to change notification settings - Fork 8
Καταγραφή Πηγών
Nina Gial edited this page Dec 11, 2023
·
9 revisions
Σύντμηση | Εξήγηση |
---|---|
ΣΚΡΙΠΤ | Καλό για script |
ΑΣΕΛ | Αναζητήσιμο σε επίπεδο λέξης |
ΠΕΡΙΠΤΩΣΗ | Διαφορετικά φορμάτ εξέταση κατά περίπτωση |
ΠΙ | Πνευματική ιδιοκτησία |
source | size | license | access |
---|---|---|---|
OPENBOOK.GR | 13,221 e-books and 2,368 audio books | Mixed (PublicDomain, Creative Commons, and Free Distribution with Attribution) | No Access Issues |
REPOSITORY.ACROPOLIS-EDUCATION.GR | Unknown | Unknown | No Access Issues |
ANEMI.LIB.UOC.GR | 2,000,000 pages | All Rights Reserved (personal, educational, or research use only) | No Access Issues |
OPENBOOK.GR | 13,221 e-books and 2,368 audio books | Mixed (Public Domain, Creative Commons, and Free Distribution with Attribution) | No Access Issues |
APOLLONIS-INFRASTUCTURE.GR | Unknown | Unknown | No Access Issues |
KAPODISTRIAS.DIGITAL.ARCHIVE.GR | Unknown | Unknown | No Access Issues |
PANDEMOS.PANTEION.GR | Διαφορετικές συλλογές, με λίστες, details, και PDF links | Ασαφές, ελεύθερη αναδιανομή επικαλείται διακήρυξη του Βερολίνου, αλλά τα τεκμήρια είναι υπό ΠΙ | No Access Issues |
ASKIWEB.EU | Unknown | Unknown | Access Error (Page Not Found/Error Processing Query) |
LIBRARY.ASFA.GR | Σύνδεσμους προς πολλά επιπλέον αποθετήρια | Unknown | No Access Issues/ Επικαιροποίηση τοποθεσίας |
LIBRARY.PARLIAMENT.GR | Unknown | Unknown | No Access Issues |
EBOOKS.SERRELIB.GR | Unknown | Unknown | No Access Issues |
VIKELAIA-EPAPERS.HERAKLION.GR | Unknown | Unknown | No Access Issues |
https://helios-eie.ekt.gr/EIE/ | Unknown | Mixed | No Access Issues |
Οι πηγές αυτές έχουν τεκμηριωθεί από το Εθνικό Κέντρο Τεκμηρίωσης και έτσι είναι προσπελάσιμες με μια σχετικά ομοιόμορφη ροή.
Ωστόσο κάθε τεκμήριο, ή κάθε φορέας, μπορεί να έχει διαφορετικές άδειες χρήσης για διαφορετικά τεκμήρια ή συλλογές τεκμηρίων.
από Open Archives
Φορέας | Πλήθος Τεκμηρίων |
---|---|
Πέργαμος | 123,908 |
Ιδρυματικό Καταθετήριο Επιστημονικών Εργασιών ΑΠΘ | 150,078 |
Πλειάς | 97,006 |
Ψηφιακό Αποθετήριο της Κεντρικής Βιβλιοθήκης του ΕΜΠ | 56,096 |
Δανιηλίς - Ψηφιακά Τεκμήρια της Βιβλιοθήκης Πατρών | 51,612 |
Εθνικό Αρχείο Διδακτορικών Διατριβών | 49,403 |
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης - Ψηφιοθήκη | 46,626 |
Ιδρυματικό αποθετήριο Ολυμπιάς | 29,535 |
Κοσμόπολις | 28,347 |
Ιδρυματικό Αποθετήριο Ελληνικού Ανοικτού Πανεπιστημίου | 27,105 |
Παρόμοια κατάσταση παρατηρούμε και στο αποθετήριο Ήλιος του Εθνικού Ιδρύματος Ερευνών .
Μέσα από την αρχική σελίδα δίνεται πρόσβαση σε έναν αριθμό "θεματικές διόδους" (πχ Ιστορία, Αρχαιολογία, Φυσική, Χημεία, κλπ).
Η διάταξη την οποία βρίσκουμε σε αυτές τις διόδους είναι διαχειρίσιμη, και εδώ επίσης βρίσκουμε το τεκμήριο σε μορφή PDF, ΑΣΕΛ.
Name | URL | Description | Format | Notes |
---|---|---|---|---|
Kodiko dot gr | https://www.kodiko.gr/ | Ελληνική Νομοθεσία | HTML | NA |
Eur Lex | https://eur-lex.europa.eu | Ευρωπαϊκή Νομοθεσία | HTML | NA |
[OPUS] Wikimatrix | https://opus.nlpl.eu/Wikipedia.php | Παράλληλα Κείμενα Wikipedia | XML, Tokenized | Untokenized form available |
[OPUS] Wikipedia | https://opus.nlpl.eu/Wikipedia.php | Παράλληλα Κείμενα Wikipedia | XML, Tokenized | Untokenized form available |
EuroPARL | https://statmt.org/europarl/ | Παράλληλα Κείμενα Ευρωπαϊκού Κοινοβουλίου | XML, Tokenized | Untokenized form available |
Anna’s Archive | https://annas-archive.org/llm | Shadow library | Unknown | By Request |
Internet Archive | https://archive.org | Public domain texts | HTML | By Request |
Εθνικός Συσσωρευτής | searchculture.gr | Ψηφιοποιημένες Συλλογές | Non-OCR’d | NA |
Αρχείο ΜΙΕΤ | www.elia.org.gr/digitized-collections/ | Ψηφιοποιημένες Συλλογές | Non-OCR’d | NA |
[OPUS] Other | https://opus.nlpl.eu/ | Άλλα παράλληλα κείμενα | XML, Tokenized | Subtitles, Bible, Other Sources (Loads) |
Ραπτάρχης | https://raptarchis.gov.gr | Ελληνική Νομοθεσία | PDF, OCR’d? | Deep nested structure, Unclear URL Routing |
Μίτος | https://mitos.gov.gr/index.php/ | Διαδικασίες Δημόσιας Διοίκησης | HTML, API | NA |
Ανέμη | https://anemi.lib.uoc.gr/ | Ψηφιοποιημένες Συλλογές | Non-OCR’d | Cumbersome navigation, Unclear URL Routing |
Πέργαμος | https://pergamos.lib.uoa.gr | Ψηφιοποιημένες Συλλογές | PDF, Non-OCR’d | Varies Wildly |
NLTK | https://www.nltk.org/nltk_data/ | Συλλογή Σωμάτων Κειμένων | Python data structures | Parsing tools, Greek coverage undetermined |
Project Gutenberg | https://www.gutenberg.org/browse/languages/el | Συλλογή Ελληνικών Κειμένων | HTML, Other | Modern Greek Translations, Monotonic Available |
Greek Legal Code | https://huggingface.co/datasets/greek_legal_code | Ελληνική Νομοθεσία | Python data structures | NA |
Greek Legal Named Entity Recognition | https://huggingface.co/datasets/joelniklaus/greek_legal_ner/tree/main | Ελληνική Νομοθεσία, Αναγνώριση επώνυμων οντοτήτων | JSON | NA |
OSCAR | https://huggingface.co/datasets/oscar | Πολυγλωσικά δεδομένα από Crawling | Python data structures | NA |
Tensor Flow Wikipedia Dataset | https://www.tensorflow.org/datasets/catalog/wiki40b#wiki40bel | Μονογλωσσικά σώματα κειμένων από Wikipedia σε πολλές γλώσσες | Python data structures | NA |
Common Crawl | https://data.statmt.org/cc-100/ | Μονογλωσσικά σώματα κειμένων από Crawling σε πολλές γλώσσες | TXT, Line Separated | NA |
LDC 2007 CoNLL Shared Task - Greek, Hungarian & Italian | https://catalog.ldc.upenn.edu/LDC2018T07 | NA | NA | NA |
LDC ECI Multilingual Text | https://catalog.ldc.upenn.edu/LDC94T5 | NA | NA | NA |
Αρχείο Ευρεσιτεχνιών | https://www.obi.gr/ | NA | NA | NA |
Ηλεκτρονικό Αναγνωστήριο | https://ereading.nlg.gr/el/?server=1 | NA | NA | NA |
Εθνική Βιβλιοθήκη Ψηφιακή Βιβλιοθήκη Εφημερίδων και Περιοδικού Τύπου | http://efimeris.nlg.gr/ns/main.html | NA | NA | NA |
Κοινοβούλιο | https://library.parliament.gr/ | NA | NA | PG RESET ERROR |
Σχολικά βιβλία | http://www.pi-schools.gr/books/ | NA | PDF, OCR’d | Difficult routing, not homogeneous, paging? |