-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
plánování sklizní - generování semínek #518
Comments
At neotviram novy issue, tak to hodim sem, protoze to tenhle issue vlastne zahrnuje: obecne je ted po vsech moznych zmenach problem s generovanim seminek, je to ukrutne pomale a zrejme jsou tedy i problemy se spravnosti. Modely v
|
Update:Tak hlavni vec, ktera to zpomalovala byla
|
Po zrychleni |
skvělý, na testu - https://app.webarchiv.cz/seeder se semínka už načítají rychle! příklad kombinace mimosystémových semínek a manuálně nadefinovaných zdrojů na testu, je třeba tady: https://app.webarchiv.cz/seeder/harvests/93/detail. Ale máš pravdu, stav zdroje v tom nejspíš hraje roli. Mimosystémová semínka jsou ok a z manuálně nadefinovaných zdrojů se nejspíš zobrazují jen ty, které mají stav Archivován + příp. Archivován bez smlouvy, což vlastně dává smysl |
Prosel jsem tu sklizen a vesmes to vypada, ze to je fakt v pohode, ale tezko rict, protoze je par mesicu stara. Mimosystemova seminka se nacitaji v pohode a ze zdroju se tam nacte Techmania a Matějka. Ty ostatni zdroje maji vsechny mimo-archivni stav az na Agosto Foundation, ktera ma archivovany stav az od 19. 4. 2020 (https://app.webarchiv.cz/seeder/source/history/10525) Kdybys na neco podobneho zase narazila, tak dej vedet. Klidne je mozne, ze tam je nejaky bug, ale minimalne podle kodu a te sklizne to nevypada, tak to zatim uzavru. |
ještě jedna drobnost ke generování semínek - na ostrém Seederu se ukazuje rovnou seznam semínek, v testovací verzi se nahoře objeví název sklizně (# pravidelná měsíční sklizeň - říjen, https://app.webarchiv.cz/seeder/harvests/99/urls) a pak teprve seznam semínek. Vadí to? Možná by to mohlo vadit operátorovi při zadávání sklizně nebo později při automatickém plánování |
tak pardon, toto je nakonec po konzultaci s @horakjirinkp ok, nicméně na přání @JanMeritus nemáme zatím toto issue uzavírat - doplní prý další pole, co to má vracet, díky |
@JanMeritus Ta dalsi pole bych asi pripsal do #402, tam uz jsou nejake 2-3 roky stare navrhy, takze se to kdysi v minulosti resilo. |
po dohodě uzavírám více do #402 |
Mám dotaz k problému, který se řešil v tomto issue - do sklizně se načtou “mimosystémová semínka” a “manuálně nadefinované zdroje”, ale jen ty, která mají archivační stav, což je v pořádku u semínek, která se sklízí podle frekvence. Může se ale stát, že chceme sklidit semínko, které archivační stav nemá - zdroj byl třeba odmítnutý pro pravidelné sklízení, ale můžeme ho chtít jednorázově v rámci tematické kolekce Bylo by možné to řešit takto?:
|
zde jen tolik, ze pak by do budoucna i seminka dle frekvence meli byt kolekci, ktera ma ale parametr s vyplnenou frekvenci seminka mimo stav archived by melo byt mozne taky pridavat, ale meli by v tom pripade frekvenci oneshot |
jde o oneshots, napr v tematicky kolekci, jenom u serial je podminka - archived |
archivační stavy musí mít pouze semínka v rámci sklizně serials (+ Archive-it) |
podle dnešní dohody - do tem. kolekcí lze vložit semínka s jakýmikoli stavy v Seederu (zrušit podmínku public) + mimosystémová |
Vyřešeno v f93c10a. Aktuálně custom semínka se berou prostě tak jak jsou, custom zdroje se už také berou bez ohledu na archivační stav. |
při kombinaci "mimosystémových semínek" a "přiřazených zdrojů" zlobí generování seznamu URL adres - nejsou tam všechny. Viz např.: https://webarchiv.cz/seeder/harvests/136/detail (v seznamu jsou pouze mimosystémová semínka, manuálně nadefinovaný zdroj chybí)
The text was updated successfully, but these errors were encountered: