Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Děravé pokrytí a deduplikace u e-knih #4

Open
jiripavlik88 opened this issue Jan 5, 2022 · 28 comments
Open

Děravé pokrytí a deduplikace u e-knih #4

jiripavlik88 opened this issue Jan 5, 2022 · 28 comments

Comments

@jiripavlik88
Copy link

V e-knihách chybí BOOKPORT, Palmknihy, EBSCO eBooks, ProQuest Ebook Central, ...

@martinkrcal
Copy link

Aktuálně řešíme funkcionalitu SW. Obsahovou stránku bychom nechali na pozdější období dle koncepce portálu.

@vojtisev
Copy link

Ještě se dívám na rozdíl mezi vyfiltrovanými e-knihami volně ke stažení (3 253):

https://cpk-front.mzk.cz/Search/Results?limit=0&filter%5B%5D=%7Erecord_format_facet_mv%3A%220%2FEBOOK%2F%22&filter%5B%5D=%7Estatuses_facet_mv%3A%22online%22&type=AllFields

a nabídkou e-knih ke stažení v rámci tlačítka (inspirace):

https://cpk-front.mzk.cz/Search/Results?lookfor=inspiration%3A%22eknihy_ke_stazeni%22&type=AllFields

kde je cca o 1 000 titulů méně. Není to matoucí? Netahají se ta data ze stejného zdroje?

@xmorave2
Copy link
Collaborator

xmorave2 commented Feb 1, 2022

@vojtisev Odkaz an e-knihy by už měl vypisovat všechna e-knihy volně ke stažení (MKP + Munipress) stejně jako na současné verzi knihovny.cz

@vojtisev
Copy link

vojtisev commented Feb 8, 2022

@vojtisev Odkaz an e-knihy by už měl vypisovat všechna e-knihy volně ke stažení (MKP + Munipress) stejně jako na současné verzi knihovny.cz

Díky! Mám to srovnávat na cpk-front, nebo knihovny.cz? Když se dívám na obě ta rozhraní, přeci jenom se to liší.

  1. Pokud filtruji na https://cpk-front.mzk.cz/Search/Results?limit=0&filter%5B%5D=%7Erecord_format_facet_mv%3A%220%2FEBOOK%2F%22&filter%5B%5D=%7Estatuses_facet_mv%3A%22online%22&type=AllFields pak je výsledkem 3 266 titul.
  2. Pokud jdu na na nabízené e-knihy z homepage, tj. https://cpk-front.mzk.cz/Search/Results?filter%5B0%5D=%7Eregion_institution_facet_mv%3A%222%2FOthers%2Febook%2FMKPE%2F%22&filter%5B1%5D=%7Eregion_institution_facet_mv%3A%222%2FOthers%2Febook%2FMUNIPRESS%2F%22&type=AllFields pak to ukazuje nejspíš vše, co má: 3 737 výsledků
  3. Pokud jdu na přehled e-knih z homepage knihovny.cz, tj. https://www.knihovny.cz/Search/Results/?type0%5B%5D=AllFields&bool0%5B%5D=AND&filter=H4Gw9gxghiD6BOBTA5gSzAO1qjBnALqvgK6GawBmUEi-sB8sAtgG4BcARAEwD0A8vgAWieLh6IARmDABrHgFkA0gAUAojw4AfUJBgIU6LDgJFShytVr18jVp14Dho8VNkKAqgDkAksoBKqgDKgRpAA..&daterange=&publishDatefrom=&publishDateto=&limit=20&sort=relevance&page=1&searchTypeTemplate=basic&database=Solr&keepFacetsEnabled=true&join=AND pak se dostanu na ten (asi) správný počet 3 737
  4. Pokud ale chci filtrovat na knihovny.cz, pak můžu dát všechny e-knihy (výsledkem je 105 547), ale už je nemůžu filtrovat podle dostupnosti, resp. ty filtry jsou jiné:
    screenshot-www knihovny cz-2022 02 08-12_52_34

Možná v tom jenom zbytečně šťourám, jenom je pro mě překvapivé, že se liší počty titulů, které bych očekával shodné, tak aby se pod tím neskrýval nějaký jiný problém.

@PetraZabickova
Copy link
Collaborator

Zdá se, že v setu mkpe je nějaká chyba a u některých záznamů nepřijdou odkazy na eknihu.

Když nepřijdou odkazy, tak publikace nespadne do fasety Volně dostupné, bohužel. Jakmile dojde k aktualizaci dat a odkazy se zase objeví, tak záznamy spadnou do kategorie dostupné.

V nové verzi se faseta tvoří přesněji a tímpádem se nestane, že by záznam bez odkazu byl vyhodnocený jako online dostupný.

@jandera
Copy link

jandera commented May 27, 2022

Co můžeme udělat pro to, aby se e-knihy z našeho fondu (KNAV) zobrazovaly i s linkem na fulltext? Např.: https://www.knihovny.cz/Record/sfxknav.000168152 v CI to zas vyhodí na URL https://www.knihovny.cz/EdsRecord/edsebk,566459 chybu. U nás je to tento záznam: https://katalog.lib.cas.cz/KNAV/EdsRecord/cat03790a,oso.EBC115739
chyba_edsebk,566459
9

@PetraZabickova
Copy link
Collaborator

Dobrý den,

omlouváme se, ale před cca 2 hodinami jsme vydali release a dostala se nám to něj chyba se zobrazením EDS záznamů. Opravu již máme nachystanou k vydání. Jakmile to opravíme, tak se vám výše uvedená chyba zobrazovat nebude. Můžete si vyzkoušet, že volání na Dostupnost včetně linkování, pokud si ji vyvoláte ve výsledcích a ne na detailu u konkrétního záznamu funguje . (https://www.knihovny.cz/EDS/Search?lookfor=Volatility+Trading&type=AllFields&limit=20)

Aby se linkovalo i z lokálního indexu na váš vyexportovaný záznam z SFX, tak byste nám museli v exportu posílat pole 856 s fungujícím odkazem a mi jej budeme prezentovat. Indexace vašich záznamů z linkovacího serveru nezapadá do naší koncepce rozdělení vyhledávání. Ale pokud trváte na tom, abychom je indexovali, tak to dělat budeme.

Prosím pro nové chyby pro přehlednost zakládejte nové issue, je to pro nás mnohem přehlednější se v tom vyznat. Děkuji.
PZ

@jiripavlik88
Copy link
Author

On to asi je pořád stejný challenge - na dotaz E-knihy v KNAV -
https://www.knihovny.cz/Search/Results?limit=0&filter%5B%5D=%7Eregion_institution_facet_mv%3A%222%2FLibrary%2FPR%2FKNAV%2F%22&filter%5B%5D=%7Erecord_format_facet_mv%3A%220%2FEBOOK%2F%22&type=AllFields

se vrací e-knihy z BOOKPORT, chybí e-knihy od Wiley, atd.

@PetraZabickova
Copy link
Collaborator

Zobrazení záznamů v CI bylo opraveno.

@PetraZabickova
Copy link
Collaborator

Jirko, chápu správně, že si stěžuješ na to, že export KNAV z SFX v lokálním indexu nemají typ dokumentu e-kniha?

@jandera
Copy link

jandera commented May 27, 2022

Ono je to tak, že v LI je náš Bookport ale nejsou tam všechny e-knihy dalších dodavatelů (např. ten Wiley) a naopak v CI jsou snad všichni naši dodavatelé e-knih, ale není tam zas Bookport.

No a u toho zmiňovaného linku https://www.knihovny.cz/Record/sfxknav.000168152 v LI chybí odkaz na fulltext, ale u věcí z Bookportu tam jsou.

@jiripavlik88
Copy link
Author

To děravé pokrytí zmíněné na začátku se u KNAV docela zůžilo na challenge, jak si vyhledat e-knihy ve fondu KNAV.
E-knihy z BOOKPORT, Wiley, ProQuest Ebook ... má KNAV v CPK zaindexované, ale BOOKPORT pod Národní zdroje,
ostatní pod Zahraniční zdroje. Nevidím, jak zadat dotaz na vyhledání e-knih ve fondu KNAV.

Pak pro kompletnost k e-knihám v CPK chybí ještě korektní zaindexování Palmknihy, nicméně ty nejsou pro KNAV relevatní.

Pěkná práce k rychlé opravě zobrazení záznamů v CI.

@PetraZabickova
Copy link
Collaborator

A co kdybychom začali lokální a centrální index blendovat? Možná by to pak nebylo děravé.

@jiripavlik88
Copy link
Author

To zní jako řešení, jak zadat dotaz na e-knihy v KNAV :-)

@PetraZabickova
Copy link
Collaborator

Bohužel to ale nepomůže, protože i v EDS většina e-knih je označena jako knihy. Leda bychom jim napsali ať to opraví.

@zabak
Copy link
Member

zabak commented May 27, 2022

jo a už tak za 20 let by se něco stalo :)

@PetraZabickova
Copy link
Collaborator

Jen pro doplnění pár informací k páteční diskuzi:

1,
Záznamy z Bookportu jsou indexované, jak pod každou knihovnou, která je má, tak samostatně ve fasetě Ostatní zdroje/E-knihy. Pro větší srozumitelnost přejmenujeme v nejbližší době hodnotu fasety Ostatní zdroje/E-knihy na Ostatní zdroje/Producenti e-zdrojů

2,
Blendovat záznamy z lokálního a centrálního indexu v žádném případě neplánujeme. Nikdy.

3,
SFX exporty z KNAV zdá se mají špatný typ dokumentů. Můžeme jej změnit. Možností řešení je vícero:

  • všechny budou e-knihy a typ dokumentu e-knihy přejmenujeme na e-knihy a e-časopisy
  • rozlišíme, zda se jedná o časopisy a knihy, pokud budou správná metadata

Jakmile toto uděláme pravděpodobně narazíme na to, že existuje celá řada jiných záznamů z jiných knihoven, kde tento typ špatně rozpoznáváme nakolik se nám to podaří je nejisté. A pravděpodobně většinu náročných zákazníků stejně neuspokojíme.

4,
Pro úplnost jen doplním, co se týče stále omílaných Palmknih, na jejich zařazení do portfolia CPK pracujeme. Ale řešení je komplikované. Hlavním problém je, že neexistence kvalitních metadat půjčovaných knih vedla jednotlivé knihovny k tomu, že jejich způsob zpracování se liší knihovna od knihovny a pokud nechceme náš index zavalit další hromadou duplicitních záznamů, tak nám to prostě ještě chvíli potrvá. Jen je škoda, že tak veliký zdroj půjčovaných e-knih, za tolik let existence své činnosti nebyl schopen doplnit do svých metadat ani názvové a autorské údaje.

@jiripavlik88
Copy link
Author

Díky za update, Petro.

Ad 1. Prima. Přes tuto fasetu Ostatní zdroje se pěkně dají vyhledat e-knihy z BOOKPORT, E-knihovny MKP, Nakladatelství MUNI a Open Library.

Ad 3. Indexujete exporty SFX z KNAV v tomto případně kvůli tomu, aby na facetové vyhledávání typ dokumentu = e-knihy & knihovna = KNAV se vyhledaly všechy e-knihy ve fondu KNAV? Nyní se vyhledá 8833 e-knih od BOOKPORT.

Ad 4. Podaří se do Světa knihy pilotně zaindexovat e-knihy od Palmknih ve fondu JVK ČB? Na Světu knihy mám s Palmknihy domluvené jednání, mohl bych pilotní zaindexování a další postup s Palmknihami probrat včetně řešení problému, které pilotní zaindexování ukáže v metadatech u názvových a autorských údajů.

@PetraZabickova
Copy link
Collaborator

PetraZabickova commented May 31, 2022

3, SFX exporty z KNAV indexujeme, protoze na tom KNAV trvá. Radost z toho nemáme a nedává nám to smysl.

4, Do Světa knih to velmi pravděpodobně nestihneme. Problém s indexací Palmknih není o tom, že vezmu data jedné knihovny a použiju je. Musím to vyřešit komplexně v kontextu toho, že ostatní knihovny se k tomu chovají jinak.

Pro neznalé problematiky: Palmknihy slibují už několik let, že vylepší svůj feed s informacemi o půjčovaných knihách. Tento: http://ereading.cz/xml/xml_rent.xml

@jandera
Copy link

jandera commented May 31, 2022

Pokud v CI budou všechny naše EIZ a v LI Bookport, tak v KNAV už potřebu indexace SFX exportu nemáme. Samozřejmě by bylo lepší mít všechny EIZ v jednom indexu, ale ty ostatní v LI bez linků na fulltexty nedávají smysl.
Takže, prosím, přestaňte indexovat náš SFX export do LI, Bookport si předpokládám indexujete jinak. Mně to totiž také smysl nedává a nemám z toho radost. Pro jistotu jsem si toto rozhodnutí nechal ještě posvětit Martinem Lhotákem a paní ředitelkou.
Díky!

@jiripavlik88
Copy link
Author

Palmknihy by měli mít ještě neveřejný XML feed s úplnějšími metadaty. Proberu s Palmknihy možnost využití feedu s úplnějšími metadaty pro CPK.

@jiripavlik88
Copy link
Author

Ještě ke: "Pro větší srozumitelnost přejmenujeme v nejbližší době hodnotu fasety Ostatní zdroje/E-knihy na Ostatní zdroje/Producenti e-zdrojů"

Prima plán. Počítám, že sem přijdou i Palmknihy, časem případně další jako Publi, Pablikado, ... že?

@martinkrcal
Copy link

Ahoj Jirko, má někdo Publi ze zapojených knihoven? Myslím, že to mají spíš univerzity a pak školy. Možná by bylo zajímavé zahrnou na portál jejich volně dostupné věci (obdobně jako bibliografie). U Pablikada to nyní nemá cenu, protože to z českých knihoven má myslím jen VUT.

@jiripavlik88
Copy link
Author

jiripavlik88 commented Jun 3, 2022 via email

@jiripavlik88
Copy link
Author

Na stránky portálu CPK by se mohl doplnit odkaz na seznam e-knih KNAV - https://msfx.lib.cas.cz/sfxlcl3/ebooksearch/KNAV

Seznam doplňuje vyhledávání, kde v Zahraniční zdroje lze u e-knih zobrazit dostupnost v KNAV, v Národní zdroje lze vyhledat e-knihy z BOOKPORT, ale nelze CPK zadat vyhledání všech e-knih ve fondu KNAV.

@jiripavlik88
Copy link
Author

Obdobně jako e-knihy KNAV by šly řešit e-knihy ve fondu NTK #58

@JanaKurfurstova
Copy link
Contributor

Ad #4 (comment) :
Exporty z KNAV SFX už teď neindexujeme. Zahraniční EIZ jsou dostupné ze Zahraničních zdrojů, Bookport z Národních zdrojů.

@jiripavlik88
Copy link
Author

jiripavlik88 commented Jun 8, 2022

U e-knihy je takto info o dostupnosti na dvou místech, např. Sociální mozek -
https://www.knihovny.cz/EdsRecord/edsebk,1368048 (elektronická verze v ProQuest Ebook Central, EBSCO eBooks)
https://www.knihovny.cz/Record/bookport.508594524 (elektronická verze v BOOKPORT)
Zvlášť pak je ještě into o dostupnosti tištěné verze -
https://www.knihovny.cz/Record/mzk.MZK01-001532038

Dohledat to jde, výborný pokrok v pokrytí. Challenge se z pokrtytí pomalu přesouvá na deduplikaci :-)

@jiripavlik88 jiripavlik88 changed the title Děravé pokrytí k e-knihám Děravé pokrytí a deduplikace u e-knih Jun 9, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

8 participants