Showing posts with label király_péter. Show all posts
Showing posts with label király_péter. Show all posts

2010/03/16

A könyvtári adatoknak helye lenne más adatbázisokban

Téma: code4lib.hu workshop a debreceni Networkshopon?
Tájékoztat: Király Péter, az eXtensible Catalog és az RPHA egyik fejlesztője

Konyvtaros.com: Szükség van informatikusokra a könyvtárban?
Király Péter: Nyilván álnaív a kérdés. Persze hogy szükség van. Nem akarok mások nevében
beszélni, és nem is tudom, hogy igazából a magyar könyvtárakban mi a pontos helyzetkép (már azon kívül, amiről a Klog, a konyvtaros.com és a Katalist beszámol), mindenesetre a világ minden részéről, még Afrikából is hallani innovatív könyvtár-informatikai kezdeményezésekről. Ennek egyik - számomra legfontosabb aspektusa - hogy a könyvtári rendszerek egyre nyíltabbá, alakíthatóbbakká váltak. Nem feltétlenül nyílt forráskódról beszélek, hanem olyan eszközökről, amik lehetővé teszik, hogy mind a kinézetet, mind a funkcionalitást, vagyis, hogy mit csináljon a számítógép a könyvtáros maga alakíthatja. Például az Ex Libris felhasználók nyílt forráskódúvá tehetik és az El Commons CodeShare szájton megoszthatják azokat a "bütyköléseiket", amiket az Alephen, Voyageren stb. maguknak csináltak.

Ugyanis a 10 évvel ezelőtti helyzethez képest az a nagy fordulat, hogy 1) az olvasóknak már lehetőséget lehet adni a különféle visszajelzésekre 2) a könyvtári katalógus már nem sziget, nem az OPAC egyetlen információforrása, hanem csak az egyik, bár továbbra is a legfontosabb. A különféle webes technológiák és az intézmények adatmegosztásra való igyekezete lehetővé teszi, hogy egy katalógustételt automatikusan kiegészítsünk kontextuális információkkal, pl. szerzők, tárgyszavak Wikipédia-tételeivel, az idegen szavak szótári jelentésével, a földrajzi nevek térképre vetítésével, az időpontok időrendi táblázatba helyezésével, a hasonló dokumentumok felsorolásával stb. stb. Mindez azt segíti, hogy az olvasó könnyebben eldönthesse, hogy az adott könyv tényleg neki szól-e (hogy egy kicsit Ranganathant is idecitáljuk).

Másrészt a könyvtári adatoknak helye lenne más adatbázisokban, pl. aki keresett már a magyar könyvesbolti portálokon, biztos szembetalálta magát azzal, hogy a könyvészeti adatok pontatlanok, ráadásul sok esetben láthatjuk a ki tudja honnan örökölt 256 karakteres mezőhatár okozta címlevágásokat. Miért ne lehet a könyvtárak által termelt minőségibb adatokat kiajánlani számukra? Vagy egy másik példa: irodalomtörténeti adatbázisok tudnának automatikusan kapcsolódni a könyvtári katalógusokhoz, ha azok URL-en keresztül a referenciakönyvek (RMK, RMNy stb.) azonosítói alapján címezhetők lennének. Transzparens, intézményközi névteret használva a múzeumi és levéltári adatbázisokhoz lehetne kiépíteni közös belépési pontokat, ami szintén a kontextuális információkat gazdagíthatja.

A workshop ötlete onnan jött, hogy az OCLC néhány éve kezdett el efféle 2-3 napos műhelyt szervezni Mashathon néven (a mashup és a maraton szavakból alkotott szójáték). A Drupal konferenciák rendszeres kiegészítő rendezvénye a CodeSprint, ahol programozók közösen ötletelnek, kódolnak egy adott probléma kapcsán. Annak örülnék, ha hasonló jellegű kötetlen, beszélgetős, kódolgatós eseményt sikerülne összehozni. A cél nem az, hogy helyben létrejöjjön valami produktum, hanem hogy egymástól tanuljunk. Én például nem dolgozok könyvtárban, nem találkozok közvetlenül az olvasókkal, közvetetten jut el hozzám az információ az igényekről (persze, mint olvasónak és egykor olvasószolgálati feladatokat is ellátó könyvtárosnak van némi saját tapasztalatom is). Vagyis jó lenne, ha "olvasóközelibb" könyvtárosok is részt vennének a beszélgetésben, hogy egy-egy programozóként alkotott talán téves elképzelésünket helyre tegyék.

Visszatérve az eredeti kérdésre: Sajó Andrea pályázatát elolvasva az a válasz, hogy rengeteg innovatív könyvtárinformatikusra lenne szükség, annyi a megvalósításra váró ötlet. A kérdés inkább az, hogy van-e elég és főképp: megvan-e az alkalmazásukhoz szükséges anyagi háttér?

zene:

2010/01/21

A nyertes pályázatáról

Király Péter írásának másodközlése. Megjelent a http://kirunews.blog.hu/2010/01/21/a_nyertes_palyazatarol oldalon.


Életemben nem írtam még pályázat-kritikát, de az előzmények ismeretében (Monok alulmaradása, az 'ismeretlen' Sajó Andreával szemben, majd Monok pályázatának publikálása, Sajóé nem publikálása, és a többi, amiről a Katalisten és a Konyvtáros.com-on lehetett értesülni) meglehetősen felcsigázta az érdeklődésemet, úgyhogy most (elsősorban magamnak, pedagógiai jelleggel) írok róla.

A legfontosabb: végre minden érdeklődő (az igazat megvallva néhány tucatnál nem lehet több, sajnos) megismerheti a pályázatot: http://www.oszk.hu/sajo_andrea/palyazat.pdf. A második, amit rögtön az elején szeretnék leszögezni: Sajó Andreát nem ismerem, látni is csak egyszer láttam, még Matáv-könyvtárosként egy Networkshop-konferencián, vagy 10 éve. Ha ennek a kritikának lesz némi éle, az nem az ő személye ellen szól (nem is szólhat, hiszen azt nem ismerem), hanem a pályázatban testet öltő teljesítményével kapcsolatos. Továbbá: a kritikában egyáltalán nem térek ki Monok pályázatára azon egyszerű okból, hogy nem nyert, tehát az ő pályázata nem releváns abból a szempontból, hogy milyen lesz az OSzK jövője, márpedig engem éppen ez érdekel, ezt próbálom kiolvasni Sajó Andrea pályázatából is.

Botrányosnak tartom, hogy egy OSzK főigazgatói poszt elnyerhető egy 18 és 1/3 oldalas (53 000 karaktert tartalmazó) pályázattal. Állítom, hogy ez a terjedelem nem alkalmas arra, hogy bármely jelölt meggyőzze a bírálókat, hogy nem csak a célokkal kapcsolatban vannak elépzelései, hanem a megvalósítás módjával, ütemezésével és erőforrásigényével is tisztában van. A pályázat nem sok konkrétumot tartalmaz a megvalósítással kapcsolatban; kirívó, hogy számadatok szinte egyáltalán nem, költségek pedig végképp nem szerepelnek. Úgy tűnik, hogy ezek a szempontok a fenntartó számra nem fontosak. Ha viszont ez igaz, akkor az újdonsült igazgatónő sem remélhet sok jót tőlük.

A pályázatból számomra nem jelenik meg egy átfogó könyvtár-vízió. Néha belemerül részletekbe, néhol csak felsorolást és 'stb.'-ket tartalmaz. A szöveg egy jelentékeny része olyannyira általános, sőt továbbmegyek: tankönyvpapír-ízű, hogy azt bármely tetszőleges könyvtárra, sőt néhol bármely intézményre alkalmazni lehetne. A szöveg nyelvezete nem arról árulkodik, hogy a szerző túl sok tapasztalatott szerzett volna az írásművészet gyakorlásában, gyakran enged a közhelyes fordulatok és a hivatalnokstílus csábításának (három példa, hogy világos legyen mire gondolok: "az 1952-től kiadásra került dokumentumok", "hiszen minden tevékenység egy-egy kis mozaik", végül "rendelkezik … üzleti szemléletű menedzser vénával"). Sajnos bennmaradt néhány helyesírási- vagy tollhiba is ("elektronikus fizetés mód bevezetése", "Z 39.50", "portáltecnológia"). Felejtsük el a pályázat nyelvi rétegét, mert a tartalom mellett ez nem érdekes - térjünk vissza a könyvtári vízióhoz.

Ami nagyon szimpatikus, hogy a pályázó felismerte, hogy az olvasó számára a dokumentumtípusok szerint tagolt rendszer értelmetlen. Ha teszem azt Sárazsadányról szeretnék informálódni, nem számít, hogy mi az adat forrása, illetve hadd dönthessem el én, hogy számít-e vagy sem. Ugynakkor nem világos, hogy mi is a megvalósítandó tevékenység, hiszen olyan programokat is sürget, amelyek nem tartoznak bele az OSzK igazgatójának döntési körébe. Például össze kellene vonni az ODR-t és a MOKKÁT, egyetérthetünk, de mind a kettő (ahogy tudom) konzorcium, vagyis az OSzK-nak csak egyetlen szavazata lehet a kérdésben. Össze kellene vonni a MATARKÁT és a HUMANUS-t - itt lényegében ugyanez a helyzet. Nem világos, hogy az OSzK vezetőjének mik lesznek ebben a kérdésben a lépései? Milyen érvekkel fogja meggyőzni a konzorciumi tagokat és a fenntartókat? Egekig dícséri a Könyvtárportált ("fantasztikus kezdeményezés"), de nem tisztázza azt a kérdést, hogy hogyan kellene a Könyvtárportálnak és az összevont ODR-MOKKÁNAK együttműködnie, vagy ezeket is össze kellene-e vonni.

Szintén szimpatikus a feladatorientált, lapos szervezet modellje. Nagyon drukkolok neki, hogy az OSzK-n belül tapasztalható széttagoltságot sikerüljön megszűntetnie és tényleg "egy irányba húzó" munkatársi gárdát sikerüljön kialakítani. Node: itt is hiányzik néhány konkrétum, leginkább annak a problémának a felvetése, amit például Reisz T. Csaba a MOL igazgatói pályázatában hangsúlyozott: az informatikai szakembergárda átlagosnál is nagyobb fluktuációja. Személyes tapasztalatból tudom, hogy ez a probléma még a nagy amerikai könyvtárakat is érinti, hiszen ott az informatikus számára az a dilemma: az egyetemi könyvtárban dolgozzak, vagy a IBM-nél? Márpedig Sajó Andrea egyik fő törekvése az OSzK szolgáltatásainak virtualizálása, aminek lépéseről a pályázat más helyein gyakorta értesülhetünk, sőt a pályázó ki is jelenti "A nemzeti könyvtár egyik új, lényeges feladatköre, hogy a digitális tartalom szolgáltatásában követhető, példamutató éllovas legyen.". Hogyan lehet éllovas egy olyan intézmény, melyben (tudomásom szerint) nem dolgozik hivatásos programozó (ezért települt a MOKKA-R és a Humanus Szegedre, Bozóhoz)? Továbbá: az osztályok a legjobb tudomásom szerint jelenleg is feladatkörök szerint vannak szervezve (pl. tájékoztatás, bibliográfiai feltárás stb., sőt tudomásom szerint egy olyan csoport is létezik - amit a pályázó hiányol és létrehozni kíván - mely teljes idejét webtartalmak előállítására fordítja) - valószinűleg csak az arányok kérdésesek. Vitatnám továbbá a következő mondatot: "Továbbra is működnek néhány főből álló szervezeti egységek (osztályok), melyek így nem hatékonyak." nem hiszem ugyanis, hogy egy szervezeti egység hatékonysága a nagyságán múlna - gondolom a szerző is inkább azt akarta mondani, hogy vannak (ilyen-olyan okok miatt) nem hatékony osztályok.

A pályázó néha belemerül részletekbe, például a szabadpolcos állomány adományokkal való feltöltése kapcsán sorjáznak az ötletek - bár némiképp szkeptikus vagyok abban, hogy pont az olvasók nagyját adó szegény bölcsészek fognak olyan értékes kézikönyveket adományozni, melyekre a könyvtárnak nincs pénze, de legyünk inkább optimisták. Máshol kardinális kérdések megoldási javaslatai, vagy egyáltalán felvetése került a 'stb.' kategóriájába.

Sajnálatos, de néhány ténybeli tévedés is található a pályázatban. Például állítása szerint a LibriVision-ben nincsenek analitikus rekordok. Ez csak abban az esetben igaz, ha az analitikus rekordokat a folyóirat-tartalomjegyzékek feltárásának eszközeként gondoljuk el, és megfeledkezünk a tanulmánykötetek tartalomjegyzékének feltárásáról (megjegyezném, hogy ez mint olvasónak komoly gond, hogy a tanulmánykötetek tartalomjegyzéke hol fel van dolgozva, hol nincs, a feldolgozottak pedig hol teljesek, hol nem - de erről a pályázatban nincs szó). Kérdéses tehát (számomra legalábbis az), hogy az idézett 1 millió monográfiából mennyi az ilyen analitikus rekord. Sajó számítása szerint az összes 8,6 millió dokumentum 3-5 éven belül feldolgozható, ha egy ember évi 200 napon napi 20 rekordot feldolgozna. Ha a már meglevő 1,6 millió dokumentumot levonjuk, és eltekintünk az analitikus feldolgozástól, akkor a 7 millió dokumentum feldolgozása 1750 munkaévet jelent, vagyis 5 év alatt csak akkor teljesíthető, ha 350 munkatárs dolgozik a feladaton (a jelenleg állomány kb. 500 fő) - ki-ki döntse el, hol a számítási hiba. A pályázó egy szót sem ejt a már feldolgozott, de nem Amicusban rögzített adatok (pl. a teljes Petrik, vagy a kézirattár katalógusa) átvételének lehetőségéről vagy a konverzió és az újbóli rögzítés költséghaszon-összevetéséről, se arról a kézenfekvő, és az OSzK-ban is alkalmazott módszerről, melynek során külső cégek végzik az adatbevitelt (az amerikai könyvtárak például Indiában vagy a Fülöp-szigeteken végeztetik az adatrögzítést).

A raktárak kérdése külön fejezetet kapott, de nem világos, hogy mennyire égető a kérdés: mikor szorul ki a könyvtár a meglévő helyről? Öt év? 25?

Szintén fontos kérdés az OPAC kérdése. Én - a pályázótól eltérően - különválasztanám az adatok előállításának és az adatok prezentációjának, keresésének kérdését (mellesleg ez utóbbit a szakirodalom és a library 2.0-ás gyakorlat is külön, "discovery interface" néven kezeli). Az Amicus leváltását nagyon óvatos hangon veti fel, érdemes idézni: "Az elmúlt évek tapasztalatai tehát arra engednek következtetni, hogy mindenképpen meg kell fontolni az AMICUS cseréjét". A problémáim: 1) nem biztos, hogy egyetlen „monolitikus” (ez nem Sajó Andrea kifejezése) integrált rendszert kellene beszerezni - lehet, hogy egy olyan csomag is megteszi, melyek alkotórészei szabványos felületeken (MARC, Z39.50, NCIP, SRW/SRU, OAI-PMH stb. stb.) együttműködnek egymással. 2) Naív elgondolás azt hinni, hogy az "az OSZK könyvtári rendszere kiemelt jelentőségű referenciahelyként is szolgálhatna" - ennek a mondatnak a folytatása ugyanis az szokott lenni: "épp ezért adjátok ingyen/olcsón". Ez lehet, hogy hatásos egy stat-up esetében, de nem hiszem, hogy jelentős árkedvezményt lehetne kicsikarni nemzetközi piacvezető szolgáltatóktól. 3) Nagyobb hangsúlyt adnék annak a szempontnak, hogy a szoftver megvételével ne álljon elő a beszállítóhoz-kötöttség (vendor lock-in) helyzete, amikor a könyvtár, vagy egy általa megbízott harmadik fél nem nyúlhat bele a szoftverbe. Már az is nagy eredmény lenne, ha a szoftvercsomag egy része ilyen lenne. 4) a szerencsésebb éghajlatú országokban a folyóiratok analitikus feltárását nem könyvtárak végzik, hanem a tartalomszolgáltatók (Elsevier, Thomson, JSTOR, és a többi), ennek megfelelően ezek az adatok nem is találhatók meg a saját adatbázisban, hanem API-kon keresztül csatlakoznak a könyvtári rendszerhez. Ennek megfelelően felteszem (de ha ez nem így van, akkor javítson ki, aki ezt olvassa) hogy legalábbis nem triviális a folyóirat-feltáró modul megléte. 5) A digitális tartalmat a pályázat "csatolható objektumként" képzeli el. Remélem ez nem azt jelenti, amire általában gondolni szoktak: vagyis nem egy strukturálatlan, csak teljes szövegűen kereshető, vagy csak képként elérhető fájl lebegett a szerző szeme előtt, hanem jól struktúrált szövegek kezelésére IS képes alrendszer.

Végezetül: Sajó Andrea pályázatában is visszaköszön az a hübrisz, ami úgy tűnik valami sajátos magyar lelki alkatra vezethető vissza, melynek legfőbb megnyilvánulása, hogy az adott vezető (mindegy, hogy a közintézmények mely ágazatát vesszük, a miniszterelnököktől a polgármestereken át a könyvtárigazgatókig) valamiféle (vérmérséklettől föggően: világ-, európai, közép-európai, kárpátmedencei és így tovább) centrumot látnak bele az intézménybe. Sajnos a szomorú valóság ezzel a csodálatos vízióval az, hogy néhány éven belül ezeket megvalósíthatatlanságuk miatt egy más víziók váltják fel. Vezető digitális tartalomszolgáltatóvá a könyvtár nem válhat úgy, hogy nincs meg a megfelelő szakembergárdája (most sajnos bizonyos területeken ez a helyzet, részben az általános világhelyzet okán), vagy ha dokumentumok másolásától való félelmében irreális technológiai célkitűzéseket támaszt (pl. képernyőképet se lehessen készíteni a tartalomról). A pályázat nem ejt szót egy fontos problémáról: a könyvtár saját maga megtermelte bevételének jelentős részét épp a digitális máslatok készítése adja. Csakhogy ez azzal jár, hogy ezeket csak az az ember látja, aki ezeket megfizeti - a többiek számára ezek láthatatlan dokumentumok. Vagyis hiába digitalizál a könyvtár dokumentumokat, ezek igazából nem csökkentik a kutató költségét, nem terjesztik a tudást széles rétegeknek (ami a könytár alapcélja lenne), sőt talán erőforrásokat von el a nyilvánosságnak szánt digitalizálás elől. Nem foglalkozik a pályázat a digitalizálás stratégiájával sem: mit digitalizáljon és hogyan (képként? nem struktúrált szövegként? cizellált XML-ként?)? Hogy viszonyuljon a könyvtár a "dolgok internete", az "összekapcsolt adatok" vagyis a szemantikus web kérdéséhez? Hogy viszonyuljon (a dorgáláson kívül) a könyves világ egyéb résztvevőihez?

Összegezve: ez a 18 és 1/3 oldal inkább csak újabb, az igazgatónő elképzeléseivel kapcsolatos kérdéseket vet fel, és nem kaptam választ arra az alapkérdésre, hogy az OSzK mit is fog csinálni a következő 5 évben. Előremutató lépés a digitális tartalmak kezelése és a szervezeti átalakítás, de a dolgozat alapján nem világos ezek konkrét formája. A pályázó mentségére legyen monda, a szöveg nem egy pontján kifejti, hogy ezt-vagy-azt a kérdést még alaposan meg kell vizsgálni. A döntéshozók felelősségét ezek a kitételek nem mentik.

Király Péter