Filed under: Utveckling

Skapa samsyn på registrering av publikationer – ”Praxisarbetet” med SwePub

Som vi tidigare berättat om i samband med projekt vidareutveckling av SwePub, har praxisgruppen börjat arbetet med Nationella riktlinjer för dataleverans till SwePub av forskningspublikationer för analys, och arbetet är nu i full gång! bild_riktlinjer

Vi vill därför passa på att berätta mer om vad vi gör i arbetsgruppen. Vi som arbetar med praxisdelen heter Pieta Eklund (HB), Mikael Graffner (LU), Bodil Gustavsson (SU), Taeda Tomic (SLU), David Scheutz (KTH) och Jessica Lindholm (sammankallande KB).

Syftet med arbetet är att skapa samsyn på registrering av publikationer inför leverans till SwePub, hur formatet ska tillämpas, vilket innehåll som krävs med särskilt fokus på problemområden kring publikationstyper och hur de ska kunna registreras och skickas vidare till SwePub på ett sätt som möjliggör rimliga analyser.

I en första iteration har vi tagit oss an vilket innehåll som kan tänkas behöva finnas i SwePub, genom att sammanställa ett nytt underlag med publikationstyper som baseras på de nuvarande i SwePub, med utökning av outputs från CASRAI. CASRAI är ett initiativ kring att skapa interoperabilitet för beskrivningar av forskningsinformation, som kan underlätta uppbyggnad och utbyte av information i det svenska ekosystemet för forskningsinformation och i förlängningen i internationella sammanhang. Du kan läsa mer här, www.casrai.org.

SwePub behöver förstärkas för att täcka den konstnärliga forskningen och en genomgång av det som redan nu är möjligt i SwePub ses samtidigt över, till exempel avseende konferensbidrag. Vi har hunnit med att skicka ut ett första underlag för återkoppling till de som gör analys, till det konstnärliga forskningsområdet och till leverantörer av data till SwePub. Vi har fått mycket gensvar kring underlaget och arbetar nu med att sammanställa och finputsa praxis kring vilket innehåll som verkar mest nödvändigt att ta med för analys.

Nästa iteration kommer att behandla upphovspersoner – deras IDn, affilieringar, roller, antal, namn och födelsedatum. Några exempel på utmaningar är att definiera vilka upphovsmannaroller som ska kunna uppges och hur och när de ska kopplas till den organisation de tillhör, och så vidare.

Har du frågor om praxisgruppens arbete, hör gärna av dig till gruppens sammankallande, jessica.lindholm@mah.se, eller någon annan av oss i projektet.

3 kommentarer 24 april, 2014 Marja Haapalainen

Statusrapport Libris nya katalogiseringsverktyg

Arbetet med Libris nya systemarkitektur (Libris XL), formatprojektet och det nya katalogiseringsverktyget går för högtryck under våren.

Vi arbetar i utvecklingssprintar om vardera ca två veckors arbetstid. Varje sprint inleds med ett planeringsmöte för den kommande arbetsperioden där vi bestämmer vilka arbetsåtaganden vi tar på oss. Sprinten avslutas med en demo där vi går igenom det som utvecklats. Vi uppdaterar även betaversionen  med de implementerade förändringarna. En grundprincip för utvecklingsarbetet här på KB är att vi vill arbeta för “öppen ridå”, vilket innebär att vi bjuder in användare att följa pågående utvecklingsarbete. Förändringarna kan ibland se märkliga ut, funktionalitet som tidigare fungerat kan vara icke-funktionell vid ett senare tillfälle, data kan ibland innehålla svårbegripliga värden osv. Detta beror på att vi är mitt i utvecklingsprocessen, vilket också speglas i Betan som uppdateras ett par gånger per månad. På startsidan går det också att hitta kontinuerligt uppdaterade informationstexter om projektet, presentationer, story maps, beskrivningar och visualiseringar av formatarbetet med mera. Dessutom sammanfattar vi då och då det vi gjort och publicerar här på Librisbloggen.

Nedan följer en summering av vad som hänt i utvecklingsarbetet under senaste tiden.

Formatet
1. Egenskaper om verket och det/de format (bärare) som finns i posten har mappats ur de fasta fälten 008 och 007. Detta arbete har successivt lett till en revidering av beskrivningsstrukturen, för att kunna fungera sammanhängande för beskrivning av bland annat upprepade bärardetaljer. Mer detaljerad information om bärartyperna kan nu också ses i gränssnittet. Detta är exempel på data som än så länge ser något kryptiskt ut på grund av värdet innehåller ett påhängt JSON-LD-prefix vilket naturligtvis ska städas bort.

En utmaning ligger i att MARC-formatet saknar bra stöd för att gruppera beskrivningar av olika ting i en och samma post, vilket leder till upprepningar som är svårtolkade (t.ex. vid upprepning av 007, och kombinationer av fält såsom 034, 255, 300, 530 och 856). I arbetet med strukturen måste hänsyn även tas till nya typer av resurser som ska katalogiseras i framtiden, så att vi inte komplicerar beskrivningsmönstren för dessa i onödan.

2. Ett antal definitionslistor har tagits fram, vilka representerar värden för ovanstående egenskaper. En del av dessa kommer att behöva genomgå konsolidering med annan information, inte minst genre/form, samt information angiven i de nya RDA-fälten (336-338).

Vi arbetar för närvarande med att göra dessa sökbara via katalogiseringsgränssnittet.

3. Koordinering har gjorts av olika kombinationer av ”medietyp” och ”bibliografisk nivå” i postetiketten, liksom av detaljer i innehålls- och formattyp i 007 och 008. Detta har gjorts främst med hänsyn till BibFrame, men även till andra bibliografiska modeller såsom Dublin Core. Samma problem vid upprepning gäller här, varför vi behöver hålla isär olika aspekter på vad som i många fall rimligtvis är samma ting.

4. Flera egenskaper har mappats, vilka vi kopplar ihop med direkta motsvarigheter i BibFrame där det är möjligt, bl.a. för titlar och anmärkningar.

Vi kommer att fortsätta med att normalisera denna struktur, bl.a. för att möjliggöra ett förbättrat utnyttjande av verksbeskrivningar i auktoritetsposter. Normaliseringen fortsätter också med översyn av fler egenskaper, så att de anges på ett enhetligt sätt och i möjligaste mån korresponderar mot befintliga termer i välkända vokabulärer.

Frontend
I gränssnittet har vi under våren jobbat mycket med träfflistan, remotesök och fullposten. Remotesök är nu implementerad och fungerar skapligt. Värt att notera är dock att det går mot en testmiljö där endast ett fåtal källor fungerar. För att testa funktionaliteten föreslår vi att man söker mot Library of Congress eller Eesti Rahvusraamatukogu (Estlands nationalbibliotek).

I fullposten finns det nu fler fält och mer information, framför allt utökad titelinformation och anmärkningssektion.

Backend
Vi har byggt om lagringssystemet i backend för att på ett mer strukturerat sätt kunna hantera mängden data. Med den förändringen kommer också versionshistorik på poster, vilket innebär att systemet istället för att spara över förändrade poster sparar en ny version med det senaste datat. Det innebär att man kan gå tillbaka till tidigare versioner av poster om man skulle vilja.

Mycket arbete har lagts ner på optimering av datahantering och indexeringar och bearbetning av datat går mycket snabbare nu än tidigare.

Lina planering

1 kommentar 15 april, 2014 Harriet Aagaard

Ny version av Libris fjärrlån – välkomna att använda!

Välkomna att testa vår nya version av Libris fjärrlån. Gränssnittet har uppdaterats och ny funktionalitet har lagts till med anledning av Saga-systemets nedläggning.

Den nya och den äldre versionen av Libris fjärrlån kommer att fungera parallellt fram till 2 juni då den äldre versionen släcks ned.

I Libris webbsök länkas det till den äldre versionen av fjärrlånet. Det finns en sökfunktion i Libris i det nya fjärrlånegränssnittet.

Vi rekommenderar att ni gör en bekanta med den nya funktionaliteten i testversionen innan ni börjar använda systemet.
Testversion: http://iller.libris.kb.se/illse (ingen inloggning, ange bara sigel+handläggare)
Skarp version: http://iller.libris.kb.se/librisfjarrlan (vanlig inloggning med web**/lösenord)

Kort beskrivning av ny funktionalitet

Inom kort kommer det att finnas hjälptexter i gränssnittet.

Sökfunktionalitet

Förutom beställningsnummer går det att söka på titel, författare m.m.

Utlån

Reservationer
  1. Förutom att visa inkommande önskemål om reservationer finns nu en extra vy för att plocka fram beställningar som redan har blivit reserverade.
  2. En reserverad beställning kan nu
    1. Tas bort (får status ”Negativt svar”)
    2. Sättas till reserverad
Utskrifter

En förändring är att en beställning automatiskt köas för utskrift när den är ”öppnad” och återfinns under ”Utskriftskön”.

Inlån

Kan reserveras

En beställning med status ”Kan reserveras” kan nu avbrytas genom att välja ”Ingen reservation”.

Anlända
  1. Det finns nu undervyer för ankomstregistrerade, kvitterade, omlånade samt återlämnade.
    En beställning försvinner från vyn så snart returdatum satts.
  2. Vid retur kan man nu skriva ut en packningsslip. (Dyker upp en knapp med ett kuvert).
  3. E-post skickas till låntagaren vid ankomstregistrering. Om beställningen inte gjorts från en låntagarbeställning får man fylla i e-postadressen manuellt.

OBS! Under Inställningar kan man redigera en mall för detta e-postmeddelande.

Negativa svar

Beställningar med status ”negativt svar” kan tas bort från vyn ”Negativa svar” men kan fortfarande sökas fram.

Meddelandefunktion

På varje beställning finns nu en meddelandefunktion (Diskussion). Klicka på knappen ”Visa” för att se diskussionen och göra ett inlägg. I menyn visas antal nya meddelanden bredvid rubrikerna Utlån och Inlån.

Om man gör ett inlägg som beställande bibliotek kommer det synas hos aktivt bibliotek bredvid Utlån.

Om man gör ett inlägg som aktivt bibliotek kommer det synas hos beställande bibliotek bredvid Inlån.

Vem som helst kan i och för sig göra ett inlägg, men systemet beaktar endast beställande och aktivt bibliotek när det räknar antal nya meddelanden.

För att testa funktionen:
  1. Ta fram valfri beställning under Utlån.
  2. Vid Diskussion (direkt under beställningsinformationen), klicka på ”Visa”.
  3. Skriv något och klicka på ”Nytt inlägg”.
  4. I sökrutan skriv login:<sigel för det bibliotek som gjort beställningen>
  5. Vid Inlån i menyn bör ny synas en orange etikett med siffran ett. Klicka på denna.
  6. En vy med olästa meddelanden för inlån dyker upp. Om man öppnar beställningen sätts den till läst och listan med diskussionsinlägg öppnas automatiskt.

Notera att om man vill skicka ett meddelande i samband med olika uppdateringar bör man skriva meddelandet *innan* man gör uppdateringen (t ex svar/remiss).

Kontakta Libris kundservice för frågor (libris@kb.se)

2 kommentarer 26 mars, 2014 Maria Kadesjö

Förstärkning i SwePub-projektet

JessicaVi är glada över att ha rekryterat Jessica Lindholm till projektet Vidareutveckling av SwePub! Jessica rivstartade den 10 mars och kommer att arbeta särskilt med frågor kring SwePubs praxis vid dataleverans av forskningspublikationer för analys.
Dagar då hon inte arbetar hos oss hittar vi henne på Malmö högskola.
Jessica har arbetat med frågor kring metadata och publicering inom och utanför Sverige sedan år 2000.
Varmt välkommen Jessica!

1 kommentar 17 mars, 2014 Marja Haapalainen

SwePub för analys – statusuppdatering

Projektet Vidareutveckling av SwePub är i full gång med aktiviteter sedan januari inom tre huvudspår: Analys, Praxis och MODS.
Analys
Projektgruppen jobbar med kravfångst av analysbehov hos Vetenskapsrådet. Vi undersöker deras behov och hur krav kommer att se ut i nya resursfördelningsmodeller. Vi berättar om vad som är möjligt att göra med data i nuläget i SwePub och vilka förändringar som införs.
Projektet kommer att anordna en workshop med SUHF bibliometriarbetsgrupp för att ta reda på vilken bibliometri som görs på lärosätena idag och vilka framtida behov denna målgrupp ser. Intervjuer med ett antal forskningsfinansiärer planeras också som komplement till underlag från Vetenskapsrådet.
Resultatet av detta spår förväntas bli en kravbild på data som behövs i SwePub för att uppfylla analysbehoven hos dessa två målgrupper, forskningsfinansiärer och lärosäten.
Tills dess att analysbehoven blir konkretiserade jobbar projektet med hypotetiska behov inom Praxis och MODS.

Praxis
Arbetsgruppen Praxis har träffats och börjat arbetet med Nationella riktlinjer för dataleveranser och praxis – forskningspublikationer till SwePub. Arbetet inleds med att se hur man kan stödja analys av publiceringskanaler per organisation, utifrån antagandet att:

Fler och bättre definierade publikationstyper stödjer analys av publiceringsfrekvens fördelat på publiceringskanal/publikationstyp och innehållsanmärkning (refereegranskat, övrigt vetenskapligt eller populärvetenskapligt) per organisation.

Vad krävs för praxis vid dataleverans blir frågan för arbetsgruppen. Problemområden är tex hur konferensbidrag och konstnärlig forskning ska kunna registreras på ett sätt så att det går att göra rimliga analyser.

MODS
Fokus MODS är inne på tredje iterationen av formatöversynen och uppdateringen. Varje iteration utgår från ett hypotetiskt analysbehov och leder till en delversion av Formatspecifikation för SwePub MODS. Det går alltså redan nu att börja leverera data enligt version 2.2. Målet är version 3.0 då det viktigaste elementen som är kopplade till analysbehov finns definierade. Detaljerad information om formatreleaser skickas ut på Swepub sändlista.
Första iterationen utgick från att stödja retrospektiva analyser: vad har publicerats vid en organisation. Antagandet här var att:

Identifiering av författarnas affilierade organisationer möjliggör författarfraktionerad statistik över antal publikationer per organisation.

Vilket data och vad krävs av det blev utmaningen för fokusgruppen. Resultatet blev införande av identifierare för organisationer liksom uppgift om antal upphovspersoner per publikation. Dessutom det viktigaste – hur forskarens affiliering ska kopplas till organisationsidentifieraren.
Andra iterationen stödjer prospektiva analyser: vad har forskare vid en organisation publicerat. Antagandet här var att:

Identifikatorer för forskare och publikationer möjliggör analys av vilken potential forskare vid organisationen har oavsett organisationstillhörighet.

Resultatet blev bla att den globala identifieraren ORCID infördes och hanteras nu både i formatet och systemet.

bild_system_praxis_mods_analys
SwePub för analys
Den prototyp som togs fram har utvecklats till ett system med alla relevanta komponenter på plats, motsvarande en Minimum Viable Product. Befintligt inflöde av data till SwePub söktjänst utnyttjas och nya regler för identifiering av dubbletter finns inplementerat och kommer att förbättras allt eftersom nytt data kommer in i systemet. Datat konverteras från MODS till RDF och bor i en sk Triple store. Arbete pågår även kring integrering med Libris XL. Vi kommer att tillgängliggöra API:er till lärosätena och Vetenskapsrådet så att de kan skicka in frågor till systemet för att fånga upp data till analyser.
Vi arbetar i en iterativ process som bygger på idégenerering, datainsamling (metadata och ny kunskap!), analys och ständigt lärande. Ambitionen med systemet är att:
• Fånga upp problem tidigt och arbeta med modifieringar av de krav och lösningsförslag som tas fram i format- och praxisfrågor, samt se hur vi kan trolla i systemet.
• Hålla fokus och tillsammans med projektets intressenter dvs lärosätena och forskningsfinansiärerna definiera krav på vad som är relevant och tillräckligt.
• Testa data mot analysbehov och ge Vetenskapsrådet och lärosätena möjlighet att göra analyser och få kontroll på data och dess utgångsläge samt se vilka möjligheter som finns.

Som stöd i arbetet med datakvalitet och analyser tillhandahåller projektet ett analysverktyg. Med det kan man ta fram underlag till arbetet med datakvalitet då verktyget möjliggör koppling till källdata (MODS-poster). Det är också möjligt att se status på egna data i jämförelse med övriga lärosäten, samt att stämma av egna data mot analysbehoven. Analysverktyget blir också den metod som projektet använder för att kommunicera och visualisera hur data utvecklas.

2 kommentarer 13 mars, 2014 Marja Haapalainen

Design kring upphovsrättsskyddat material – VDD

En av hypoteserna denna vecka har varit att försöka hjälpa användaren att hitta relevanta träffar även utanför KB:s väggar. Det är inte mycket man får visa externt för användarna, men med en hel del innovativa idéer lyckades vi få fram något som åtminstone kan ge en hint om att materialet är relevant. Idéskisserna gav bra utfall i testerna, men eftersom lösningarna inte har testats med jurist ännu så väntar vi med att visa upp dessa.

Upphovsrättsskyddat material en besvikelse
Testresultatet från användarna visar att det kommer finnas en besvikelse över att man inte kommer åt den större delen av materialet hemifrån, men samtidigt ser testpersonerna fördelen med att kunna söka i fulltexten och se relevanta träffar (referenser) jämfört med att rulla mikrofilm. Det kommer snabba upp processen avsevärt: “Ja…om de [sökord] kunde vara längre. Man kan ju söka hemma och sedan komma hit och läsa hela. Det spar ju tid”, “Ja, det där är ju inte så bra när det blir så där [om upphovsrättsskyddat material]. Men bra med citaten [sökord]. Det där händer ju ofta, det är mycket som man måste komma hit för att läsa [150 års upphovsrättskydd]. Det är ju en jättelång tid [som är skyddad]!”, “Är de lösenordsskyddade? [Förklaring] Åh, så det är begränsat. Det är klart att det upplevs som… ja… först blir man konfunderad, sedan irriterad att man inte får komma åt allt.”

Förenkla med favoriter
Vi har också arbetat med att ta försöka förenkla arbetsprocessen för användaren genom att ta fram design för att spara favoriter, tex tidningssidor, sökning eller liknande händelser. På så sätt kan användaren sitta hemma och favoritmarkera tidningssidor och ta med till KB för läsning.

favoriter

Startsida med fokus på sök och utforska
Design för startsidan har också tagits fram och testats. Det blev tre olika pappersskisser. En med fokus på sök där man får ganska sparsmakad information om innehållet [bild 1], en där man kan börja interagera med datat direkt [bild 2] och en där man får en visuell bild av innehållet [bild 3]. Testresultatet visade att den enkla var att föredra [bild 1], men med möjlighet att kunna komma igång genom något inspirerande inslag. Vi tog därför fram ytterligare en variant som testades [bild 4] och föll väl ut.

start

Andra saker vi har arbetat med under veckan: optimera detaljvyn, sidpaginering, implementera facetter och datavisualisering, arbeta vidare med ordrummet och indexering av bilder.

Nu tar vi uppehåll och återupptar arbetet senare i vår.

Kommentera 28 februari, 2014 Johanna Olander

Utvecklingsresan för VDD fortsätter

Idag påbörjar vi vår tredje “fokus”-vecka i utvecklingen av VDD. Den här veckan tar vi fram design för hur tjänsten kommer att se ut när man befinner sig utanför KB, och hur den kommer att fungera när man befinner sig här på plats. En stor del av materialet är upphovsrättsskyddat och enbart åtkomligt via datorer på KB, men vi vill samtidigt göra det möjligt för användaren att kunna sitta hemma och göra förarbete, titta på referenser och försöka avgöra om innehållet är relevant. Vi jobbar därför med att försöka extrahera så mycket information som möjligt utan att kliva över gränsen för vad som är upphovsrättsskyddat. Vi kommer att ta fram design för följande:

Externt gränssnitt

  • Se skillnad på fritt tillgängliga och upphovsrättsskyddade tidningar
  • Avgöra om referensen är relevant genom att visa sökord och synonymer (extrahera från fulltextanalys/ordrummet)
  • Spara favoriter (länkar till relevanta sökträffar) och öppna på KB för att läsa hela tidningen
  • Se enbart fritt tillgängliga
  • Se var man kommer åt de upphovsrättskyddade tidningarna

Lokalt gränssnitt (KB, än så länge)

  • Ta fram lista med favoriter och läsa direkt
  • Läsa tidning (ej skriva ut, ej mejla, ej klipp- och klistra)
  • Navigera utan webbläsare

Vi har också utökat effektkartan med en drivkraft om att man vill ha åtkomst var man än befinner sig. Detta är naturligtvis inte fullt genomförbart på grund av upphovsrättslagen, men vi ska göra allt för att stödja användaren i så stor utsträckning som möjligt.
Effektkarta VDD (3)

Veckan kommer också ägnas åt att färdigställa och testa filterfunktionen, generera data till filter genom fulltextanalys (ordrummet), ta fram interaktion för tidningssidan, påbörja startsidan, arbeta med favoriterna osv. Rapportering sker som vanligt direkt från Mikrofilmsläsesalen.

3 kommentarer 24 februari, 2014 Johanna Olander

Från bakelse till en nästan färdiggräddad kaka

Andra veckan av Visningsgränssnitt för digitala dagstidningar (VDD) är avklarad. Vi startade projektet med att ta fram en sk bakelse och den här iterationen satsade vi på en kaka och nådde nästan ända fram. Resultatet blev användningstestade grafiska skisser, logik och embryo till digital prototyp för filter. Vi har också tagit fram en stabil grund för applikationen, byggt kopplingar mot KBs digitala arkiv och påbörjat arbetet med ordrummet. Under de här dagarna satsade vi lite extra på att testa olika filterlösningar och arbeta med datavisualisering vilket slukade en stor del av veckan, men det var väl värt insatsen. 

Innovativ filterlösning
En hel del tid har gått åt till att skissa på filter. Multichoice-filter är i regel svåra att förstå, men eftersom NOT-logiken kan vara användbar då man vill utesluta datamängder som genererar brus valde vi att implementera den traditionella logiken för att avgränsa med möjlighet att ta bort en viss delmängd. Genom att aktivt ändra till NOT-läge kan användaren ta bort önskad delmängd, se bild. Det kändes kul att testa en ny lösning som vi inte tidigare sett någonstans och testresultatet visade att logiken var glasklar. Eftersom funktionen med NOT-logik först kommer bli användbar när vi kan filtrera på relaterade händelser/taggar, så har vi den avstängd tills vidare.

skiss

Visualisera tiden
Att filtrera på tid är en av de mest eftertraktade åtgärderna för tidningsanvändarna. De vill enkelt kunna ta ut en träffmängd för ett visst datum eller en viss tidsperiod. Vi gjorde därför en satsning på att visualisera tiden, vilket visade sig falla väl ut bland testanvändarna.

Stabil grund att bygga vidare på
Förra gången flöt arbetet på i en rasande takt. Den här gången hade vi inte riktigt samma tempo i att få ut skisser för test, förmodligen pga klurigare interaktion och logik för filter. Vi bytte också ramverk till Bootstrap och React vilket tog lite tid. Denna gång har vi även jobbat med kopplingar mot KBs digitala arkiv, Mimer, och lagringsplattform där de digitaliserade dagstidningssidorna bor i vanliga fall. Det känns tryggt att ha en stabil grund att bygga vidare på v 9 då projektet samlas i Mikrofilmsläsesalen igen.

Alla hjärtans dag även för oss
Vi kunde inte motstå att testa prototypen från förra iterationen på våra testpersoner den här gången också och fick mycket kärlek: ”Oj, så fort! Det är ju perfekt! Vad bra! Kan jag förstora? Ah….[skrattar] Fantastiskt! [läser]”, ”Titta vad fint! Vilken fröjd! Det är ju inte klokt, det är så tydligt!”.

7 kommentarer 14 februari, 2014 Johanna Olander

Bubblor visar omappade MARC-data

Med Libris XL kommer vi som bekant att lämna MARC21 som internt lagringsformat och i stället arbeta med en datamodell som bygger på länkad data, JSON-LD (Java Script Object Notation for Linked Data). Alla Librisposter kommer då att representeras som generiskt länkad metadata och vara kompatibla med kontexten i hela den semantiska webben.

För att nå dit måste nuvarande MARC-struktur mappas till den nya JSON-LD-modellen. Mycket har gjorts, men ännu återstår en hel del mappningsarbete. Niklas Lindström – som arbetar i Libris XL-projektet och är en ledande expert inom området länkad data – har tagit fram ett visuellt verktyg i form av bubblor för statistik på vilka MARC-fält och delfält som ännu inte är mappade.

Statistikbbubblorna är intressanta att studera. Man kan se vilka MARC-fält och delfält som är vanligt förekommande och vilka som bara förekommer marginellt. De är också ett verktyg för metadataanlys och prioritering, dvs mappningsarbetet blir mest effektivt om man börjar med de stora bubblorna. Mappningsarbetet får omedelbar effekt på vad som kan vidareutvecklas i katalogiseringsgränssnittet. Det fungerar också som analysverktyg, både för ”återkonvertering” till MARC21 (som behövs för Librisbibliotekens postförsörjning) och för städning av Librisdatabasen.

För att se vilka fält i MARC21 som ännu inte blivit mappade mot JSON-LD i bibliografiska poster

För att se vilka fält i MARC21 som ännu inte blivit mappade mot JSON-LD i auktoritetsposter

De yttre bubblorna grupperar respektive MARC-fält och de inre representerar omappade delfält. Storleken på varje bubbla är baserat på antal poster som innehåller värden för fältet/delfältet. Om du håller pekaren över en bubbla får du information om det faktiska antalet poster samt de fem vanligaste värdena. Du kan också följa hur bubblorna – och relationerna mellan dem – förändras i takt med att mappningsarbetet fortskrider.

Bubblorna fungerar bäst i Chrome och Firefox. Det går att zooma med den vanliga webbläsar-zoomen (Äpple-Plus på Mac, Control-Plus på PC).

I de bibliografiska posterna finns de största bubblorna bland de fält som länkar mellan sammanhörande bibliografiska poster (760-787). Man kan till exempel utläsa att det finns en stor mängd omappad metadata med länkar till en huvudpublikation (772). Majoriteten av dessa är, dels länkar i de poster som KB maskinellt genererar för inflöde av e-plikt och digitalisering (Digidaily), dels länkar som genererades vid den stora konvertering till MARC21 som genomfördes omkring 2001. Fält 041 är kompletterande språkkoder (originalspråk, språk i sammanfattningar m.m.). Bland de riktigt små bubblorna hittar man också fält som är ogiltiga enligt MARC21, dvs de innehåller okända värden och kan för det mesta rensas bort ur Libris.

”Monsterbubblan” i auktoritetsposter är ett kodfält för nationalitet/verksamhetsområde (043).

Se Libris Fomathandbok [http://www.kb.se/katalogisering/Formathandboken/] för MARC-fältens och delfältens innebörd.

mappningbubblor

4 kommentarer 14 februari, 2014 Harriet Aagaard

KB tecknar avtal med OCLC om CC0-licens

KB har under en längre tid förhandlat med OCLC och vi kan nu informera om att KB och OCLC har tecknat avtal om öppen licens enligt Creative Commons (CC0) [1] för Librisdata med ursprung i WorldCat [2]. Motsvarande överenskommelser har KB tidigare ingått med Library of Congress och tre europeiska nationalbibliotek, British Library, Bibliothèque nationale och Deutsche Bibliothek.

Viss information kan av upphovsrättsliga skäl inte göras fritt tillgänglig (det gäller t.ex. omslagsbilder). Annars ger CC0-licensen ett mer heltäckande stöd, både för Librisbibliotekens katalogiseringsverksamhet, och för de aktörer som vill återanvända och/eller bygga tjänster på Librisdata.

Som ett uppföljande steg har nu också förhandlingarna om medlemskap för KB och Librisbiblioteken i OCLC/WorldCat återupptagits. Som fullvärdiga medlemmar får vi bland annat tillgång till WorldCat för bland annat Copy Cataloguing (s.k. remotesökning).

Vi återkommer med mer information, både om förhandlingarna och om CC0-licensieringen.

[1]. https://creativecommons.org/publicdomain/zero/1.0/
[2]. http://www.worldcat.org/

29 kommentarer 13 februari, 2014 Maria Kadesjö

Föregående sida


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler