Filed under: Utveckling

Verktyg att hantera dubbletter inom SwePub Analys

Dubbletter är något som alla system i alla år har fått hantera. I SwePub finns det dubbletter från olika lärosäten, som en naturlig följd av att alla lägger in publikationer som deras forskare har medverkat i, men även lärosätenas lokala dubbletter. Inom projektet Vidaretuveckling av SwePub har vi tagit fram ett verktyg, Adjudication tool, för att stödja bedömning av dubbletter. För att testa om verktyget fungerar i verkligheten bad vi två lärosäten att prova verktyget på lokala dubbletter. Dessa piloter var Södertörns Högskola och Örebro Universitet.

I visualiseringsverktyget Spotfire finns det en egen score board för dubbletter. Vi har satt algoritmer för dubbletter så att alla potentiella dubblettposter som får över 1,1 vikt i matchningen av identifikatorer, titel, författare och författarantal, publiceringsdatum och källa räknas automatiskt som dubbletter och alla som går under 0,8 räknas automatiskt som icke-dubbletter. Här väger olika faktorer olika, t.ex.ISI-id och DOI har större vikt än ISBN i dubblettmatchningen. Frågan är hur man kan bedöma potentiella dubbletter mellan spannet 0,8 och 1,1, den så kallade gråzonen. Därför har vi tagit fram ett verktyg för att bedöma dubbletter manuellt. Från potentiella dubblettpar i Spotfire finns det länk vidare till dubblettverktyget Adjudication tool där man får upp båda poster för att kunna jämföra och bedöma om de är äkta dubbletter, dubbletter som handlar om samma forskning fast i olika publikationskanaler, eller icke-dubbletter.

Grey zone histogram

Inom Fokus - Forskningskvalitetsutvärdering i Sverige är det meningen att endast ett uttag av forskningsresultatet lämnas till bedömningspanelerna. Då behöver det bedömas om potentiella dubbletter gäller för samma eller olika forskningsresultat,  “same creative work” eller “different creative work”.

Var går gränsen för “same creative work”?

Båda pilotlärosätena konstaterade att det är svårt att bedöma om publikationerna var baserade på samma forskningsresultat, “same creative work”. Ofta publiceras ett forskningsresultat först som konferensbidrag och efter ett eller två år som artikel. Under dessa åren har det förmodligen skett en del processerande av arbetet. Om man inte jämför själva texterna är det svårt att bedöma hur mycket förändringar har skett under tiden mellan två publikationer. Oftast har man inte tillgång till ett konferensbidrag utan då behöver man fråga forskaren. En abstract kan vara till hjälp men två lika abstract i två olika publikationer garanterar inte att det är lika med “same creative work”.

När är två publikationer så pass olika att de kan betraktas som två olika verk? Båda testbiblioteken efterfrågade tydliga riktlinjer från Vetenskapsrådets håll om vad som är “same creative work”. Ska man utgå från t.ex. samma publikationstyp eller år? Det skulle också underlätta att veta vilka publikationstyper inom vissa ämnen som gäller för medräkningen i uttagen för bedömningspaneler så att man vet var man ska lägga sitt krut.

Utan tydliga instruktioner känns det obekvämt för dem som arbetar med kvalitetssäkringen av forskningsinformation att bedöma “same creative work” med kännedomen att det kommer att påverka resursfördelningen. Individuellt gjorda bedömningar utan tydliga instruktioner kan dessutom leda till ojämna uttag beroende på vem som har gjort bedömningen. Annars är det lätt att den ena granskares bedömning skiljer sig från den andras eftersom det i de flesta fall inte finns säker vetskap om två publikationer är lika.

Adjudication tool

Dubbleringsfaktorer

Det finns några faktorer som lätt bidrar till att poster fastnar i dubblettkontrollen. En är identifikator, oftast ISBN, som felaktigt har registrerats på det enskilda bidragets nivå och inte på värdpublikationens nivå. Detta görs i syfte för att öka tillgång men i dubbletthanteringen har det motsatt påverkan. Det bör finnas möjlighet i de lokala systemen att i stället markera ISBN för det relaterade verket i dessa fall, som det beskrivs i formatspecifikationerna för SwePub MODS (kapitlen 4 & 17 i versionen 2.5). Det ska även slås fast i de nationella riktlinjerna för dataleverens till SwePub Analys.

Det är inte heller ovanligt att felaktigt inmatad information orsakar dubbletter som t.ex. manuellt inmatade identifikatorer. Den mänskliga faktorn är ett faktum som vi måste vara medvetna om. Även maskinella importer skapar dubbletter om det inte vid import uppmärksammas poster som redan finns manuellt inmatade men utan identifikatorer såsom ISI och DOI.

En annan faktor som ökar risk för dubbletter är att samma verk läggs in som två olika publikationstyper. Den ena har lagts in som konferensbidrag i proceedings medan den andra har lagts in som kapitel i bok. Där gäller det att hålla koll på vad som är korrekt publikationstyp i sammanhanget. Ibland kan en proceeding till exempel innehålla både konferensbidrag och kapitlar i boken så det kan krävas att fråga forskaren vad som är fallet med hens verk.

Pröva på!

Testlärosätena var nöjda med att upptäcka äkta dubbletter med hjälp av dubblettverktyget. Att bedöma två poster som dubbletter i SwePub:s dubblettverktyg orsakar dock ingen automatisk ihopslagning, varken i SwePub eller lokalt, utan resulterar enbart till att äkta dubbletter hamnar på en “blacklist”, icke-dubbletter på en “whitelist” och dubbletter med samma forskning fast i olika kanaler hamnar på både och. Det påverkar alltså enbart uttagen för analyser. Inga poster försvinner och inga poster slås ihop. Vill man göra åtgärder lokalt, finns det API för att få lista på sina dubbletter.

Vi vill tacka Södertörn och Örebro för att ni ställde upp som piloter! Vi fick värdefull information till  underlaget om behovet av definition av “creative work” som vi tog fram till Vetenskapsrådet. Om fler vill pröva på dubblettverktyget, finns det instruktioner och en egen score board för DuplicateExploreMatches. För dem som vill börja med ett mindre antal dubbletter har vi skapat ett bokmärke där vi har begränsat dubbletterna att gälla lokala sakkuniggranskade publikationer fr.o.m. 2012.

8 kommentarer 31 oktober, 2014 Tuija Drake

Katalogprojektet i slutspurt

Fokus i katalogiseringsprojektet är nu att få formuläret i katalogiseringsverktyget att fungera för flera materialtyper. Under våren undersökte vi katalogiseringsflödet för monografier och gick under tidig höst vidare med seriella publikationer. Detta arbetssätt var dock för långsamt för att vi skulle hinna få ett formulär som fungerar för flera materialtyper färdigt före driftsättning i januari.

Vår strategi har därför ändrats och vi har lagt upp alla tänkbara fält i formuläret utan att ägna tid åt layout eftersom den inbördes ordningen ändras hela tiden. Det formulär ni nu möts av är därför en helt lodrätt uppsättning fält som ännu inte är inordnade i någon funktionell layout.

För att skapa ett lättarbetat formulär har vi lagt ner mycket arbete på att skapa mönster för hantering, tex stänga, ta bort och  lägga till fält. När vi får ordning på datat och på bakomliggande mönster kommer vi att inordna formuläret i en bra layout.

För att kunna lämna Marc21 som lagringsformat har Marc-datat mappats till den nya  datastrukturen JSON-LD. En mycket viktig del i formatmappningen är återkonverteringen till Marc21 eftersom vi under överskådlig tid kommer att vara bundna av att både kunna ta emot, och att leverera data som Marc21. Återkonverteringsarbetet är ännu inte klart, men för att visa vart vi är på väg har vi nu implementerat en första version av förhandsgranskning av posterna i Marc21.

I backend har vi introducerat Apache Camel som vi använder för att hantera flödet av data mellan de olika komponenterna – lagring, fulltextindex och triplestore. Vi lägger mycket tid på att hitta rätta lösningar och förutsättningar för att snabbt kunna importera och bearbeta stora mängder data.

Vi slipar också på detaljerna kring hur vi ska kunna koppla samman LibrisXL med det gamla systemet, så att vi under en period kan samköra dem. Detaljerna innefattar hur XL ska leverera uppdaterat data till det gamla systemet och på vilket sätt XL ska ta emot uppdateringar. När vi driftsätter Libris XL och katalogiseringsverktyget i en första version kommer det att finnas en hel del att fortsätta utveckla. Det innebär att katalogiseringsverktyget inte kommer att täcka det fullständiga katalogiseringsbehovet. Specialmaterial kommer fortsatt att kunna katalogiseras i Voyager tills dess att vi har täckt upp även för detta.

Vi har också påbörjat arbete med autenticering och auktorisering av användare, både mot backend och katalogklient.

Följ utvecklingen i betan: http://kat.libris.kb.se/

2 kommentarer 29 oktober, 2014 Harriet Aagaard

E-böcker är ett populärt ämne

Det diskuteras flitigt kring vårt uppdrag att förmedla e-böcker via Libris, både internt på KB och externt i biblioteksvärlden. Här tänkte jag gå igenom några olika scenarier för realisering av förmedling av e-böcker via Libris.

Scenario 1:

Låntagarna kan söka bland alla förlags e-böcker via en gemensam nationell site, där utlåning sker direkt via KBs/ett nationellt lånekort. Det här scenariot förutsätter dels ett avtal mellan förlagen och SKL för att KB ska få tillgång till e-böckerna och dels en överenskommelse generellt mellan biblioteken att en central portal är den bästa lösningen för låntagarna.

Scenario 2:

Urvals-/inköpsprocessen till den lokala katalogen görs via en nationell portal (i stället för Atingo, Elib eller annan kommersiell systemleverantör) som utvecklas och underhålls av Libris och där alla titlar från alla förlag samlas. Det här scenariot kräver, liksom scenario 1 avtal med förlagen för att kunna realiseras. Det finns rimligtvis även konkurrensaspekter att ta ställning till. Eventuellt genomförande behöver föregås av analys av bibliotekens befintliga administrativa processer, liksom undersökning av biblioteks behov i form av stöd för att kunna göra relevant urval.

Scenario 3:

Det finns möjlighet att välja bland upphovsrättsligt obegränsade e-böcker (äldre digitaliserade titlar) via en e-hubb för fritt material som utvecklas av Libris, för urval av titlar och skapande av beståndsposter för integration i lokal katalog. Libris hostar fria e-böcker och tillhandahåller öppna api-er för direktåtkomst via länkar i lokalt katalogsystem.

Scenario 4:

Låntagarna får tillgång till äldre upphovsrättsligt fria e-böcker (som digitaliserats av KB och andra bibliotek, inkl. andra fria källor som t ex Litteraturbanken) direkt via en nationell site som utvecklas av Libris. Målsättningen är att allt fritt material samlas på en site där texterna blir fulltext-sökbara. Antalet datakällor och tillgängliga titlar växer successivt.

Scenario 5:

KB/Libris tillhandahåller äldre upphovsrättsligt obegränsade e-böcker (som digitaliserats av KB och andra bibliotek, inkl. andra fria källor som t ex Litteraturbanken) via en befintlig ebok-plattform för integration i lokal katalog.

Inom det aktuella uppdraget har vi valt att gå vidare med att utveckla det datalager som ligger till grund för scenario 3 och 4 + en söksite enligt scenario 4. Vi fortsätter också att undersöka möjligheterna/behov av scenario 5.

Det utvecklingsarbete som vi har påbörjat har en arkitektur som består av tre delar: en integrationsapplikation/data-lager, ett api-lager och ett front-/webbapplikationslager. Samma integrations- och api-lager ligger till grund för både scenario 3 och 4. Det här är början på ett centralt index där det blir möjligt att söka i fulltexter bland alla fria titlar i framtiden! Det här möjliggör textanalys och hel del annat intressant som biblioteken kommer att kunna ta del av.

Som en del av uppdraget genomför vi enkäter med Libris-bibliotek. Det underlaget kan vi sedan använda för att avgöra fortsatt riktning, ska vi utveckla en site för urval av fria titlar som en del av ett fortsatt uppdrag? Vi kommer också att arbeta med användartester där vi tittar närmare på interaktionen med materialet, hur fungerar läsning i webbläsaren, navigering, förhållande mellan bild och text och annat spännande!

Fortsättning följer…

7 kommentarer 23 oktober, 2014 Katarina Stempel

Vi tar med e-boken på Bok och Bibliotek 2014

Bild från invigningen av Bok och Bibliotek 2014

Bild från invigningen av Bok och Bibliotek 2014

Att tillgängliggöra e-böcker via Libris

Under vår presentation  under Bokmässan tar Maria Hedenström, avdelningschef på KB, och jag tillfället i akt att berätta om e-boksuppdraget som vi fått från Kulturdepartementet.

Vi gör det i Frågor&Svar-stil:

Vad är en e-bok?
En e-bok är en ett format av en bok som kan läsas på en skärm. T ex en dator, läsplatta eller smart mobil. En e-bok räknas dock inte som bok rent juridiskt, utan som tjänst eller licens. Vilket i sin tur innebär att man inte äger en e-bok. Man får inte göra vad man vill med den. Är den lånad försvinner den efter lånetiden. Är den köpt finns kvar där man laddat ner den, men kan varken säljas eller skänkas.

Vad är det för typ av uppdrag KB har fått för e-boken?
KB har fått i uppdrag av Kulturdepartementet att inleda en försöksverksamhet med att till-gängliggöra e-böcker via Libris till det allmänna biblioteksväsendet. Vi ska redovisa uppdraget 22/2 2015.

Processkarta e-boksflöde, Bild Katarina Stempel

Processkarta e-boksflöde, Bild Katarina Stempel

Vilka leverantörer tänker man ansluta?
För att inom givna ramar och tidspann testa uppdragets innehåll hela vägen arbetar vi med den fritt tillgängliga e-litteraturen. Då föll valet på Litteraturbanken, och vi har glädjande fått OK från dem att använda några av deras e-böcker i testen.

Har det någon betydelse om man är ett Librisregistrerande bibliotek för den funktionalitet som KB utvecklar?
Egentligen inte, men vi tror att det rent flödestekniskt skulle förenklas av att man är bibliotek som registrerar i Libris. Vilket är orsaken till att vi framför allt kommer att vända oss till Librisregistrerande bibliotek för användar- och biblioteks-tester inom uppdraget.

Vad kommer detta att innebära för biblioteksbesökarna?
För biblioteksbesökarna kommer det att innebära att de kan söka och låna en e-bok direkt via sitt lokala bibliotek utan att behöva omdirigeras bort till andra webbtjänster. Samtidigt har besökaren chans att se vilka andra format viss bok finns i på sitt bibliotek.

Vad kommer det att kosta för ett folkbibliotek?
Den teknik KB utvecklar och tillhandahåller kostar ingenting för den som använder den. Om vi får fortsatt finansiering att utveckla en teknisk plattform för tillgängliggörande av e-böcker kommer folkbiblioteken kunna ta del av den utan kostnad.

Finns det något samarbete med SKL i licensieringsfrågan för folkbiblioteken?
Det finns kanske mer parallell verksamhet än samarbete. På KB jobbar vi på med försöksverksamheten. SKL, som har en mycket viktig roll, jobbar med förhandlingar i licensfrågan för folkbiblioteken. Rent tekniskt måste dessa inte bakas ihop just nu. Däremot träffas vi, informerar varandra, och följer varandras arbete. Våra testbibliotek till försöksverksamheten ingår t ex i SKL’s referensgrupp i e-boksfrågan.

Finns det något samarbete med andra aktörer?
Ja, vi samarbetar med andra aktörer. Och det är framför allt distributörer/metadataägare, med information in i vår processkarta, vi samarbetar med å ena sidan. Och vi samarbetar även med kontakter vi behöver i andra änden av processkartan, d v s testbiblioteken. Om uppdraget får växa kommer samarbeten att naturligt behöva berikas. Vi träffar kollegor från Publit, Litteraturbanken, Malmö stadsbibliotek, Atingo, Elib m fl. Det finns många att lyssna på och som visat stort intresse. Naturligt nog tycker många som vi, att en nationell samlad ingång med öppen metadata och hantering är det bästa för framtida e-bokssverige.

Vad händer efter projekttiden?
Vi ska återrapportera till Kulturdepartementet. Förväntan och den mest naturliga riktningen är att KB tilldelas medel för att föra in e-bokshanteringen i reguljär verksamhet. Det är KB som har det övergripande uppdraget idag och det är precis där det hör hemma.

Hur ser de möjliga framtidsscenarierna ut?
Vi ser ett scenario där vi kan erbjuda en One-Stop-Shop för e-böcker. Där folkbibliotek (precis som planeras i testen) kan söka e-böcker, ta hem information, metadata och poster för att hantera sitt urval på liknande sätt som övrig mediehantering. Själva lånet ska också kunna göras här.

E-bokens ljusa framsida och praktiska baksida

Från KB fick vi även möjlighet att delta i en paneldiskussion om e-boken under Bokmässan. Medverkade gjorde: Ann Steiner, Kristina Ahlinder, Katarina Dorbell och jag.
I min initiala presentation nämnde jag, utöver att jag är e-bokssamordnare på KB

  • att jag har ett förflutet som chef för såväl folkbibliotek som forskningsbibliotek, vilket också inkluderar ansvar för mediebudgetar
  • att uppdraget innebär att inleda en försöksverksamhet med att tillgängliggöra e-böcker via Libris till det allmänna biblioteksväsendet
  • att vår förhoppning är att folkbiblioteken med bättre tillgång till e-böcker ska kunna arbeta effektivare med läsfrämjande verksamhet

Man kan se hela inslaget i efterhand här:

http://urplay.se/Produkter/185141-UR-Samtiden-Bokmassan-2014-E-bokens-fram-och-baksida?play_category=f%C3%B6rel%C3%A4sningar+och+debatt

3 kommentarer 30 september, 2014 Gunnel Stjernvall

Behov av utökade resurser för kvalitetssäkring av forskningsoutput

Under sommaren gick Projekt Vidareutveckling av SwePub ut med en enkät för att få underlag till hur resursbehovet ser ut på lärosätena Inför kvalitetssäkring av SwePub Analys.  Svarfrekvensen var utmärkt. Det kom in 31 svar varav 30 var från lärosäten och myndigheter som lämnar in data till SwePub. Av de här 30 är 27 lärosäten aktuella för Vetenskapsrådets lista över lärosäten som kommer att ingå i FOKUS - Forskningskvalitetsutvärdering i Sverige som totalt inkluderar 34 lärosäten. Så här ser enkätssvaren ut visualiserade i analysverktyget Spotfire. I vissa fall saknas data och då är diagrammen missvisande. Ett av lärosätena sticker ut med att ha minimalt med personer som arbetar med datakvalitet men som klarar av den stora publikationsmängden med effektiva maskinella lösningar.

Resurser idag (heltid) och årlig produktion

Resursbehov, årlig

Det är slående hur få heltidsekvivalenter arbetar med datakvalitet i de lokala systemen, en heltidsekvivalent per 1500 publikationer i genomsnitt. För små och mellanstora lärosäten blir det knappt en heltidsekvivalent för arbetsuppgifter inom forskningsdatakvalitet. Om man tänker på arbetet som läggs ner på bibliotekskatalogposter i jämförelse är det troligen en bråkdel. Därmed är det inte förvånande att de flesta lärosätena har behov av att utöka resurser för att uppnå analysnivå, i genomsnitt en heltid till. Några få av de mindre högskolorna som har publikationer under 500 per år känner att de har läget under kontroll. Desto större mängd publikationer per år, desto mer behov av ytterligare resurser för kvalitetssäkring. Kanske inte så överraskande att kompletterande och retroaktiva åtgärder för kvalitetssäkrat data enligt Nationella riktlinjer för dataleverans till SwePub och SwePub MODS-formatspecifikation kräver stora arbetsinsatser för de lärosätena som har stora mängder publikationer. Dock är dessa arbetsinsatser mycket beroende på de lokala systemen och hur enkelt det går att anpassa dem enligt den nationella praxisen och formatspecifikationen. Dessutom behöver lokal praxis uppdateras och information gentemot forskare spridas. Det är dock inte bara under övergångsperioden som mer resurser behövs utan även för det löpande arbetet. För visualisering av resursbehov i jämförelse med hur många som arbetar med forskningsinformation vid lärosätena idag har vi baserat den på en tolkning av fritextsvaren på resursbehov.

Resursbehov

Resurser, behov

 

Det är uppenbart att den komplettering som kräver största arbetsinsatser är ämnesklassificering, speciellt för de lärosätena som har medicin och konst om det bestäms att ämnesklassificering efter SCB/UKÄ-kategorierna på nivå 3 dvs. 5-siffernivå krävs för de ämnen. Det önskas snabbt beslut och riktlinjer för dessa. Komplettering med alla eventuella publikationsidentifikatorer är också mycket arbetskrävande. De mindre lärosätena har inte alltid ens tillgång till Scopus eller ISI-id från WoS. Många har däremot DOI i sina lokala system. Beroende på systemet hoppas en del att kunna lösa identifikationskompletteringar med mappningar mellan olika publikationsidentifikatorer lokalt men en del önskar att det i stället kunde skötas centralt. En del kompletteringsarbete krävs även för fulltextlänkning och införing av nya publiceringstyper. Affiliering till externa lärosäten oroar mest dem som inte har haft möjlighet att lägga till den tidigare.

Att uppskatta hur mycket resurser det behövs inför integrering med Prisma/SweCRIS visar sig vara svårt. Att även forskares tidigare publikationer på andra lärosäten ska registreras lokalt inför projektansökningar i Prisma kräver retroaktiva arbetsinsatser för många av lärosäten. En del tillåter det redan men behöver kvalitetssäkra det och kontrollera affilieringar, en del behöver retroaktivt lägga till det. Här finns önskemål om att detta kunde styras centralt eller maskinellt föras in från andra system. De flesta har redan tankar på att införa ORCID vid sina lärosäten men många av lärosätena tänker låta forskare göra införskaffandet av ORCID-id själva, dock med stöd. Nästan alla kommer ändå behöva ytterligare resurser för hantering av ORCID-id, även de som idag arbetar med införandet.

Överhuvudtaget efterfrågas tydliga beslut, riktlinjer och formatkrav samt önskas en del maskinella lösningar inför kvalitetssäkring av SwePub Analys. Titta gärna på resultatet av enkätssvaren i detalj i analysverktyget Spotfire. Resultatet från enkäten kommer att användas av Vetenskapsrådet som underlag i kostnadsberäkning för det nya systemet.

 

9 kommentarer 26 september, 2014 Tuija Drake

Höstens aktiviteter i projekt Vidareutveckling av SwePub

Projekt Vidareutveckling av Swepub har dragit igång på allvar och vi har som vanligt flera aktiviteter igång och siktet inställt på det nya systemet SwePub Analys . Det är mycket kvar att göra och knappt ett år kvar av projekttiden. 

Vad ska vi göra nu närmast?

  • Nyrekryterade Tuija Drake jobbar med datakvalitet  i samverkan med lärosätena. Hon har redan inlett en dialog med flera. Har ni specifika frågor kring ert data är det bara att kontakta henne! Arbetet  kommer att leda till underlag för hur framtida kontroll och validering av data kan göras.
  • Vi startar en fokusgrupp analys som tar fram scenarier för olika analyser och datauttag. I scenarierna ska det ingå underlag över vilka data som behövs till Fokus (Forskningskvalitetsutvärdering i Sverige) och nationella analyser av svensk forskning samt till lärosätenas analyser och behov av statistik inför externa utvärderingar mm. Deltagare här är bibliometriker från lärosäten och analytiker från Vetenskapsrådet.
  • Arbetsgruppen Praxis under ledning Jessica Lindholm, fortsätter arbetet med Nationella riktlinjer för dataleverans till SwePub av forskningspublikationer för analys. Arbetet avslutas i december-14.
  • Inom den tekniska utvecklingen blir det fokus på  dubbletthantering och skapande av en datamodell som underlättar uttag av data för planerade analyser, samt koppling till andra datakällor.
  • Vi har en deadline i december som berör alla parter i projektet. Då ska vi visualisera data i SwePub Analys i en första mer samlad avstämning mot de framtagna kriterierna i projektet. Det kommer att göras på nationell nivå. Syftet är att synliggöra problemområden och utvärdera förutsättningarna för att använda data i analyser. 

Vi har en hel del på gång i höst i form av olika spännande arrangemang. Kom och träffa oss i projektgruppen på: 

 

 

3 kommentarer 23 september, 2014 Marja Haapalainen

Påbörjat arbete med att förmedla e-böcker

Som vi tidigare berättat om har KB fått i uppdrag av regeringen att förmedla e-böcker genom Libris. Vi har påbörjat arbetet med att se hur det här uppdraget skulle kunna realiseras. E-boksfrågan är komplex. Biblioteken vill att låntagarna ska få tillgång till ett så stort och varierat sortiment titlar som möjligt, till en kostnad som inte överstiger deras medie-inköpsbudget. Låntagarna vill att så många titlar som möjligt ska vara tillgängliga, så snart efter utgivning som möjligt. De vill få direkt åtkomst till fulltexterna utan att behöva skapa konton och logga in i flera led. Distributörer och förlag/rättighetsinnehavare vill ha ersättning från biblioteken för utlåningen.

Mycket har hunnit hända sedan KB presenterade E-boksutredningen När kommer boomen? och förstudien Sammanhållet nationellt system för distribution av e-böcker till bibliotek. Det pågår förhandlingar mellan SKL, Sveriges Kommuner och Landsting, som representerar folkbibliotekens intressen och förlag angående ersättningsmodeller för utlåning av e-böcker. Det finns nu också kommersiella distributörer som erbjuder de tjänster som folkbiblioteken efterfrågar, i form av möjligheten att välja titlar från flera olika distributörer och göra dessa tillgängliga för sina låntagare. Atingo förmedlar redan e-böcker till många bibliotek och Elib utvecklar en ny tjänst för e-boksförmedling. Ingen av dessa plattformar kan förstås garantera långsiktig tillgång till alla titlar, från alla distributörer och ingen kan erbjuda biblioteken tillgång till äldre titlar som inte har upphovsrättsliga begränsningar utan kostnad. Trots olika intressen verkar det finnas en gemensam målsättning att allmänheten ska få upp ögonen för e-böcker.

Vårt uppdrag går ut på att bygga en central infrastruktur för att förmedla e-böcker till biblioteken. Vi tror att KBs roll skulle kunna vara att se till att tillgången till e-böcker kan säkras över tid och vi vill börja med att se till att titlar som inte har upphovsrättsliga begränsningar kan förmedlas direkt till biblioteken. På så sätt kan vi börja med en mindre datamängd och implementera ett system som vi sedan testar och fortsätter att utveckla genom att successivt öka mängden distributörer och tillgängliga titlar över tid i flera utvecklingsiterationer. Det gör också att vi kan få med oss distributörer och bibliotek att testa med redan från början av utvecklingsarbetet. Vi implementerar ett avgränsat, fungerande flöde, vilket gör det möjligt för oss att utvärdera för att sedan ta med oss lärdomar och avgöra fortsatt inriktning.

Sammanfattningsvis ser vi att det finns en tidsaspekt för den nationella infrastrukturen för e-böcker där den första fasen går ut på att påbörja arbetet med en central plattform och inkluderar en datamängd som i första hand utgörs av fria titlar (detta uppdrag), en andra tidsmässig fas där överenskommelser mellan SKL och förlag formas och en tredje fas där det blir möjligt att realisera en central lösning med flera involverade distributörer och som även inkluderar utlåning av titlar med varierande rättighetsmässiga begränsningar. Huruvida den lösningen blir ett uppdrag för KB, om det blir ett samarbete med, eller utveckling av någon av de befintliga kommersiella plattformarna återstår att se.

Utvecklingen som vi gör inom ramen för det aktuella uppdraget består i sin tur i tre delar. Vi kommer att läsa in och exponera e-böcker, vilket innebär att vi kan göra materialet åtkomligt för andra system via APIer (maskinläsbara gränssnitt). Vi kommer också att jobba med metadata och beskrivningar för sökning och länkar till fulltexterna i Libris befintliga katalogsystem och vi kommer även att bygga en site för visning och interaktion med innehållet.

Den långsiktiga visionen, som vi kallat för den ”samlade ingången” är en ny söktjänst som gör det möjligt att hitta material av alla typer och där sökning görs både i metadata (vissa beskrivande fält som t ex titel, författare osv) och i fulltexter (så att man även kan få träff i innehållstexter). Den har vi hela tiden i åtanke när vi bygger våra system och gränssnitt, för möjligheten att bygga vidare, återanvända och ta med oss lärdomar.

Projektarbetet med att tillgängliggöra e-böcker kommer att pågå under hösten och avslutas i februari 2015.

14 kommentarer 17 september, 2014 Katarina Stempel

Anmäl er till LIBRIS inspirationsdagar 10-11 november 2014

Välkomna att anmäla er till LIBRIS inspirationsdagar i Stockholm den 10-11 november 2014!

Program och anmälningsformulär: http://www.kb.se/aktuellt/utbildningar/2014/LIBRIS-inspirationsdagar/

2 kommentarer 15 september, 2014 Maia Dexander

En tårta växer fram - historien om hur vi byggde en söktjänst på fyra veckor

Under fyra fokusveckor har ni har haft möjlighet att följa vår utvecklingsresa med att designa en tjänst för digitaliserade dagstidningar. För er som inte varit med under hela resan, så har vi använt oss av MVP (minimal viable product) som metod. En MVP är första versionen av en produkt som gör det möjligt att snabbt testa idéer och lära sig om användarnas behov med minsta möjliga insats. Dvs man börjar med att sätta upp en hypotes, tar fram den enklaste designen för att testa hypotesen på potentiella användare, får insikter och itererar på nytt. När hypotesen itererats några varv har man tagit fram något som tillför ett reellt värde för användaren, en sk bakelse. Därefter har vi brutit ut hypoteser ur effektkartan och itererat en efter en samtidigt som vi bakat oss närmare en tårta för varje iteration:

Vecka 1
Hypotes: Vi tror att de uppgiftsdrivna omedelbart skulle hitta alla relevanta artiklar på ett mer effektivt sätt om de fick en sömlös träfflista/fullpost med möjlighet att filtrera och se snippets.

Resultat: en prototyp som gav möjlighet att fritextsöka bland 30.000 sidor, se snippets och tidningssidor, favorisera relevanta träffar, fokusera på tidningssida och se hela numret, zooma in på tidningssidan och enkelt navigera sig tillbaka till träfflistan.

prot3

Vecka 2
Hypotes: Vi tror att de intressedrivna omedelbart skulle kunna utforska ämne och göra uttömmande sökning på ett mer effektivt och inspirerande sätt om de fick relaterade träffar/sökord gärna med visuell återgivning, filtrering och stavningskontroll.

Resultat: en stabil applikation att bygga vidare på med möjlighet att filtrera utifrån behov tex. visuellt på tid, geografisk ort och titel.

v2

Vecka 3
Uppgift: Designa för upphovsrättsskyddat material i det externa gränssnittet.

Resultat: Se skillnad på fritt tillgängliga och upphovsrättsskyddade tidningar, avgöra om referensen är relevant genom att se sökord och förenkla med favoriter så användaren kan sitta hemma och favoritmarkera tidningssidor och ta med sig till KB för läsning.

v3

Vecka 4
Uppgift: Ta ett helhetsgrepp om designen, färdigställa och förfina det sista, strukturera och städa koden.

Exp_map_uppgiftsdrivne_studenten

Lärdomar av metoden och arbetssättet:

  • Växla mellan högintensivt och lågintensivt arbete utifrån behov. Upplägget initialt var att arbeta högintensivt under fokusveckorna och lågintensivt perioderna däremellan. Tanken var att vi skulle förbereda så lite som möjligt inför fokusveckorna, vilket fungerade bra i början, men efter andra veckan hamnade vi efter med backendbitarna. För att hålla effektiviteten uppe under själva veckorna behövde vi därför tänka om. Under den sista perioden arbetade vi intensivt med dessa bitar som tex grundplatta för inloggning, konvertering av bilder och textanalys för att effektivisera arbetet.
  • Snabba iterationer med användningstest ger garanterat värde. Vi har testat våra hypoteser iterativt med RITE-metoden, vilket har gett snabb återkoppling och möjlighet att iterera varje flöde flera gånger om på kort tid. Metoden snabbar upp tempot avsevärt och vi vet att vi levererar värde i varje iteration.
  • Ta höjd för helheten. MVP som metod handlar om att bryta ut mindre bitar (bakelser) och designa för en del i taget. Vilket kan innebära att man missar helhetsupplevelsen, men om man hela tiden har den övergripande bilden i bakhuvudet fungerar det. Dessutom hade vi effektkartan som stöd och tog en extra vecka på slutet för att få med helhetsperspektivet.
  • Metod som möjliggör för gemensamma utvecklingsinsatser. MVP som metod visar att det är fullt möjligt att göra utvecklingsinsatser under korta fokusveckor, vilket i praktiken gör det möjligt att komma ut och utveckla tillsammans med biblioteken.
  • Gör små uppehåll. Efter intensiva fokusveckor behövs tid för återhämtning. Vi planerade upp arbetet med alldeles för stora uppehåll, vilket innebar att vi tappade fokus och behövde plocka upp alla trådar inför varje fokusvecka. En tips är att ta små uppehåll.
  • Att arbeta tvärfunktionellt skapar energi och engagemang. Vi har arbetat tvärfunktionellt med all kompetens på plats i mikrofilmsläsesalen. Det innebär att vi har haft all den kompetens som behövs för att lösa uppgiften. Vilket ger korta beslutsled, ett väldigt driv och en stor innovationskraft eftersom vi får upp idéer med olika perspektiv på kort tid.
  • Ett team som är ansvarstagande. Eftersom många bollar far kors och tvärs genom rummet och beslut tas hela tiden behövs det ett engagerat team där alla tar ansvar och plockar de bollar som kommer i deras riktning.
  • Hastighet och garanterat värde i ett. Vi har aldrig utvecklat något i den här hastigheten tidigare, dessutom med ett stort värde. När man får kommentarer som ”Oj, så fort! Det är ju perfekt! Vad bra! Kan jag förstora? Ah….[skrattar] Fantastiskt! [läser]”, ”Titta vad fint! Vilken fröjd! Det är ju inte klokt, det är så tydligt!” känner man sig mer än nöjd.

Överlag har arbetet genererat positiv energi och skapat flera innovativa lösningar. Sen att vi dessutom har haft väldigt roligt gör saken ännu bättre.

Betareleasen av tidningar.kb.se genomfördes innan sommaren och nu har vi den senaste veckan arbetat med att förfina befintlig funktionalitet utifrån de lärdomar vi dragit från forumet där användare har kunnat lämna synpunkter.

prioriterade åtgärder vdd

 

Testa den senaste versionen av tidningar.kb.se. Enjoy!

2 kommentarer 12 september, 2014 Johanna Olander

Katalogprojektet - status och effektkarta

Katalogprojektet går in i slutspurt under hösten. Vi jobbar intensivt med att få till de delar som saknas för att kunna lansera tjänsten i januari 2015. För att säkerställa att det system vi driftsätter kommer att motsvara de krav som ställs på katalogiseringsverktyget och att export och importrutiner fungerar, kommer vi under hösten att utföra tester tillsammans med katalogisatörer och systembibliotekarier på Librisbiblioteken. Vi kommer fortlöpande att rapportera om testresultaten här på Librisbloggen.

Under hösten kommer vi också att delta i några utåtriktade aktiviteter. På Bok- och biblioteksmässan i Göteborg kommer vi under torsdagen 25/9 och fredagen 26/9 att presentera projektet och visa lite livekatalogisering i nya katalogiseringsverktyget. Då kommer det också finnas möjlighet att träffa några av oss från utvecklingsteamet och ställa frågor. På Libris inspirationsdagar den 10-11/11 kommer vi hålla en längre presentation av vårt arbete med Libris XL, katalogiseringsverktyget och formatet. Dag två kommer vi även att hålla i en workshop på samma tema. Under Libris inspirationsdagar kommer hela teamet att finnas på plats och tillgängliga för samtal och frågor.

I utvecklingsarbetet har vi arbetat med personor, tre olika katalogiseringskaraktärer som representerar olika behov och användning av verktyget. Dessa tre personor är skapade utifrån en kartläggning av katalogisatörer i olika roller och på olika typer av bibliotek i projektets inledningsfas. Utifrån våra tre personor, Kerstin, Sara och Åsa har vi gjort en effektkarta (se nedan). När vi lanserar den första versionen av katalogiseringsverktyget bör vi ha uppfyllt det övergripande effektmålet även om det fortfarande kan återstå en del aktiviteter som vi får ta vidare till ett nytt utvecklingsprojekt.

Följ gärna utvecklingen i betan: http://kat.libris.kb.se/

ekarta

Effektkarta. Klicka på bilden för större variant.

2 kommentarer 5 september, 2014 Helena Forssblad

Nästa sida Föregående sida


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler