Filed under: Utveckling

Kom igång med SwePub Analys i praktiken!

Projektgruppen för Vidareutveckling av SwePub ordnade en workshop i samband med Libris inspirationsdagarna den 11 november. Rubriken för workshopen var Kom igång med SwePub Analys i praktiken! Dagen riktade sig till dem som arbetar med publikationsdatabaser och datakvalitetsfrågor i praktiken. Fokus för dagen var ett byte av erfarenheter mellan lärosätena och SwePub-projektet kring vilka sätt SwePub Analys påverkar arbetet. Alla deltagande lärosäten bidrog aktivt med att presentera problem och/eller lösningar kring t.ex. ämnesklassning, affiliering, ID:n, publikationstyper, dubbletter och data som saknas.

SwePub-projektgruppen började workshopen med att berätta om varför, vad och hur arbetet med SwePub-projektet pågår, och vad som har åstadkommits hittills. Det pågående arbetet med att vidareutveckla förslaget för de nationella riktlinjerna för dataleverans till SwePub har nyligen beskrivits i ett annat Librisblogginlägg. Projektgruppen ställde även en fråga om validitetsflaggning. Behövs validitetsflaggning för att kunna flagga för poster som är kvalitetsgranskade eller borde man flagga för ogranskade poster i stället? Skapar validitetsflaggning merarbete för lärosäten?

Projektgruppen passade även på att prata om formatspecifikationen för SwePub MODS. Versionen 2.5 är den som nu gäller för dataleverans till både söktjänsten och analysdelen. Det har skett en förändring sedan sommaren då översynen av formatspecifikationen blev färdig. Det är inte längre ett obligatorium att ange publiceringsdatum för opublicerat material men då är det viktigt att ange publiceringsstatus i stället. Det kommer dock att dröja till början av nästa året innan en ny, uppdaterad version av SwePub MODS släpps ut. Då kommer den även att innehålla de nya outputtyperna.

De största problemen som lärosätena presenterade var ämnesklassificering, affiliering och identifikatorerna. Speciellt med ämnesklassificering önskades mer draghjälp både från SwePub-projektet och Vetenskapsrådet. Vad ska man tänka på när man ämnesklassificerar? Att utgå från publikationens innehåll, publiceringskanalen eller författarens organisationstillhörighet? Vem gör arbetet bäst: forskare själva eller bibliotekarier?

Under dagen skrevs det upp kom igång - tips för datakvalitetsarbetet:

För förankring hos lärosätesledningen:

  • Skapa lokala referensgrupper
  • Få till rektorsbeslut
  • Stödja/luta sig mot nationella initiativ/krav

För att komma igång med datakvalitetsarbetet:

  • Identifiera problemområden och börja där
  • Skicka testposter (även manuellt går bra)

För att få hjälp med ämnesklassningen:

  • Mappa/klassa innehållet med hjälp av Web of Science, affiliering, kanal
  • Crowdsourcing kring klassningsverktyg
  • Stäm av lokalt sådant som ska användas nationellt, t.ex. ämnesklassningar
  • Tala med katalogisatörer om ämnesklassning
  • Använd forskarna

 Kom igång - workshopKom igång - tips

 

 

 

 

Vi vill tacka alla som bidrog med sitt deltagande i workshopen! Tack vare er så fick vi mycket feedback för att arbeta vidare med utvecklingen av SwePub! Nu går vi vidare genom att lämna ifrån oss den första versionen av de nationella riktlinjerna i december och ta fram olika sätt och verktyg att stödja datakvalitetsarbetet.

8 kommentarer 1 december, 2014 Tuija Drake

Libris katalogisering - betaversionen ligger nere

Betaversionen av Libris nya katalogiseringssystem är för  tillfället avstängd.

Det beror på att vi håller på att uppgradera miljön som infrastrukturen kör på för att kunna ta den i skarp drift under början av nästa år.

Nästa stycke är lite tekniskt, men det här är vad vi gör:

  • Vi sätter upp ett helt nytt kluster för Elastic Search. Det kommer att användas för sökning och dokumentlagring.
  • Vi installerar ActiveMQ för att hantera transport av meddelanden mellan delar av systemet. Både internt i LibrisXL, men också för integration med befintliga system.
  • Vi sätter upp två graph stores (Virtuoso) som kommer att hantera vårt länkade data.
  • Två oberoende Tomcats (servletmotor) för att kunna lastbalansera och växla mellan versioner av systemet, till exempel vid uppgraderingar och konverteringar.

Vi beräknar att allt kommer att vara på plats igen under nästa vecka.

Kommentera 28 november, 2014 Harriet Aagaard

Om Nationella riktlinjer för dataleverans till SwePub - en månad tills de släpps!

Unraveling_ball_of_string (1)Praxisgruppen släppte i juli 2014 ett första förslag till Nationella riktlinjer för dataleverans till SwePub. Men, vad gör vi nu och när kommer egentligen riktlinjerna?

Under hösten och vintern 2014 arbetar vi vidare riktlinjerna, bland annat genom att gå igenom input från de tre olika kommentaromgångarna i april, maj och juli. Samtidigt fortsätter samtal kring införande av CASRAI, en beskrivningsmodell för det nya innehållet konstnärlig forskning, revidering och förfining av riktlinjerna.

Vad är nytt eller förändrat?

  • Ny lista för outputs (tidigare publikationstyper)
    De tidigare publikationstyperna kommer att ersättas med nya namnformer och delvis nya betydelser. Exempel på nya outputs är kapitel i rapport, editorials/letters, textkritiska översättningsutgåvor och dataset. Vi gör också justeringar kring kategoriseringen av konferensbidrag och inför helt nya outputs för konstnärlig forskning. Under november och december genomför vi tillsammans med CASRAI och Vetenskapsrådet ett pilotprojekt för att se om CASRAI kan fungera som standard för alla svenska outputs från forskning.
  • ID:n
    Stark vikt läggs vid hur olika ID för publikationer, personer, organisationer etc. ska kunna inrymmas i beskrivningarna.
  • Information om sakkunniggranskning på publikationsnivå får förändrad betydelse
    I samband med att kanalregister föreslås upprättas för sakkunniggranskade kanaler (tidskrifter, förlag m.m.) och utifrån hur svårt det är att bedöma aspekter kring sakkunniggranskning kommer innehållsmärkningen (“populärvetenskapligt”, “sakkunniggranskat” och “övrigt vetenskapligt”) att övergå mer till att stödja uppbyggnaden av kanalregister och som stöd i olika analyser.
  • Förtydliganden. Vi förtydligar delar som inte har definierats tidigare, t.ex. hur preprints ska hanteras, var lagkommentarer ska tillhöra, skillnader mellan att ha ett paper i en proceeding efter en konferens och hur dessa papers också ibland publiceras som artiklar i tidskrifter och som kapitel i böcker.
  • Vi undersöker hur en flaggning kan införas och användas för poster som validerats och genomgått kvalitetsarbete i enlighet med SwePubs vidareutveckling.
  • Utöver detta skrivs helt ny praxis kring beskrivning av open access, identifikatorer för personer och organisationer, beskrivningar av hur man arbetar med att affiliera personer till publikationer, hur man räknar ut antalet upphovspersoner för fraktionering i analys m.m.

När är vi klara? Projektet levererar nästa version kring den 19 december. Därefter kommer de att hanteras som ett levande innehåll, som behöver förvaltas och arbetas vidare med över tid.

7 kommentarer 25 november, 2014 Jessica Lindholm

Höstens första test av katalogklienten: bestånd

Under vecka 45-46 gjorde vi höstens första test med hjälp av den grupp av katalogisatörer som anmält intresse av att ingå i testtruppen av katalogiseringsverktyget. Den här gången var det beståndsflödet som testades.

Testet utfördes som en dagboksstudie vilket innebar att testdeltagarna efter några strukturerade frågor förde anteckningar av hur de gick tillväga då de utförde testet och också hur katalogiseringsverktyget upplevdes, både vad gäller funktion och form. Vanligtvis genomför vi användartester där vi sitter bredvid och ställer frågor och antecknar vad personen säger och gör. Vi var därför inte helt säkra på hur dagboksmetoden skulle fungera, så detta blev också test av metoden.

Vi blev glatt överraskade av hur mycket information vi fick ut. Deltagarna berättade hur de gått tillväga, vad som fungerat, vad som inte fungerat, vad som saknades, vad som var bra och hur de upplevde verktyget och beståndsfunktionen. Mycket imponerande!

Glädjande nog var de allra flesta nöjda med det nya gränssnittets layout och form, som skiljer sig mycket från den nuvarande katalogiseringsklienten. Återkommande reflektioner var en viss förvirring vad gäller begrepp, vilket vi behöver arbeta med för att det ska bli tydligt vilken information som ska fyllas i och i vilka fält. Avsaknad av fält för olika typer av material var en annan kommentar. Dessutom hade många personer svårigheter kring interaktion rörande spara-funktionen och hur man från posten kan se att den är sparad. Alla påpekade också behovet av att kunna se vilka andra bibliotek som har bestånd.

Är du nyfiken på hur testet såg ut så hittar du testinstruktionerna här. Gå gärna in i betan (http://kat.libris.kb.se) och testa på egen hand.

Kommentera 20 november, 2014 Johan

Scenariometod för insamling av behov och lösningsförslag

wsbild
Inom projekt vidareutveckling av SwePub har vi haft ett antal scenarioworkshopar tillsammans med bibliometriker och analytiker. Deltagarna var: Camilla Hertil-Lindelöw, Södertörns högskola, Leif Eriksson,Uppsala universitet, Gabor Schubert, Stockholms universitet, Johan Toll, Linköpings universitet och Staffan Karlsson, Vetenskapsrådet. Workshopledare var Eva Sejmyr, Linköpings universitet. Stort tack till er!

Målsättningen för dessa workshops var att öka projektgruppens kunskap om vilka behov denna målgrupp har, vilka krav som ställs på data och datauttag, men även att sprida kunskapen om hur SwePub Analys kan vara ett verktyg i det praktiska analysarbetet. Genom dialog och kunskapsutbyte ville vi skapa en gemensam förståelse för vad som behövs för att ta fram underlag till olika analyser så som  publiceringsprofiler, samarbetsanalyser, OA-publicering, tvärvetenskapliga ämnesanalyser och återrapporteringar. Ett annat viktigt syfte var att få underlag till den fortsatta utveckling av SwePub Analys och hur systemet på bästa sätt kan underlätta arbetet för målgruppen.

Varför arbeta med scenarier? Vi var ute efter att synliggöra en specifik målgrupps behov och valde därför att använda denna ganska enkla men kreativa form för insamling av behov och lösningsförslag. Vi använde en modifiering av metoden, Smarta scenarier, som ofta används vid utveckling av nya IT-tjänster som t. ex. webbutiker. Målet är att genom att använda sig av ett fåtal enkla scenarier identifiera viktiga krav på en ny tjänst. Utifrån ett på förhand angivet scenario skissar workshopdeltagarna gemensamt fram flöde av förväntade steg för att nå målet. Beskrivningen av och diskussionen kring olika stegen används för att fånga upp krav och förutsättningar för att den nya tjänsten ska fungera optimalt. I vår version fokuserade vi på behov och lösningsförslag - inte krav!

Allt som allt blev det fem scenarier: 

Sture, analytiker på VR, ska ta ut en publiceringsprofil för åren 2012-2014 inom Fokus-ämnet statsvetenskap och juridik för lärosäte X. Underlaget ska vidare till bedömningspanelen för läsning och utvärdering av experter.

Sixten, utredare vid lärosätet, ska på uppdrag av ledningen genomföra en benchmarking bland svenska lärosäten inom ämnesområdet psykologi och ta fram ett underlag för rekrytering av spetskompetens.

Stina, bibliometriker vid lärosätet, ska validera lärosätets produktion inom den prioriterade satsningen miljöteknik och göra jämförelse mot andra lärosäten, nationellt och internationellt,  inför den årliga redovisningen.

Sven, bibliotekarie vid lärosätet, ska ta fram/granska lärosätets produktion inom ämnet energi inför den årliga återrapporteringen av Miljötekniksatsningen (SFO), fokus på OA-publicerat.

Sara, bibliometriker vid lärosätet, ska göra en visualisering av institutionen för Biomedicins samarbetspartners, nationellt och internationellt de senaste tre åren.

 

publiceringsprofil alltiett

 

Här ovanför ser ni scenariet för publiceringsprofiler. Aktiviteterna i de olika faserna är formulerade i de rosa boxarna, problemen finns i de vita boxarna och möjliga lösningar finns i de gröna. Under workshopen var det fri brainstorming kring aktiviteter, problem och lösningsförslag, allt kom in huller om buller och antecknades på lappar i olika färger. Ordningen på aktiviteterna organiserades sedan i fem olika faser, vilka växte fram under bearbetningen av materialet. Slutligen infogades lapparna i verktyget Visio. Just detta scenario var speciellt eftersom så mycket händer innan ett uttag av publiceringsprofil görs.

Vad händer nu? Projektet använder underlaget när vi gör en större avstämning i december och visualiserar förutsättningarna för att använda SwePub Analys. Visualiseringen utgår från scenariot publiceringsprofiler som är aktuellt inom Forskningskvalitetsutvärdering i Sverige, den sk Fokus-modellen.

4 kommentarer 19 november, 2014 Marja Haapalainen

Verktyg att hantera dubbletter inom SwePub Analys

Dubbletter är något som alla system i alla år har fått hantera. I SwePub finns det dubbletter från olika lärosäten, som en naturlig följd av att alla lägger in publikationer som deras forskare har medverkat i, men även lärosätenas lokala dubbletter. Inom projektet Vidaretuveckling av SwePub har vi tagit fram ett verktyg, Adjudication tool, för att stödja bedömning av dubbletter. För att testa om verktyget fungerar i verkligheten bad vi två lärosäten att prova verktyget på lokala dubbletter. Dessa piloter var Södertörns Högskola och Örebro Universitet.

I visualiseringsverktyget Spotfire finns det en egen score board för dubbletter. Vi har satt algoritmer för dubbletter så att alla potentiella dubblettposter som får över 1,1 vikt i matchningen av identifikatorer, titel, författare och författarantal, publiceringsdatum och källa räknas automatiskt som dubbletter och alla som går under 0,8 räknas automatiskt som icke-dubbletter. Här väger olika faktorer olika, t.ex.ISI-id och DOI har större vikt än ISBN i dubblettmatchningen. Frågan är hur man kan bedöma potentiella dubbletter mellan spannet 0,8 och 1,1, den så kallade gråzonen. Därför har vi tagit fram ett verktyg för att bedöma dubbletter manuellt. Från potentiella dubblettpar i Spotfire finns det länk vidare till dubblettverktyget Adjudication tool där man får upp båda poster för att kunna jämföra och bedöma om de är äkta dubbletter, dubbletter som handlar om samma forskning fast i olika publikationskanaler, eller icke-dubbletter.

Grey zone histogram

Inom Fokus - Forskningskvalitetsutvärdering i Sverige är det meningen att endast ett uttag av forskningsresultatet lämnas till bedömningspanelerna. Då behöver det bedömas om potentiella dubbletter gäller för samma eller olika forskningsresultat,  “same creative work” eller “different creative work”.

Var går gränsen för “same creative work”?

Båda pilotlärosätena konstaterade att det är svårt att bedöma om publikationerna var baserade på samma forskningsresultat, “same creative work”. Ofta publiceras ett forskningsresultat först som konferensbidrag och efter ett eller två år som artikel. Under dessa åren har det förmodligen skett en del processerande av arbetet. Om man inte jämför själva texterna är det svårt att bedöma hur mycket förändringar har skett under tiden mellan två publikationer. Oftast har man inte tillgång till ett konferensbidrag utan då behöver man fråga forskaren. En abstract kan vara till hjälp men två lika abstract i två olika publikationer garanterar inte att det är lika med “same creative work”.

När är två publikationer så pass olika att de kan betraktas som två olika verk? Båda testbiblioteken efterfrågade tydliga riktlinjer från Vetenskapsrådets håll om vad som är “same creative work”. Ska man utgå från t.ex. samma publikationstyp eller år? Det skulle också underlätta att veta vilka publikationstyper inom vissa ämnen som gäller för medräkningen i uttagen för bedömningspaneler så att man vet var man ska lägga sitt krut.

Utan tydliga instruktioner känns det obekvämt för dem som arbetar med kvalitetssäkringen av forskningsinformation att bedöma “same creative work” med kännedomen att det kommer att påverka resursfördelningen. Individuellt gjorda bedömningar utan tydliga instruktioner kan dessutom leda till ojämna uttag beroende på vem som har gjort bedömningen. Annars är det lätt att den ena granskares bedömning skiljer sig från den andras eftersom det i de flesta fall inte finns säker vetskap om två publikationer är lika.

Adjudication tool

Dubbleringsfaktorer

Det finns några faktorer som lätt bidrar till att poster fastnar i dubblettkontrollen. En är identifikator, oftast ISBN, som felaktigt har registrerats på det enskilda bidragets nivå och inte på värdpublikationens nivå. Detta görs i syfte för att öka tillgång men i dubbletthanteringen har det motsatt påverkan. Det bör finnas möjlighet i de lokala systemen att i stället markera ISBN för det relaterade verket i dessa fall, som det beskrivs i formatspecifikationerna för SwePub MODS (kapitlen 4 & 17 i versionen 2.5). Det ska även slås fast i de nationella riktlinjerna för dataleverens till SwePub Analys.

Det är inte heller ovanligt att felaktigt inmatad information orsakar dubbletter som t.ex. manuellt inmatade identifikatorer. Den mänskliga faktorn är ett faktum som vi måste vara medvetna om. Även maskinella importer skapar dubbletter om det inte vid import uppmärksammas poster som redan finns manuellt inmatade men utan identifikatorer såsom ISI och DOI.

En annan faktor som ökar risk för dubbletter är att samma verk läggs in som två olika publikationstyper. Den ena har lagts in som konferensbidrag i proceedings medan den andra har lagts in som kapitel i bok. Där gäller det att hålla koll på vad som är korrekt publikationstyp i sammanhanget. Ibland kan en proceeding till exempel innehålla både konferensbidrag och kapitlar i boken så det kan krävas att fråga forskaren vad som är fallet med hens verk.

Pröva på!

Testlärosätena var nöjda med att upptäcka äkta dubbletter med hjälp av dubblettverktyget. Att bedöma två poster som dubbletter i SwePub:s dubblettverktyg orsakar dock ingen automatisk ihopslagning, varken i SwePub eller lokalt, utan resulterar enbart till att äkta dubbletter hamnar på en “blacklist”, icke-dubbletter på en “whitelist” och dubbletter med samma forskning fast i olika kanaler hamnar på både och. Det påverkar alltså enbart uttagen för analyser. Inga poster försvinner och inga poster slås ihop. Vill man göra åtgärder lokalt, finns det API för att få lista på sina dubbletter.

Vi vill tacka Södertörn och Örebro för att ni ställde upp som piloter! Vi fick värdefull information till  underlaget om behovet av definition av “creative work” som vi tog fram till Vetenskapsrådet. Om fler vill pröva på dubblettverktyget, finns det instruktioner och en egen score board för DuplicateExploreMatches. För dem som vill börja med ett mindre antal dubbletter har vi skapat ett bokmärke där vi har begränsat dubbletterna att gälla lokala sakkuniggranskade publikationer fr.o.m. 2012.

8 kommentarer 31 oktober, 2014 Tuija Drake

Katalogprojektet i slutspurt

Fokus i katalogiseringsprojektet är nu att få formuläret i katalogiseringsverktyget att fungera för flera materialtyper. Under våren undersökte vi katalogiseringsflödet för monografier och gick under tidig höst vidare med seriella publikationer. Detta arbetssätt var dock för långsamt för att vi skulle hinna få ett formulär som fungerar för flera materialtyper färdigt före driftsättning i januari.

Vår strategi har därför ändrats och vi har lagt upp alla tänkbara fält i formuläret utan att ägna tid åt layout eftersom den inbördes ordningen ändras hela tiden. Det formulär ni nu möts av är därför en helt lodrätt uppsättning fält som ännu inte är inordnade i någon funktionell layout.

För att skapa ett lättarbetat formulär har vi lagt ner mycket arbete på att skapa mönster för hantering, tex stänga, ta bort och  lägga till fält. När vi får ordning på datat och på bakomliggande mönster kommer vi att inordna formuläret i en bra layout.

För att kunna lämna Marc21 som lagringsformat har Marc-datat mappats till den nya  datastrukturen JSON-LD. En mycket viktig del i formatmappningen är återkonverteringen till Marc21 eftersom vi under överskådlig tid kommer att vara bundna av att både kunna ta emot, och att leverera data som Marc21. Återkonverteringsarbetet är ännu inte klart, men för att visa vart vi är på väg har vi nu implementerat en första version av förhandsgranskning av posterna i Marc21.

I backend har vi introducerat Apache Camel som vi använder för att hantera flödet av data mellan de olika komponenterna – lagring, fulltextindex och triplestore. Vi lägger mycket tid på att hitta rätta lösningar och förutsättningar för att snabbt kunna importera och bearbeta stora mängder data.

Vi slipar också på detaljerna kring hur vi ska kunna koppla samman LibrisXL med det gamla systemet, så att vi under en period kan samköra dem. Detaljerna innefattar hur XL ska leverera uppdaterat data till det gamla systemet och på vilket sätt XL ska ta emot uppdateringar. När vi driftsätter Libris XL och katalogiseringsverktyget i en första version kommer det att finnas en hel del att fortsätta utveckla. Det innebär att katalogiseringsverktyget inte kommer att täcka det fullständiga katalogiseringsbehovet. Specialmaterial kommer fortsatt att kunna katalogiseras i Voyager tills dess att vi har täckt upp även för detta.

Vi har också påbörjat arbete med autenticering och auktorisering av användare, både mot backend och katalogklient.

Följ utvecklingen i betan: http://kat.libris.kb.se/

2 kommentarer 29 oktober, 2014 Harriet Aagaard

E-böcker är ett populärt ämne

Det diskuteras flitigt kring vårt uppdrag att förmedla e-böcker via Libris, både internt på KB och externt i biblioteksvärlden. Här tänkte jag gå igenom några olika scenarier för realisering av förmedling av e-böcker via Libris.

Scenario 1:

Låntagarna kan söka bland alla förlags e-böcker via en gemensam nationell site, där utlåning sker direkt via KBs/ett nationellt lånekort. Det här scenariot förutsätter dels ett avtal mellan förlagen och SKL för att KB ska få tillgång till e-böckerna och dels en överenskommelse generellt mellan biblioteken att en central portal är den bästa lösningen för låntagarna.

Scenario 2:

Urvals-/inköpsprocessen till den lokala katalogen görs via en nationell portal (i stället för Atingo, Elib eller annan kommersiell systemleverantör) som utvecklas och underhålls av Libris och där alla titlar från alla förlag samlas. Det här scenariot kräver, liksom scenario 1 avtal med förlagen för att kunna realiseras. Det finns rimligtvis även konkurrensaspekter att ta ställning till. Eventuellt genomförande behöver föregås av analys av bibliotekens befintliga administrativa processer, liksom undersökning av biblioteks behov i form av stöd för att kunna göra relevant urval.

Scenario 3:

Det finns möjlighet att välja bland upphovsrättsligt obegränsade e-böcker (äldre digitaliserade titlar) via en e-hubb för fritt material som utvecklas av Libris, för urval av titlar och skapande av beståndsposter för integration i lokal katalog. Libris hostar fria e-böcker och tillhandahåller öppna api-er för direktåtkomst via länkar i lokalt katalogsystem.

Scenario 4:

Låntagarna får tillgång till äldre upphovsrättsligt fria e-böcker (som digitaliserats av KB och andra bibliotek, inkl. andra fria källor som t ex Litteraturbanken) direkt via en nationell site som utvecklas av Libris. Målsättningen är att allt fritt material samlas på en site där texterna blir fulltext-sökbara. Antalet datakällor och tillgängliga titlar växer successivt.

Scenario 5:

KB/Libris tillhandahåller äldre upphovsrättsligt obegränsade e-böcker (som digitaliserats av KB och andra bibliotek, inkl. andra fria källor som t ex Litteraturbanken) via en befintlig ebok-plattform för integration i lokal katalog.

Inom det aktuella uppdraget har vi valt att gå vidare med att utveckla det datalager som ligger till grund för scenario 3 och 4 + en söksite enligt scenario 4. Vi fortsätter också att undersöka möjligheterna/behov av scenario 5.

Det utvecklingsarbete som vi har påbörjat har en arkitektur som består av tre delar: en integrationsapplikation/data-lager, ett api-lager och ett front-/webbapplikationslager. Samma integrations- och api-lager ligger till grund för både scenario 3 och 4. Det här är början på ett centralt index där det blir möjligt att söka i fulltexter bland alla fria titlar i framtiden! Det här möjliggör textanalys och hel del annat intressant som biblioteken kommer att kunna ta del av.

Som en del av uppdraget genomför vi enkäter med Libris-bibliotek. Det underlaget kan vi sedan använda för att avgöra fortsatt riktning, ska vi utveckla en site för urval av fria titlar som en del av ett fortsatt uppdrag? Vi kommer också att arbeta med användartester där vi tittar närmare på interaktionen med materialet, hur fungerar läsning i webbläsaren, navigering, förhållande mellan bild och text och annat spännande!

Fortsättning följer…

7 kommentarer 23 oktober, 2014 Katarina Stempel

Vi tar med e-boken på Bok och Bibliotek 2014

Bild från invigningen av Bok och Bibliotek 2014

Bild från invigningen av Bok och Bibliotek 2014

Att tillgängliggöra e-böcker via Libris

Under vår presentation  under Bokmässan tar Maria Hedenström, avdelningschef på KB, och jag tillfället i akt att berätta om e-boksuppdraget som vi fått från Kulturdepartementet.

Vi gör det i Frågor&Svar-stil:

Vad är en e-bok?
En e-bok är en ett format av en bok som kan läsas på en skärm. T ex en dator, läsplatta eller smart mobil. En e-bok räknas dock inte som bok rent juridiskt, utan som tjänst eller licens. Vilket i sin tur innebär att man inte äger en e-bok. Man får inte göra vad man vill med den. Är den lånad försvinner den efter lånetiden. Är den köpt finns kvar där man laddat ner den, men kan varken säljas eller skänkas.

Vad är det för typ av uppdrag KB har fått för e-boken?
KB har fått i uppdrag av Kulturdepartementet att inleda en försöksverksamhet med att till-gängliggöra e-böcker via Libris till det allmänna biblioteksväsendet. Vi ska redovisa uppdraget 22/2 2015.

Processkarta e-boksflöde, Bild Katarina Stempel

Processkarta e-boksflöde, Bild Katarina Stempel

Vilka leverantörer tänker man ansluta?
För att inom givna ramar och tidspann testa uppdragets innehåll hela vägen arbetar vi med den fritt tillgängliga e-litteraturen. Då föll valet på Litteraturbanken, och vi har glädjande fått OK från dem att använda några av deras e-böcker i testen.

Har det någon betydelse om man är ett Librisregistrerande bibliotek för den funktionalitet som KB utvecklar?
Egentligen inte, men vi tror att det rent flödestekniskt skulle förenklas av att man är bibliotek som registrerar i Libris. Vilket är orsaken till att vi framför allt kommer att vända oss till Librisregistrerande bibliotek för användar- och biblioteks-tester inom uppdraget.

Vad kommer detta att innebära för biblioteksbesökarna?
För biblioteksbesökarna kommer det att innebära att de kan söka och låna en e-bok direkt via sitt lokala bibliotek utan att behöva omdirigeras bort till andra webbtjänster. Samtidigt har besökaren chans att se vilka andra format viss bok finns i på sitt bibliotek.

Vad kommer det att kosta för ett folkbibliotek?
Den teknik KB utvecklar och tillhandahåller kostar ingenting för den som använder den. Om vi får fortsatt finansiering att utveckla en teknisk plattform för tillgängliggörande av e-böcker kommer folkbiblioteken kunna ta del av den utan kostnad.

Finns det något samarbete med SKL i licensieringsfrågan för folkbiblioteken?
Det finns kanske mer parallell verksamhet än samarbete. På KB jobbar vi på med försöksverksamheten. SKL, som har en mycket viktig roll, jobbar med förhandlingar i licensfrågan för folkbiblioteken. Rent tekniskt måste dessa inte bakas ihop just nu. Däremot träffas vi, informerar varandra, och följer varandras arbete. Våra testbibliotek till försöksverksamheten ingår t ex i SKL’s referensgrupp i e-boksfrågan.

Finns det något samarbete med andra aktörer?
Ja, vi samarbetar med andra aktörer. Och det är framför allt distributörer/metadataägare, med information in i vår processkarta, vi samarbetar med å ena sidan. Och vi samarbetar även med kontakter vi behöver i andra änden av processkartan, d v s testbiblioteken. Om uppdraget får växa kommer samarbeten att naturligt behöva berikas. Vi träffar kollegor från Publit, Litteraturbanken, Malmö stadsbibliotek, Atingo, Elib m fl. Det finns många att lyssna på och som visat stort intresse. Naturligt nog tycker många som vi, att en nationell samlad ingång med öppen metadata och hantering är det bästa för framtida e-bokssverige.

Vad händer efter projekttiden?
Vi ska återrapportera till Kulturdepartementet. Förväntan och den mest naturliga riktningen är att KB tilldelas medel för att föra in e-bokshanteringen i reguljär verksamhet. Det är KB som har det övergripande uppdraget idag och det är precis där det hör hemma.

Hur ser de möjliga framtidsscenarierna ut?
Vi ser ett scenario där vi kan erbjuda en One-Stop-Shop för e-böcker. Där folkbibliotek (precis som planeras i testen) kan söka e-böcker, ta hem information, metadata och poster för att hantera sitt urval på liknande sätt som övrig mediehantering. Själva lånet ska också kunna göras här.

E-bokens ljusa framsida och praktiska baksida

Från KB fick vi även möjlighet att delta i en paneldiskussion om e-boken under Bokmässan. Medverkade gjorde: Ann Steiner, Kristina Ahlinder, Katarina Dorbell och jag.
I min initiala presentation nämnde jag, utöver att jag är e-bokssamordnare på KB

  • att jag har ett förflutet som chef för såväl folkbibliotek som forskningsbibliotek, vilket också inkluderar ansvar för mediebudgetar
  • att uppdraget innebär att inleda en försöksverksamhet med att tillgängliggöra e-böcker via Libris till det allmänna biblioteksväsendet
  • att vår förhoppning är att folkbiblioteken med bättre tillgång till e-böcker ska kunna arbeta effektivare med läsfrämjande verksamhet

Man kan se hela inslaget i efterhand här:

http://urplay.se/Produkter/185141-UR-Samtiden-Bokmassan-2014-E-bokens-fram-och-baksida?play_category=f%C3%B6rel%C3%A4sningar+och+debatt

3 kommentarer 30 september, 2014 Gunnel Stjernvall

Behov av utökade resurser för kvalitetssäkring av forskningsoutput

Under sommaren gick Projekt Vidareutveckling av SwePub ut med en enkät för att få underlag till hur resursbehovet ser ut på lärosätena Inför kvalitetssäkring av SwePub Analys.  Svarfrekvensen var utmärkt. Det kom in 31 svar varav 30 var från lärosäten och myndigheter som lämnar in data till SwePub. Av de här 30 är 27 lärosäten aktuella för Vetenskapsrådets lista över lärosäten som kommer att ingå i FOKUS - Forskningskvalitetsutvärdering i Sverige som totalt inkluderar 34 lärosäten. Så här ser enkätssvaren ut visualiserade i analysverktyget Spotfire. I vissa fall saknas data och då är diagrammen missvisande. Ett av lärosätena sticker ut med att ha minimalt med personer som arbetar med datakvalitet men som klarar av den stora publikationsmängden med effektiva maskinella lösningar.

Resurser idag (heltid) och årlig produktion

Resursbehov, årlig

Det är slående hur få heltidsekvivalenter arbetar med datakvalitet i de lokala systemen, en heltidsekvivalent per 1500 publikationer i genomsnitt. För små och mellanstora lärosäten blir det knappt en heltidsekvivalent för arbetsuppgifter inom forskningsdatakvalitet. Om man tänker på arbetet som läggs ner på bibliotekskatalogposter i jämförelse är det troligen en bråkdel. Därmed är det inte förvånande att de flesta lärosätena har behov av att utöka resurser för att uppnå analysnivå, i genomsnitt en heltid till. Några få av de mindre högskolorna som har publikationer under 500 per år känner att de har läget under kontroll. Desto större mängd publikationer per år, desto mer behov av ytterligare resurser för kvalitetssäkring. Kanske inte så överraskande att kompletterande och retroaktiva åtgärder för kvalitetssäkrat data enligt Nationella riktlinjer för dataleverans till SwePub och SwePub MODS-formatspecifikation kräver stora arbetsinsatser för de lärosätena som har stora mängder publikationer. Dock är dessa arbetsinsatser mycket beroende på de lokala systemen och hur enkelt det går att anpassa dem enligt den nationella praxisen och formatspecifikationen. Dessutom behöver lokal praxis uppdateras och information gentemot forskare spridas. Det är dock inte bara under övergångsperioden som mer resurser behövs utan även för det löpande arbetet. För visualisering av resursbehov i jämförelse med hur många som arbetar med forskningsinformation vid lärosätena idag har vi baserat den på en tolkning av fritextsvaren på resursbehov.

Resursbehov

Resurser, behov

 

Det är uppenbart att den komplettering som kräver största arbetsinsatser är ämnesklassificering, speciellt för de lärosätena som har medicin och konst om det bestäms att ämnesklassificering efter SCB/UKÄ-kategorierna på nivå 3 dvs. 5-siffernivå krävs för de ämnen. Det önskas snabbt beslut och riktlinjer för dessa. Komplettering med alla eventuella publikationsidentifikatorer är också mycket arbetskrävande. De mindre lärosätena har inte alltid ens tillgång till Scopus eller ISI-id från WoS. Många har däremot DOI i sina lokala system. Beroende på systemet hoppas en del att kunna lösa identifikationskompletteringar med mappningar mellan olika publikationsidentifikatorer lokalt men en del önskar att det i stället kunde skötas centralt. En del kompletteringsarbete krävs även för fulltextlänkning och införing av nya publiceringstyper. Affiliering till externa lärosäten oroar mest dem som inte har haft möjlighet att lägga till den tidigare.

Att uppskatta hur mycket resurser det behövs inför integrering med Prisma/SweCRIS visar sig vara svårt. Att även forskares tidigare publikationer på andra lärosäten ska registreras lokalt inför projektansökningar i Prisma kräver retroaktiva arbetsinsatser för många av lärosäten. En del tillåter det redan men behöver kvalitetssäkra det och kontrollera affilieringar, en del behöver retroaktivt lägga till det. Här finns önskemål om att detta kunde styras centralt eller maskinellt föras in från andra system. De flesta har redan tankar på att införa ORCID vid sina lärosäten men många av lärosätena tänker låta forskare göra införskaffandet av ORCID-id själva, dock med stöd. Nästan alla kommer ändå behöva ytterligare resurser för hantering av ORCID-id, även de som idag arbetar med införandet.

Överhuvudtaget efterfrågas tydliga beslut, riktlinjer och formatkrav samt önskas en del maskinella lösningar inför kvalitetssäkring av SwePub Analys. Titta gärna på resultatet av enkätssvaren i detalj i analysverktyget Spotfire. Resultatet från enkäten kommer att användas av Vetenskapsrådet som underlag i kostnadsberäkning för det nya systemet.

 

9 kommentarer 26 september, 2014 Tuija Drake

Nästa sida Föregående sida


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler