Sommar i Swepub

Oavsett om sommaren är kort eller inte, kommer Swepub nu att pausa för sommaren. Det har varit mycket intensivt slut av vårterminen med massor av aktiviteter. Den nya systemarkitekturen för inkommande data i Swepub finns framtagen som proof-of-concept för höstning, konvertering, validering, korrigering/berikning och deduplicering av data. Alla moduler i detta flöde ska fungera oberoende av varandra och vara flexibla för modifieringar. Detta underlättar stabila och snabba inflöden och uppdateringarna. En ytterligare fördel är att både sök- och analystjänsten kommer att baseras på samma bearbetade data vilket inte är fallet i dagsläget.

Bearbetning av inkommande data till Swepub illustrerad. Efter att data har höstats in, sker konvertering till Swepubs interna format. Data valideras och skickas vidare till berikning och tillbaka till validering tills data är färdiga för deduplicering. Först efter dedupliceringen publiceras data i Swepub sök- och analystjänsten.

Nu pågår arbete för att skapa valideringsprocesser för inkommande data. Först i tur är validering av ISSN som ska ske mot ISSN-portalen. Parallellt pågår utveckling av gränssnitt för händelseloggen för att tydligt visa hur data har bearbetats, vad som har validerats och rättats till eller berikats. Utöver detta pågår arbete med revideringen av format och praxis samt tjänstutveckling utifrån användarbehoven.

Gruppen för Swepub, som nu byter sitt namn till Swepub utvecklingsråd, hade ett extrainsatt möte den 13 juni för att återkoppla till SUHF-projektets slutrapport om datakvalitet i Swepub ur ett lärosätesperspektiv. Utifrån de föreslagna scenarier, 1) Swepub börjar göra nytta, 2) Swepub som megadatacirkulator och 3) Swepub läggs på is, enades om att arbeta enligt scenario 1. Scenario 1 utgår från a) basnivå av dataleveranser som lärosätena kvalitetssäkrar utifrån en nerbantad version av Vetenskapsrådets (VR) beställarunderlag med stöd från Kungliga biblioteket (KB), b) VR börjar använda Swepub för analyser, c) KB lyfter och förankrar en långsiktig vision för Swepub. Minnesanteckningarna från mötet och SUHF-projektrapporten finns publicerade på http://www.kb.se/bibliotek/Forum-for-nationell-bibliotekssamverkan-och-utveckling/SwePub/.

Referensgruppen hade sitt första möte den 20 juni. På agenda fanns både revidering av formatspecifikationen och outputtyperna samt workshop kring gränssnittet för händelseloggen. Minnesanteckningarna och presentationen från mötet finns på http://www.kb.se/bibliotek/Forum-for-nationell-bibliotekssamverkan-och-utveckling/SwePub/Referensgruppen-for-SwePub/.

Några inbjudna bibliometriker workshopade kring gränssnittet för analys och bibliometri den 7 juni. Föga förvånande var det datakvaliteten som efterfrågades. Det bör vara tydligt redogjort vad status på data i Swepub är, vad som är kvalitetssäkrade med tidsangivelse, täckningen av både organisationer och outputtyper, och avvikelser i dataleveranser samt vad för standarder och urvalskriterier används i Swepub. Det ska vara möjligt att exportera en färdig datadump eller ett modifierat uttag på originaldata eller deduplicerade data enligt filtrering i de vanligaste formaten: tsv, csv, xml och json. Det ska även finnas dokumenterade APIer lätt tillgängligt.

Vidareutvecklingen fortsätter i augusti utifrån inputen från Swepub-grupperna och workshoparna. Swepub-projektgruppen önskar glad sommar!

Swepub-projektgruppen: Martin Malmsten, Anna-Clara Rendahl, Sanna Frese, Bodil Wennerlund, Tuija Drake och Tobias Widén

 

 

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.