Datastatus vid leveranserna till Swepub – Sammanställning av enkätsvar

I oktober 2018 skickade Kungliga biblioteket en enkät till de organisationer som levererar data till Swepub. Syftet med enkäten var att kartlägga organisationernas egna uppfattningar om datastatus i förhållande till arbetet med kvalitetssäkringen av publikationsdata i de lokala publikationsdatabaserna samt dataleveranserna till Swepub. Av de 45 organisationer som levererar data till Swepub svarade 33 (ca 75%). Enkätsvaren kommer att användas inom vidareutveckling av Swepub för förbättrade validering och berikning av datakvalitet samt visning av datastatus per levererande organisation.  

Kvalitetssäkring

Nästintill alla organisationer som levererar data till Swepub har kvalitetssäkrat sina poster senast från och med 2012. Årtalet 2012 har pekats som det år då data borde vara kvalitetssäkrade för att kunna användas vid bibliometriska analyser. I många fall är de äldre posterna inte nödvändigtvis kvalitetssäkrade eller ämnesklassificerade på djupare nivå. Ändrade praxis och organisationsstrukturer kan också ha påverkat kvalitet på poster. Särskilt problematiskt att kvalitetssäkra uppges vara identifikatorer, externa affilieringar och konferensbidrag. Överlagt dock är det bra koll på posterna. 

Publikationstyper

Den allra vanligaste och samtidigt även mest kvalitetssäkrade publikationstypen i de lokala publikationsdatabaserna är tidskriftsartiklar. Andra vanligt förekommande publikationstyper är konferensbidrag och bokkapitel. Även rapporter är relativt vanligt förekommande. Utöver tidskriftsartiklar är även avhandlingar, böcker och bokkapitel väl kvalitetssäkrade. Däremot är konferensbidrag, som är svåra att belägga, samt rapporter inte lika kvalitetssäkrade i jämförelse. 

Ämnesklassificering

Enligt Nationella riktlinjer för beskrivning av vetenskaplig output ska ämnesklassificeringen anges minst på nivå 2 utifrån Statistiska centralbyråns (SCB) och Universitetskanslersämbetets (UKÄ) Standard för svensk indelning av forskningsämnen 2011, förutom för konst och medicin där ämnesklassificeringen ska ligga på nivå 3. Ca 41% av svarande anger ämnesklassificering  vanligtvis på nivå 3 (5-siffernivå) och ca 34% på nivå 2 (3-siffernivå). Ca 16% anger det på olika nivåer beroende på ämnesområdet. Ca 9% anger ämnesklassificeringen på övergripande nivå 1 (1-siffernivå). Det som försvårar ämnesklassificeringen är framför allt saknaden av lämpliga ämneskategorier, främst för tvärvetenskapliga ämnen, men även bristande ämneskunskap, närmast inom medicin, naturvetenskap och teknik. 

Metadatakrav

Det som upplevs svårast att kvalitetssäkra utifrån de krav som Vetenskapsrådet ställer för att data ska kunna inkluderas vid bibliometriska analyser är framför allt affilieringar (ca 50%). Delvis är detta på grund av att affilieringen inte alltid framgår ur publikationen, speciellt i bokkapitel och böcker, delvis att det skulle vara tidskrävande att ange affiliering även till alla externa. Kravet på ämnesklassificeringen på nivå 2 anges som andra svårast att uppfylla på grund av de ovan nämnda orsakerna. Även kravet på DOI anses vara svårt eftersom DOI inte alltid finns utdelat för alla publikationer eller saknar information om detta, främst organisationernas egna publikationer och konferensbidrag. 

Önskemål

Önskemålen gällande kvalitetssäkringen i de lokala publikationsdatabaserna samt Swepub handlar framför allt om tid och resurser att utföra arbete med datakvalitetshöjande åtgärder. Dels önskas tid och resurser för att manuellt kontrollera data som har lagts in i de lokala publikationsdatabaserna, även bakåt i tiden, dels för att kunna rätta till poster som har markerats som ofullständiga av Swepub.

En stor del av önskemålen handlar även om tydlig kommunikation och riktlinjer samt verktyg från Swepub. Automatisk ämnesklassificering förväntas vara till hjälp med de problem som upplevs med ämnesklassificeringen men på sikt önskas revidering av SCB/UKÄ-ämnesklassificeringen så att den motsvarar svenska forskningsförhållanden bättre.

Möjligheten att exportera listor på publikationsposter som har markerats som ofullständiga av Swepub uppskattas. Det önskas dock tydligare rapportering kring ofullständiga data samt tydliga riktlinjer om kraven på metadata. Att kunna validera publikationsposter direkt samt kontinuerliga uppdateringar vore i och för sig ännu bättre. Det önskas även högre support-beredskap hos Swepub. 

Dataleveranserna

I dagsläget utesluter ingen av de svarande organisationerna data från leveranserna. Däremot är det några organisationer som inte för tillfället levererar data på grund av serverbyte. För den här typen av uppehåll önskas möjlighet att markera och kommunicera detta utåt till slutanvändare. 

Önskemål gällande dataleveranser rör framför allt välfungerande och uppdaterat Swepub med tydliga felrapporter och användarvänligt gränssnitt för administrering av dataleveranser för att hjälpa organisationer med datakvalitetshöjande arbete. Informationen om dataleveranser och kraven på metadata samt om processen för hantering av data i Swepub bör vara lättillgänglig och tydlig. Automatisk ämnesklassificering står också på önskelistan. 

Slutsats

De organisationer som levererar data till Swepub arbetar aktivt med kvalitetssäkringen av data i sina lokala publikationsdatabaser. Det som påverkar datakvalitet handlar om saknaden av informationsunderlaget, exempelvis affilieringar och identifikatorer, saknaden av kategorier, exempelvis vissa ämneskategorier eller publikationstyper, tekniska förutsättningar samt stöd från Swepub i form av tydliga krav, riktlinjer, tekniskt support och verktyg. Den allra största påverkan på datakvalitet har dock tid och resurser, framför allat gällande registrering och kvalitetssäkring av de publikationer som inte finns med i kommersiella databaser som Scopus och Web of Science. Om höjning av datakvaliteten anses vara viktigt av ledningarna vid de organisationer som deltar i Swepub och intressenterna för Swepub, behöver resurser utses även till detta arbete utöver vidareutvecklingen av Swepub.

 

Läs hela sammanställningen.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.