Filed under: Metadata

Skapa samsyn på registrering av publikationer – ”Praxisarbetet” med SwePub

Som vi tidigare berättat om i samband med projekt vidareutveckling av SwePub, har praxisgruppen börjat arbetet med Nationella riktlinjer för dataleverans till SwePub av forskningspublikationer för analys, och arbetet är nu i full gång! bild_riktlinjer

Vi vill därför passa på att berätta mer om vad vi gör i arbetsgruppen. Vi som arbetar med praxisdelen heter Pieta Eklund (HB), Mikael Graffner (LU), Bodil Gustavsson (SU), Taeda Tomic (SLU), David Scheutz (KTH) och Jessica Lindholm (sammankallande KB).

Syftet med arbetet är att skapa samsyn på registrering av publikationer inför leverans till SwePub, hur formatet ska tillämpas, vilket innehåll som krävs med särskilt fokus på problemområden kring publikationstyper och hur de ska kunna registreras och skickas vidare till SwePub på ett sätt som möjliggör rimliga analyser.

I en första iteration har vi tagit oss an vilket innehåll som kan tänkas behöva finnas i SwePub, genom att sammanställa ett nytt underlag med publikationstyper som baseras på de nuvarande i SwePub, med utökning av outputs från CASRAI. CASRAI är ett initiativ kring att skapa interoperabilitet för beskrivningar av forskningsinformation, som kan underlätta uppbyggnad och utbyte av information i det svenska ekosystemet för forskningsinformation och i förlängningen i internationella sammanhang. Du kan läsa mer här, www.casrai.org.

SwePub behöver förstärkas för att täcka den konstnärliga forskningen och en genomgång av det som redan nu är möjligt i SwePub ses samtidigt över, till exempel avseende konferensbidrag. Vi har hunnit med att skicka ut ett första underlag för återkoppling till de som gör analys, till det konstnärliga forskningsområdet och till leverantörer av data till SwePub. Vi har fått mycket gensvar kring underlaget och arbetar nu med att sammanställa och finputsa praxis kring vilket innehåll som verkar mest nödvändigt att ta med för analys.

Nästa iteration kommer att behandla upphovspersoner – deras IDn, affilieringar, roller, antal, namn och födelsedatum. Några exempel på utmaningar är att definiera vilka upphovsmannaroller som ska kunna uppges och hur och när de ska kopplas till den organisation de tillhör, och så vidare.

Har du frågor om praxisgruppens arbete, hör gärna av dig till gruppens sammankallande, jessica.lindholm@mah.se, eller någon annan av oss i projektet.

4 kommentarer 24 april, 2014 Marja Haapalainen

Statusrapport Libris nya katalogiseringsverktyg

Arbetet med Libris nya systemarkitektur (Libris XL), formatprojektet och det nya katalogiseringsverktyget går för högtryck under våren.

Vi arbetar i utvecklingssprintar om vardera ca två veckors arbetstid. Varje sprint inleds med ett planeringsmöte för den kommande arbetsperioden där vi bestämmer vilka arbetsåtaganden vi tar på oss. Sprinten avslutas med en demo där vi går igenom det som utvecklats. Vi uppdaterar även betaversionen  med de implementerade förändringarna. En grundprincip för utvecklingsarbetet här på KB är att vi vill arbeta för “öppen ridå”, vilket innebär att vi bjuder in användare att följa pågående utvecklingsarbete. Förändringarna kan ibland se märkliga ut, funktionalitet som tidigare fungerat kan vara icke-funktionell vid ett senare tillfälle, data kan ibland innehålla svårbegripliga värden osv. Detta beror på att vi är mitt i utvecklingsprocessen, vilket också speglas i Betan som uppdateras ett par gånger per månad. På startsidan går det också att hitta kontinuerligt uppdaterade informationstexter om projektet, presentationer, story maps, beskrivningar och visualiseringar av formatarbetet med mera. Dessutom sammanfattar vi då och då det vi gjort och publicerar här på Librisbloggen.

Nedan följer en summering av vad som hänt i utvecklingsarbetet under senaste tiden.

Formatet
1. Egenskaper om verket och det/de format (bärare) som finns i posten har mappats ur de fasta fälten 008 och 007. Detta arbete har successivt lett till en revidering av beskrivningsstrukturen, för att kunna fungera sammanhängande för beskrivning av bland annat upprepade bärardetaljer. Mer detaljerad information om bärartyperna kan nu också ses i gränssnittet. Detta är exempel på data som än så länge ser något kryptiskt ut på grund av värdet innehåller ett påhängt JSON-LD-prefix vilket naturligtvis ska städas bort.

En utmaning ligger i att MARC-formatet saknar bra stöd för att gruppera beskrivningar av olika ting i en och samma post, vilket leder till upprepningar som är svårtolkade (t.ex. vid upprepning av 007, och kombinationer av fält såsom 034, 255, 300, 530 och 856). I arbetet med strukturen måste hänsyn även tas till nya typer av resurser som ska katalogiseras i framtiden, så att vi inte komplicerar beskrivningsmönstren för dessa i onödan.

2. Ett antal definitionslistor har tagits fram, vilka representerar värden för ovanstående egenskaper. En del av dessa kommer att behöva genomgå konsolidering med annan information, inte minst genre/form, samt information angiven i de nya RDA-fälten (336-338).

Vi arbetar för närvarande med att göra dessa sökbara via katalogiseringsgränssnittet.

3. Koordinering har gjorts av olika kombinationer av ”medietyp” och ”bibliografisk nivå” i postetiketten, liksom av detaljer i innehålls- och formattyp i 007 och 008. Detta har gjorts främst med hänsyn till BibFrame, men även till andra bibliografiska modeller såsom Dublin Core. Samma problem vid upprepning gäller här, varför vi behöver hålla isär olika aspekter på vad som i många fall rimligtvis är samma ting.

4. Flera egenskaper har mappats, vilka vi kopplar ihop med direkta motsvarigheter i BibFrame där det är möjligt, bl.a. för titlar och anmärkningar.

Vi kommer att fortsätta med att normalisera denna struktur, bl.a. för att möjliggöra ett förbättrat utnyttjande av verksbeskrivningar i auktoritetsposter. Normaliseringen fortsätter också med översyn av fler egenskaper, så att de anges på ett enhetligt sätt och i möjligaste mån korresponderar mot befintliga termer i välkända vokabulärer.

Frontend
I gränssnittet har vi under våren jobbat mycket med träfflistan, remotesök och fullposten. Remotesök är nu implementerad och fungerar skapligt. Värt att notera är dock att det går mot en testmiljö där endast ett fåtal källor fungerar. För att testa funktionaliteten föreslår vi att man söker mot Library of Congress eller Eesti Rahvusraamatukogu (Estlands nationalbibliotek).

I fullposten finns det nu fler fält och mer information, framför allt utökad titelinformation och anmärkningssektion.

Backend
Vi har byggt om lagringssystemet i backend för att på ett mer strukturerat sätt kunna hantera mängden data. Med den förändringen kommer också versionshistorik på poster, vilket innebär att systemet istället för att spara över förändrade poster sparar en ny version med det senaste datat. Det innebär att man kan gå tillbaka till tidigare versioner av poster om man skulle vilja.

Mycket arbete har lagts ner på optimering av datahantering och indexeringar och bearbetning av datat går mycket snabbare nu än tidigare.

Lina planering

1 kommentar 15 april, 2014 Harriet Aagaard

Läs i påsk! Rapporten Libris för folkbiblioteken

Libris för folkbiblioteken – samarbete i en nationell katalog finns nu att läsa. Rapporten har tagits fram av KB tillsammans med Arbetsgruppen för folkbibliotekens medlemskap i Libris.

Arbetsgruppens uppdrag har varit att titta närmare på folkbibliotekens behov och förutsättningarna för att de ska kunna gå med i Libris. Arbetsgruppen tillsattes av Styrgruppen för Libris nationella bibliotekssystem och Expertgruppen för metadata.

Det långsiktiga målet med folkbibliotekens medverkan i Libris är en nationell katalog som har användarna i fokus, erbjuder möjlighet till överblick över de medier som finns och är tillgänglig för låntagare i hela landet.

rapportbild

Libris för folkbiblioteken – samarbete i en nationell katalog

2 kommentarer 15 april, 2014 Hilda Androls

Informationsfilm om Librissamarbetet, postförsörjning och Libris Förvärvsrutin

YouTube Preview Image

Vi planerar att ta fram filmer som kan användas bland annat i utbildning för Libriskatalogisatörer och börjar med en film om Librissamarbetet och postförsörjning.

Christer Larsson ger här en översikt över hur KB och Libris idag tillgodoser bibliotekens behov av postförsörjning via automatiserade rutiner, både i fråga om bibliografisk information och om beståndsinformation – med fokus på det postflöde som går under benämningen Libris Förvärvsrutin. Presentationen beskriver också hur Librisbiblioteken gemensamt kan bidra till att successivt förbättra den bibliografiska kvaliteten på sina poster.

2 kommentarer 21 mars, 2014 Helena Forssblad

Förstärkning i SwePub-projektet

JessicaVi är glada över att ha rekryterat Jessica Lindholm till projektet Vidareutveckling av SwePub! Jessica rivstartade den 10 mars och kommer att arbeta särskilt med frågor kring SwePubs praxis vid dataleverans av forskningspublikationer för analys.
Dagar då hon inte arbetar hos oss hittar vi henne på Malmö högskola.
Jessica har arbetat med frågor kring metadata och publicering inom och utanför Sverige sedan år 2000.
Varmt välkommen Jessica!

1 kommentar 17 mars, 2014 Marja Haapalainen

SwePub för analys – statusuppdatering

Projektet Vidareutveckling av SwePub är i full gång med aktiviteter sedan januari inom tre huvudspår: Analys, Praxis och MODS.
Analys
Projektgruppen jobbar med kravfångst av analysbehov hos Vetenskapsrådet. Vi undersöker deras behov och hur krav kommer att se ut i nya resursfördelningsmodeller. Vi berättar om vad som är möjligt att göra med data i nuläget i SwePub och vilka förändringar som införs.
Projektet kommer att anordna en workshop med SUHF bibliometriarbetsgrupp för att ta reda på vilken bibliometri som görs på lärosätena idag och vilka framtida behov denna målgrupp ser. Intervjuer med ett antal forskningsfinansiärer planeras också som komplement till underlag från Vetenskapsrådet.
Resultatet av detta spår förväntas bli en kravbild på data som behövs i SwePub för att uppfylla analysbehoven hos dessa två målgrupper, forskningsfinansiärer och lärosäten.
Tills dess att analysbehoven blir konkretiserade jobbar projektet med hypotetiska behov inom Praxis och MODS.

Praxis
Arbetsgruppen Praxis har träffats och börjat arbetet med Nationella riktlinjer för dataleveranser och praxis – forskningspublikationer till SwePub. Arbetet inleds med att se hur man kan stödja analys av publiceringskanaler per organisation, utifrån antagandet att:

Fler och bättre definierade publikationstyper stödjer analys av publiceringsfrekvens fördelat på publiceringskanal/publikationstyp och innehållsanmärkning (refereegranskat, övrigt vetenskapligt eller populärvetenskapligt) per organisation.

Vad krävs för praxis vid dataleverans blir frågan för arbetsgruppen. Problemområden är tex hur konferensbidrag och konstnärlig forskning ska kunna registreras på ett sätt så att det går att göra rimliga analyser.

MODS
Fokus MODS är inne på tredje iterationen av formatöversynen och uppdateringen. Varje iteration utgår från ett hypotetiskt analysbehov och leder till en delversion av Formatspecifikation för SwePub MODS. Det går alltså redan nu att börja leverera data enligt version 2.2. Målet är version 3.0 då det viktigaste elementen som är kopplade till analysbehov finns definierade. Detaljerad information om formatreleaser skickas ut på Swepub sändlista.
Första iterationen utgick från att stödja retrospektiva analyser: vad har publicerats vid en organisation. Antagandet här var att:

Identifiering av författarnas affilierade organisationer möjliggör författarfraktionerad statistik över antal publikationer per organisation.

Vilket data och vad krävs av det blev utmaningen för fokusgruppen. Resultatet blev införande av identifierare för organisationer liksom uppgift om antal upphovspersoner per publikation. Dessutom det viktigaste – hur forskarens affiliering ska kopplas till organisationsidentifieraren.
Andra iterationen stödjer prospektiva analyser: vad har forskare vid en organisation publicerat. Antagandet här var att:

Identifikatorer för forskare och publikationer möjliggör analys av vilken potential forskare vid organisationen har oavsett organisationstillhörighet.

Resultatet blev bla att den globala identifieraren ORCID infördes och hanteras nu både i formatet och systemet.

bild_system_praxis_mods_analys
SwePub för analys
Den prototyp som togs fram har utvecklats till ett system med alla relevanta komponenter på plats, motsvarande en Minimum Viable Product. Befintligt inflöde av data till SwePub söktjänst utnyttjas och nya regler för identifiering av dubbletter finns inplementerat och kommer att förbättras allt eftersom nytt data kommer in i systemet. Datat konverteras från MODS till RDF och bor i en sk Triple store. Arbete pågår även kring integrering med Libris XL. Vi kommer att tillgängliggöra API:er till lärosätena och Vetenskapsrådet så att de kan skicka in frågor till systemet för att fånga upp data till analyser.
Vi arbetar i en iterativ process som bygger på idégenerering, datainsamling (metadata och ny kunskap!), analys och ständigt lärande. Ambitionen med systemet är att:
• Fånga upp problem tidigt och arbeta med modifieringar av de krav och lösningsförslag som tas fram i format- och praxisfrågor, samt se hur vi kan trolla i systemet.
• Hålla fokus och tillsammans med projektets intressenter dvs lärosätena och forskningsfinansiärerna definiera krav på vad som är relevant och tillräckligt.
• Testa data mot analysbehov och ge Vetenskapsrådet och lärosätena möjlighet att göra analyser och få kontroll på data och dess utgångsläge samt se vilka möjligheter som finns.

Som stöd i arbetet med datakvalitet och analyser tillhandahåller projektet ett analysverktyg. Med det kan man ta fram underlag till arbetet med datakvalitet då verktyget möjliggör koppling till källdata (MODS-poster). Det är också möjligt att se status på egna data i jämförelse med övriga lärosäten, samt att stämma av egna data mot analysbehoven. Analysverktyget blir också den metod som projektet använder för att kommunicera och visualisera hur data utvecklas.

2 kommentarer 13 mars, 2014 Marja Haapalainen

Bubblor visar omappade MARC-data

Med Libris XL kommer vi som bekant att lämna MARC21 som internt lagringsformat och i stället arbeta med en datamodell som bygger på länkad data, JSON-LD (Java Script Object Notation for Linked Data). Alla Librisposter kommer då att representeras som generiskt länkad metadata och vara kompatibla med kontexten i hela den semantiska webben.

För att nå dit måste nuvarande MARC-struktur mappas till den nya JSON-LD-modellen. Mycket har gjorts, men ännu återstår en hel del mappningsarbete. Niklas Lindström – som arbetar i Libris XL-projektet och är en ledande expert inom området länkad data – har tagit fram ett visuellt verktyg i form av bubblor för statistik på vilka MARC-fält och delfält som ännu inte är mappade.

Statistikbbubblorna är intressanta att studera. Man kan se vilka MARC-fält och delfält som är vanligt förekommande och vilka som bara förekommer marginellt. De är också ett verktyg för metadataanlys och prioritering, dvs mappningsarbetet blir mest effektivt om man börjar med de stora bubblorna. Mappningsarbetet får omedelbar effekt på vad som kan vidareutvecklas i katalogiseringsgränssnittet. Det fungerar också som analysverktyg, både för ”återkonvertering” till MARC21 (som behövs för Librisbibliotekens postförsörjning) och för städning av Librisdatabasen.

För att se vilka fält i MARC21 som ännu inte blivit mappade mot JSON-LD i bibliografiska poster

För att se vilka fält i MARC21 som ännu inte blivit mappade mot JSON-LD i auktoritetsposter

De yttre bubblorna grupperar respektive MARC-fält och de inre representerar omappade delfält. Storleken på varje bubbla är baserat på antal poster som innehåller värden för fältet/delfältet. Om du håller pekaren över en bubbla får du information om det faktiska antalet poster samt de fem vanligaste värdena. Du kan också följa hur bubblorna – och relationerna mellan dem – förändras i takt med att mappningsarbetet fortskrider.

Bubblorna fungerar bäst i Chrome och Firefox. Det går att zooma med den vanliga webbläsar-zoomen (Äpple-Plus på Mac, Control-Plus på PC).

I de bibliografiska posterna finns de största bubblorna bland de fält som länkar mellan sammanhörande bibliografiska poster (760-787). Man kan till exempel utläsa att det finns en stor mängd omappad metadata med länkar till en huvudpublikation (772). Majoriteten av dessa är, dels länkar i de poster som KB maskinellt genererar för inflöde av e-plikt och digitalisering (Digidaily), dels länkar som genererades vid den stora konvertering till MARC21 som genomfördes omkring 2001. Fält 041 är kompletterande språkkoder (originalspråk, språk i sammanfattningar m.m.). Bland de riktigt små bubblorna hittar man också fält som är ogiltiga enligt MARC21, dvs de innehåller okända värden och kan för det mesta rensas bort ur Libris.

”Monsterbubblan” i auktoritetsposter är ett kodfält för nationalitet/verksamhetsområde (043).

Se Libris Fomathandbok [http://www.kb.se/katalogisering/Formathandboken/] för MARC-fältens och delfältens innebörd.

mappningbubblor

4 kommentarer 14 februari, 2014 Harriet Aagaard

Film om katalogprojektet

YouTube Preview Image

Nu kan du se filmer från webbinarierna om Libris XL och det nya katalogiseringsverktyget.

Kungl. biblioteket utvecklar ny systemarkitektur och nytt katalogiseringsverktyg. I och med detta lämnar vi Marc21 som internt lagringsformat och en viktig del av projektet är att översätta Marc-data till den nya strukturen, JSON-LD (Java Script Object Notation for Linked Data). I denna film berättar vi översiktligt om projektets olika delar. Vår målsättning är att Libris XL och katalogiseringsverktyget under hösten 2014 kommer att ersätta nuvarande katalogiseringsklient Voyager.

Vid tre webbinarier fick deltagarna möjlighet att ställa frågor via chatt till Libris utvecklingsteam.

Webbinariernas olika frågestunder:

Frågestund 17 december 2013

Frågestund 9 januari 2014

Frågestund 30 januari 2014

4 kommentarer 7 februari, 2014 Helena Forssblad

Uppdaterad information om Libris XL och nya katalogiseringsverktyget

Libris arbetar med att utveckla en ny systemarkitektur, Libris XL, och ett nytt katalogiseringsverktyg. I det nya systemet lämnar vi MARC21 som internt lagringsformat och använder istället JSON-LD (JavaScript Object Notation for Linked Data) som datastruktur för lagrad data.

Vi har haft som målsättning att driftsätta systemet under första kvartalet 2014, men behöver nu justera tidsplanen för projektet och räknar med att Libris XL ska vara i skarp drift under hösten 2014. Redan till sommaren räknar vi dock med att den betaversion som finns tillgänglig i princip ska motsvara de krav vi ställer på en första version av Libris XL och det nya katalogiseringsverktyget.

Viktig information är att alla API:er som används i dagsläget kommer att finnas kvar i befintligt skick även efter det att vi släpper nya Libris XL. I framtiden kommer vi att se över befintliga API:er och metadatauttag och vid behov även byta ut eller förnya dessa. Detsamma gäller import/export av metadata (mer om detta nedan).

Införandet av Libris XL innebär att vi lämnar MARC21 som internt lagringsformat. Vi lägger ner ett stort arbete på att översätta MARC21 till en ny informationsmodell uttryckt i JSON-LD. Genom detta konverteringsarbete kan vi beskriva och presentera den bibliografiska informationen på ett annat sätt än tidigare. Vi jobbar med målsättningen att komma bort från postbegreppet och istället använda en entitets-, eller objektbaserad modell, mer lik den som används i Bibframe. I den interna metadatastrukturen går informationen att gruppera i olika nivåer, och liksom Bibframe använder vi oss av de FRBR-inspirerade indelningarna Verk (ungefär motsvarande Verk och Uttryck) och Instans (ungefär motsvarande Manifestation).

Bearbetningen av data från MARC21 till den nya informationsmodellen görs på hela datamängden i Libris, det vill säga inklusive befintliga poster, inte bara nya. Den nya informationsmodellen är anpassad till en framtida övergång till RDA (Resource Description and Access) vilket betyder att Librisdata vid övergången till ny katalogiseringsstandard kommer att spegla dessa förändringar. Vissa manuella och/eller maskinella insatser kan dock behövas för att anpassa till rena praxisförändringar.

Även om vi övergår till ett nytt lagringsformat kommer posterna precis som tidigare att kunna tas ut i MARC21. Man kommer precis som tidigare också att kunna importera MARC-poster via t.ex. Metaproxy. Förändringarna handlar om hur vi internt behandlar metadatat. Det sätt på vilket vi hanterar import från andra källor (t.ex. Metaproxy och DiVA) respektive export till t.ex. lokala system, kommer inte att påverkas. Nuvarande BibID från Voyager kommer att följa med i den nya strukturen för att garantera konsistens. Interpunktionshanteringen kommer däremot att tas om hand av systemet, vilket innebär att den fortsätttningsvis inte kräver manuell handpåläggning.

För att det ska bli en smidig övergång från Voyager till Libris XL kommer den att göras stegvis, detta för att inte riskera produktionsstopp. Målsättningen är att driftsätta under hösten 2014. Voyager kommer dock inte att stängas ner innan vi är säkra på att Libris XL är stabilt och att alla flöden fungerar.

Release notes 18 december för Libris katalogisering, betaversion

Nytt i redigeringsverktyget:

 • Semifunktionell prototyp av personhantering med tillägg av roller (förändringar av roller påverkar ännu inte den data som sparas).
 • Ny hantering av definitionslistor (för t.ex. språk-, lands- och roll-/funktionskoder), med uppdaterad data.
 • Enhetlig teknik för sökning av auktoriteter och definitioner.
 • Förbättringar av sökning på personer och ämnen (ännu inget stöd för att skapa lokal definition av ett ämne).
 • Minskade marginaler i sidhuvud och marginaler för att ge en mer kompakt arbetsyta.
 • Förbättrat utseende i JSON-LD-vyn.


I LibrisXL har följande implementerats:

 • Fortsatt arbete med att hitta och skapa länkar till extraherade entiteter, nu inklusive Organization och Work
 • ElasticSearch, tokenisering i index och möjlighet att ställa in konfigurering specifikt per indextyp
 • Förberedelse inför möjlighet att göra sökning mot externa kataloger via Z39.50. API som gör sökning mot metaproxy (där en testinstans i ett första steg söker mot LC Library of Congress, ESTER Estland och NLE Spanien) och returnerar metadata i JSON-LD.

Välkommen att testa
Betan är som vanligt tillgänglig på http://kat.libris.kb.se.

Det återstår fortfarande en hel del funktionalitet att arbeta vidare med i katalogiseringsgränssnittet, men vi tar tacksamt emot synpunkter på de funktioner som har tillkommit. Följ gärna de testanvisningar som finns längst upp till vänster på startsidan och hör av er med synpunkter och förbättringsförslag till oss på Tyck till-forumet i gränssnittet.

För att använda Libris katalogisering krävs inloggning. Har man ett konto för att beståndsregistrera i nuvarande tjänst Libris beståndsregistrering, kan man använda dessa uppgifter för att logga in. Det går dessutom att testa betaversionen av katalogiseringen med användarnamn: test och lösenord: test.

Tänk också på att katalogiseringsverktyget inte fungerar tillsammans med vissa webbläsare. Libris katalogisering är utvecklad med HTML5/CSS3 och kräver en webbläsare med bra stöd för dessa standarder samt att JavaScript är aktiverat. Vi rekommenderar därför uppdaterade versioner av Google Chrome eller Mozilla Firefox. Vi jobbar på att få Internet Explorer att fungera, men systemet kommer inte att stödja tidigare versioner än IE 9, (här kan du testa din browser och se hur väl den stöder HTML5).

8 kommentarer 18 december, 2013 Helena Forssblad

Från fokusstruktur till effektmål

”Vidareutveckling av SwePub” har tre intressenter; Sveriges lärosäten, Vetenskapsrådet och KB. Lärosätena producerar och levererar data till SwePub idag. Vetenskapsrådet har behov av att göra gör analyser och jämförelser baserat på lärosätenas data. KB förvaltar SwePub och äger projektet för dess vidareutveckling.  Projektet tar avstamp i frågor och behov från lärosätena som sammanställts under projektets förberedelsefasen (se tidigare inlägg) och kommer att arbeta nära dem i projektets olika delar.

Projektet utgår från följande hypotes: För att få in data som håller för analys från lärosätena till SwePub behöver man veta vilka analysbehoven är och se hur datat kan komma till användning och nytta i forskningens ekosystem. Ifrån hypotesen har vi formulerat effektmål och ringat in aktivitetsområden.

Projektet kommer att arbeta mot dessa effektmål:

 • Analyser och jämförelser av svensk forskning på nationell nivå är möjliga att utföra med data från SwePub.
 • SwePub stödjer forskarens och lärosätets processer genom att vara en del av forskningens ekosystem.
 • Kvaliteten på data bibehålls över tid genom samverkan kring nationella riktlinjer för dataregistrering och validering av publikationer.

Under första kvartalet 2014 kommer projektet att ta fram en kravbild för data i samverkan med Vetenskapsrådet. I samband med det blir det också intressant att undersöka vilka andra forskningsfinansiärer som är intresserade av SwePub-datat och hur deras krav ser ut.

I januari 2014 startar arbetsgrupper eller fokusinsatser kring utarbetande av nationella riktlinjer för dataregistrering och praxis kring lokala publikationsdatabaser. Fokus är att ta reda på vilka förändringar som behövs för att ge SwePub förutsättningar att bli en datakälla som används för analyser. Bland annat kommer ett samlat grepp att tas om MODS-formatet. Det finns ändringsförslag som tar hänsyn till analysbehov, men mycket arbete kommer att behöva läggas på att skapa samsyn på hur formatet ”ska fyllas”. Dessa insatser kommer att efterföljas av arbete kring hur kvalitetskontroll kan utföras. Det bör vara tydligt hur en publikation har validerats och bedömts vara godkänd för att användas i analyser. Även här behövs nationella riktlinjer.

Den tekniska utvecklingen kommer att redan från januari fokusera på att integrera SwePub i LibrisXL. Det betyder bland annat att formatet MODS kommer att modelleras till RDF och att hanteringen av dubbletter (deduplicering) kommer att omarbetas helt och hållet. Allt eftersom arbetet med kravställning på data men också dataregistrering och praxis fortlöper, så kommer projektet att visa upp exempel/scenarion på vilka möjligheterna blir med datat dvs datats användning och nytta.

Projektets styrgrupp har haft sitt första möte, projektplan finns, en referensgrupp är på plats och en utvecklare är rekryterad. Efter höstens förberedelser kommer projektet att starta på allvar i januari 2014. Följ projektet på Twitter @SwePub

Mer om processen Fokusfrågor och aktiviteter.

9 kommentarer 9 december, 2013 Marja Haapalainen

Föregående sida


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler