Filed under: Utveckling

Åtkomst till WorldCat framskjutet till 2 september

Avtalet med OCLC om medlemskap och åtkomst till WorldCat börjar gälla idag 1 september. På grund av problem hos OCLC kommer vi inte att kunna ge åtkomst till WorldCat i Voyager förrän imorgon tisdag 2 september.

Kommentera 1 september, 2014 Maia Dexander

Kom igång med SwePub Analys i praktiken!

Välkomna till en heldag i Stockholm den 11 november kring SwePub för analys! Dagen riktar sig till dig som arbetar med att säkerställa att god metadata levereras till SwePub.

Fokus för dagen är ett byte av erfarenheter mellan oss som är aktiva i publiceringsdatabaserna och arbetar med metadatakvalitet i praktiken och kring vilka sätt SwePub Analys påverkar arbetet. Vi undersöker tillsammans vidareutvecklingen av SwePub utifrån vår lokala publiceringshantering och samtalar kring behov nationellt och lokalt, dess möjligheter och utmaningar. Alla som deltar kommer att få möjligheten att presentera och initiera samtal.

Anmälan och mer info kommer snart, men markera gärna tisdagen 11/11 i kalendern så länge och fundera på vad du vill ta upp!

9 kommentarer 28 augusti, 2014 Jessica Lindholm

Milstolpar i utvecklingen av SwePub Analys

Här kommer resultatet av vårens arbete. Vi är mycket nöjda och glada över att kunna sammanfatta arbetet kring SwePub Analys med följande dokument:

SwePub Analys handlar om att kvalitetssäkra metadata och systemet vi utvecklar kommer inte att ha ett gränssnitt vilket gör att vi får ta till andra medel för att visa det. Å andra sidan, eftersom data finns på plats, är det fritt fram för alla att titta och använda (fastän kanske inte så intuitivt som man skulle önska...). Systemet har alla grundläggande komponenter vilket innebär att det kan ta emot data enligt de kraven som vi har tagit fram i iterationerna, och det går att skapa tex publiceringsprofiler så som det är tänkt att fungera i Fokus, Forskningskvalitetsutvärdering i Sverige. Iterationerna har vi nu sammanfattat med ovanstående dokument, men dessa är inte på långt när färdiga ännu. Vi vill därför gärna ha input och kommentarer.

SwePub Analys har nu nått en nivå som känns bra att bygga vidare på. Vi har 20 lärosäten som mer eller mindre börjat arbeta tillsammans med projektteamet kring sitt data. Till sin hjälp har de Spotfire, ett verktyg som vi tillhandahåller för att ge insyn i data och för att kunna kommunicera kring datakvalitet. Det är också det verktyget som vi använder för att visualisera data.

Mycket har hänt i vårt "växthus" de senaste två månaderna. Här är några bilder som visar vad data i SwePub Analys  kan ge oss för information just nu beträffande några viktiga aspekter.

Blog_6_1

Ett grundläggande krav med statistik från SwePub Analys är att möjliggöra fraktionering. Det ställer krav på att affilieringregistreras enligt ny praxis och nytt format. Här börjar det se riktigt bra ut med 65% gröna (=ok!) poster.

Blog_6_3

Alla publikationer rekommenderas enligt Fokus att förses med upp till tre ämnesklassningar. Det är dessa ämnesklassningar som ska aggregeras till ämneskategorierna som används i Fokus. Det blir en utmaning för många lärosäten att komplettera med saknad data!

Blog_6_2

ISI-nummer är en viktig identifikator för att möjliggöra matchning av SwePub-data mot Web of Science-data för att göra citeringsanalyser. Här kommer det aldrig att bli 100%-igt grönt av naturliga skäl.

Vi arbetar iterativt och agilt i projektet för att fånga upp förändringar på vägen. Det kan verka kaotiskt för den utomstående, men det är ett ordnat och metodiskt kaos. Analysbehoven styr utvecklingen av systemet vi bygger liksom format och praxis. Utgångspunkten var hypotetiska analysbehov formulerade bla utifrån SUHF slutrapport om SwePub MODS och den dialog vi sedan början har haft med Vetenskapsrådets Fokus-projekt. Den nya forskningsutvärderingsmodellen som offentliggjordes i maj gjorde att vi kunde presentera en samlad bild på data i SwePub Analys kopplat till mer konkreta analysbehov i densamma. Under hösten kommer vi att fortsätta arbeta med analysbehoven och konkretisera dem ytterligare.

Enligt preliminär tidsplan kommer vi i december 2014 att visualisera lärosätenas publiceringsprofiler så som de skulle komma att användas i Fokus. Det blir den första samlade avstämningen av kvaliteten på data i SwePub Analys. En andra avstämning blir i mars 2015 då vi kommer att visa hur man kan använda data i SwePub Analys för bibliometri och vilka förutsättningar som finns för det. Tidsplanen är baserad på att projekt Vidareutveckling av SwePub har en sluttid i juni 2015 och att Fokus ska redovisas i december 2014 samt därefter planerar en pilot och förberedelser under 2015.

 

5 kommentarer 4 juli, 2014 Marja Haapalainen

Katalogprojektet tar semester

Men innan vi försvinner iväg på ledighet har vi uppdaterat betaversionen av Libris nya katalogiseringsverktyg.

De senaste sprintarna har vi fokuserat på att hela katalogiseringsflödet ska fungera. Än så länge har vi haft fokus på monografier. I vårt arbete har vi jobbat med både skön- och facklitteratur. Flödet är implementerat efter de skisser som finns sedan tidigare, och som vi efter användningstester itererat för att de ska fungera tillfredsställande.

Efter sommarsemestern tar vi oss an seriella publikationer och jobbar på samma sätt igenom hela flödet.

Implementerat i gränssnittet är;

 • Förbättrad autosuggest för språk, länder, personer och ämnesord.
 • Påbörjat arbete med implementering av värden från fasta fält.
 • Förbättrat flöde och mallhantering för katalogisering av monografi.
 • Förenklad träfflista.
 • Förbättrad funktionalitet för att lägga till fält i post.
 • Tillägg av oauktoriserade uppslag.
 • Hantering av laddnings- och systemfelmeddelanden.

Arbetet i backend har framför allt handlat om uppdateringar och optimeringar de senaste sprintarna. Det stora som hänt i backendutvecklingen är att posterna nu är länkade internt.

Förutom att jobba med att utveckla det nya systemet och tjänsten har vi också presenterat projektet på ELAG. I mitten av juni var det dags för den årliga ELAG-konferensen som anordnas av European Library Automation Group. Precis som förra året presenterade vi Libris XL och det nya katalogiseringsverktyget. Och precis som förra året fick projektet en hel del uppmärksamhet och beröm. Rurik Greenall sammanfattade hela konferensen och beskrev katalogprojektet så här;

“Niklas Lindström and Lina Westerling gave a very clear presentation of how libraries should be doing things: copying development at Libris. Arrogant bastards, who take all the good ideas. I can hardly be bothered heaping more praise on them. Take a look for yourself. ;-)”

För er som är intresserade av att titta på Niklas och Linas presentation i sin helhet, kolla här.

Till konferensen hade vi tagit fram dessa populära tatueringar designade av vår kollega Maia Dexander.

Tatuering

Med detta tar vi nu ledigt ett tag från projektet och önskar alla en trevlig sommar!

2 kommentarer 3 juli, 2014 Helena Forssblad

Betarelease av sökning i digitaliserade dagstidningar!

Under fyra intensiva fokusveckor har teamet arbetat med att ta fram en tjänst för att söka i digitaliserade dagstidningar. Vi har testat att arbeta med MVP som metod och det har visat sig vara väldigt effektivt, läs om rapporteringen här på bloggen.

I tjänsten kommer det gå att söka i Svenska dagstidningar från 2014 och framåt. Därutöver finns en hel del äldre material. I betan finns endast Svenska dagbladet och Aftonbladet från första utgivningsdagen till nutid. Material nyare än 150 år är upphovsrättskyddat och kan därför endast läsas på KB.

Hitta relevanta artiklar snabbt
En av våra hypoteser har varit att stödja den uppgiftsdrivne att hitta relevanta artiklar snabbt. Det möjliggör vi genom fritextsökning direkt i fulltexten, se utdrag (snippets) redan i träfflistan, få överblick genom att bläddra sömlöst bland sökträffarna och kunna läsa hela tidningen.

Utforska händelse utifrån olika perspektiv
En annan hypotes handlade om att stödja den intressedrivne med att kunna söka efter en händelse och t.ex. se när i tiden händelsen var aktuell och vilka tidningar som har rapporterat om den.

Dina artiklar var du än är
För att hjälpa användaren med förberedande arbete utanför KB gör vi det möjligt att söka och se maskade artiklar där endast några ord visas. Utifrån den sökningen går det att markera favoritartikar som sedan kan öppnas och läsas i sin helhet på KB.

Här får ni en överblick av vilka åtgärder (markerade med bock) vi har implementerat till betan:
Skärmavbild 2014-06-04 kl. 14.38.10

Kom med synpunkter!
Var med och bidra till utvecklingen av tidningar.kb.se! Under sommaren 2014 kommer betaversionen att ligga ute och vi vill gärna ha dina synpunkter för att kunna vidareutveckla tjänsten i rätt riktning. Om du upptäcker buggar eller har tips och synpunkter tar vi gärna emot dem i vårt forum för digitala dagstidningar. För att få full åtkomst till materialet behöver man sitta på KB. Använd senaste versionen av Google Chrome, Mozilla Firefox eller IE 9 för bästa återgivning.

Tips på sökningar där du kan se fritt material:
http://tidningar.kb.se/?q=afsegla
http://tidningar.kb.se/?q=varuqvantiteter

Skärmavbild 2014-06-27 kl. 22.48.24

 

15 kommentarer 27 juni, 2014 Johanna Olander

SwePub Analysis - you can SPARQL

Resuming the TechTalk, we cleared last time that the only thing you need to do for using the SwePub data API is to put together a SPARQL query.

Before you hang up right here let me assure you: You can do it.

Can you search in Google? Can you browse in the www? If the answer is yes then you can SPARQL.

Like in any language, in order to formulate a question or a sentence of any kind - it consists of vocabulary and syntax. Same with data query languages. And even if you know SPARQL’s syntax by the heart, for any new data source you don’t know the vocabulary. The first natural reaction for most people based on how languages are taught to adults is to ask “where is the dictionary which defines what classes and properties are available?” If I would give you this dictionary (called ontology in Linked Data) - what would you do with it? Browse through and scratch your head - “well, where do I start?” It gives you just some clue but it misses to present you the actual data model which is about relations between entities in certain context, forming a graph of data. Ontology can only define what relations might exist in a generic way, but does not give any guarantees that they have been actually asserted in instance data. Remind you again - Linked Data is a graph and not a table with strict relational schema. Linked Data graph can exist totally without a schema or strict definition of types. Although an ontology can be sometimes visualized as a graph diagram, it is still a guess or suggestion but not a reflection of a graph of actual facts.

The question of yours as a user is this: “How would I be able to reveal the actual necessary subset of the vocabulary and relations in an unknown graph of data, which is relevant to the very question I want to ask now and here?” Without going through a long lists of definitions in the dictionary - and then trial and error to get them into your query returning the results you want to get? And also - being a novice to SPARQL and not knowing the syntax, to make sure that the explored data items and their attributes are stringed together into a correct query statement (without spending time to work through a book or online resources)?

I have a positive answer for you - use a visual query builder that SwePub Analysis provides.

For the tutorial lets create a query for the example in the previous blog entry: Get publications of a specific author: title, date, publication year  and the link to the local database.

*** Before you get started - in case you would like to follow the tutorial hands-on and do the same steps in the real system: for that go to the E&Q tool and login with an anonymous guest account available from the dropdown list. Or you can register yourself and get your own account. ***

So - are you all set?

Lets imagine you know someone whose publications are in SwePub. Lets say his name is Anders Karlsson. You search his name

Blog_5_1

The result returned to you gives the list of triples containing Anders Karlsson

Blog_5_2

Click on any link in Subject column - on a thing that starts Name__oai_ and enter the Linked Data Brower.

You see the description page of this particular Name instance

Blog_5_3

You see that this instance is of type Name. Click on the (+) mark at the end of it.

It has an attribute called name. That one contains our familiar value "Anders Karlsson". Click on (+) mark at the end of it as well.

Now look at the top part of the page and see what has just happened

Blog_5_3

This is a fragment of the data model. The tool has recorded your navigation history and inferred the data model from the actual facts. You have got to know that there are instances of class Name, and those instances can have a data property name.

If you now press the button Show Result Samples, you get a table ... which contains results of the SPARQL query which ... You have just created.

Blog_5_5

Congratulations.

You probably notice the list does not contain "Anders Karlsson" - or at least these 50 rows you got as samples don't. We used a known thing (sorry to call a person so, but this is how "things" in Linked Data are generically called) to generalize its type and properties.

If you scroll down the result page you see a SPARQL query:

# Generated from Linked Data Browser navigation history
SELECT DISTINCT
?Name
?_name
WHERE
{
?Name a mods_m:Name .
?Name foaf:name ?_name .
}

You created this query - with a little help of a tool.

So what to do next? Use the back button of the browser and get back to the page of this Name where you started.

Lets now refine the query so you get the Name instances of "Anders Karlsson".

On the diagram click on the brown colored "string" rectangle and notice the color becomes green. Green node marks the currently selected thing in the Navigation Map and Linked Data Browser. You are looking at a piece of some ontology: the definition of the foaf:name datatype property which is of string type literal in the context of this Name instance. As you have explored, this data property contains the name of the author and you want to set a filter on it to select only a particular author. Use the buttons above and press the btn_filter ( filter).  Type in the name.

Blog_5_8

Press Set New Filter.

Press again the button Show Results Samples.

Blog_5_9

Your result set contains now names where Anders Karlsson occurs. Look at the new query and pay attention to the filter.

# Generated from Linked Data Browser navigation history

SELECT DISTINCT
?Name
?_name
WHERE
{
?Name a mods_m:Name .
?Name foaf:name ?_name .
FILTER(<bif:contains>(?_name, 'Anders AND Karlsson'))
}

Congratulations again.

You have now designed a parameterized SPARQL query that can be used in a SwePub data API call.

The query is not ready to answer the initial question. You still need to find the title and publication year and how these are linked with the Name. But that is not more difficult that what you have seen now. It is simply clicking around on the linked data and getting your navigation map updated. Until you have found them. At the end you need to do some cosmetics in editing the actual query but you have got a huge jump start.

I hope this blog entry explains the concept and gives a taste for how the tool works. I hope it makes you feel that "indeed - perhaps I could do SPARQL".

This story continues on the tutorial where the example is taken to its completion.

/Jürgen

9 kommentarer 18 juni, 2014 Jürgen Kerstna

Folkbiblioteken och Libris - vad händer ...

Det finns nu flera aktuella rapporter som tar upp folkbibliotek och Libris. Vi har samlat dem i Registrera i Libris – en guide  under rubrikerna Samverkan respektive Erfarenheter från Librisbibliotek. Kanske finns det fler? Tipsa oss gärna.

I KB:s rapport Libris för folkbiblioteken – samarbete i en nationell katalog listas några av de lösningar KB arbetar med för att tillgodose folkbiblioteksspecifika behov. Här finns också förslag på hur folkbiblioteken kan arbeta för en effektiv samverkan i Libris (se sammanfattning, s 4-5). Vi återkommer med närmare planering.

En fråga vi ofta får är:  Vilka folkbibliotek är nu med i Libris?

En sökning i Libris biblioteksdatabas  ger svaret. Biblioteksdatabasen innehåller information om de bibliotek som visar och gör sitt material tillgängligt via Libris tjänster, Katalogisering, Fjärrlån och/eller Låntagarbeställningar. I Biblioteksdatabasen kan man följa hur antalet Librisregistrerande folkbibliotek stadigt ökar. Det är ett femtiotal idag och många planerar just nu inför en övergång 2015-2016.

Gör så här:

Klicka på Visa alla bibliotek, och avgränsa till

 • Kundtyp: Folkbibliotek,
 • Libris-funktion: Registrerar i Libris, samt
 • Beståndstyp: Löpande registrering

Tänk på att man också får med de folkbibliotek som för tillfället bara registrerar specialsamlingar och liknande.

Kontakta Libris Kundservice om ni är intresserade av att blir registrerande Librisbibliotek.

2 kommentarer 10 juni, 2014 Helena Forssblad

Nationella utvecklingslinjer

KB håller på att fasa ut projektmedelsmodellen för att ersätta den med nationella utvecklingslinjer som ska ge ett fokus på större och mer långsiktiga projekt. Förslag till utvecklingslinjer har samlats in, men även från annat håll. Förslagen har sett väldigt olika ut, en del är breda och sveper över större fält medan andra är mer specifika och detaljerade. Utvecklingslinjerna ska vara

 • aktuella och långsiktiga
 • har ett brett anslag
 • omfattar alla bibliotekstyper
 • bygger på samverkan

Den 21 maj arbetade Nationella referensgruppen i en workshop med att diskutera och prioritera förslagen. Resultatet har förts vidare till KB:s ledningsgrupp över sommaren. I september hamnar sedan frågan hos Nationella referensgruppen igen för att sedan beslutas av riksbibliotekarien och därmed tas med i KB:s budgetprocess inför 2015.

Kommentera 4 juni, 2014 Maria Kadesjö

KB:s inflytandestruktur utvärderas

KB:s inflytandestruktur har varit en viktig input till KB:s arbete sedan 2007 och ska nu utvärderas. Syftet är att se om inflytandestrukturen stöder KB vad gäller det nationella uppdraget, det vill säga att ha nationell överblick över det allmänna biblioteksväsendet och vidare främja samverkan och utveckling inom detsamma. Syftet är också att undersöka om inflytandestrukturen har skapat förutsättningarna för samordning av gemensamma prioriteringar inom biblioteksväsendet som ligger inom KB:s samverkansuppdrag.

Utvärderingen görs av Peter Almerud, frilansande journalist, informatör och utredare med inriktning mot kultur och kulturpolitik. Almerud undervisar i kulturpolitik vid Högskolan i Halmstad och har fram tills 2014 varit ordförande för Svensk förening för Informationsspecialister. Avrapportering sker efter sommaren 2014. Läs hela direktivet på kb.se.

Kommentera 4 juni, 2014 Maria Kadesjö

SwePub analysis - what the data can tell

Data in updated format continues to come in to SwePub analysis. Karlstad University, Örebro University, Naturvårdsverket, Naturhistoriska Riksmuseet.

The latest site who reharvested its records was BTH - Blekinge Institute of Technology. This story is very educational and I feel I have to let the data to tell it. I admit that at the very early period of the project, when I made the initial assessment of the data in SwePub, we were worried about BTH. To remind you about the context, current SwePub search portal did not require that publications should be strictly linked to their individual creators at person level. The affiliation at organization level was sufficient. Different universities thus interpreted the specification differently.

The data from BTH had very little affiliation information and looked like they will face a lot of work in bringing their records up to the level of new SwePub Analysis requirements. We knew they use their own local system and are not going to get help from centralized service of DiVA or commercial product support.

So when BTH newly re-harvested data came live in our Spotfire greenhouse, it looked like this

Blog_4_1a

Yeah, as expected.

But then I started to change some filters:
I set publication year >= 2012 - because we know this is where FOKUS model starts to count from.
I also selected only peer-reviewed articles and conference papers.
And look at this how the table is turning ...

Blog_4_2

Puzzling - how would you understand this? The answer is on the next diagram.

Blog_4_3

Smart, ah?

This is how you eat an elephant. One bite at a time. Having clearly understood focus and priorities, Peter Linde and Henrik Törnblom at BTH, responsible for this transformation, seem to be spot on - or right on the money both literally and as the expression goes.

Looking at the data quality assurance challenge this way, perhaps it is not so overwhelming after all?

/Jürgen

3 kommentarer 3 juni, 2014 Jürgen Kerstna

Nästa sida Föregående sida


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler