Under det senaste året har Libris arbetat med en ny infrastruktur. Kopplad till denna finns det katalogiseringsverktyg vi nu lanserar den senaste releasen av. Verktyget är avsett att underlätta katalogiseringshantverket och bättre utnyttja de olika hjälpmedel som finns (auktoritetsinformation, kontrollerade termlistor, mallar för olika medietyper med mera).
Den verkliga nyheten är dock inte katalogiseringsverktyget, utan den nya infrastrukturen, Libris XL. Med Libris XL lämnar vi MARC21 som produktions- och lagringsformat, suddar ut postbegreppet till förmån för relaterade informationselement och införlivar de principer som utgör webbens motor. Libris XL är formatoberoende – systemet ska kunna hantera alla format (Dublin Core, EAD, ONIX etc). Med hjälp av JSON-LD skapas det primära interna formatet som är bättre anpassat för moderna system än trotjänaren MARC21. Sedan den senaste releasen i april har mycket tid ägnats åt formatkonvertering. Vi arbetar med en uniform modell i botten, RDF, där vi tydliggör vad informationen syftar till och vad den kan användas för. För att kunna tolka informationen och bygga kvalitativa tjänster behöver vi förstå och tolka metadatat. Genom att översätta och konvertera MARC-data till JSON-LD kan vi beskriva och presentera den bibliografiska informationen på ett helt annat sätt än tidigare. I gränssnittet är informationen grupperad i olika nivåer enligt en FRBR- och BIBFRAME-inspirerad struktur. I betaversionen har vi implementerat ett JSON-LD-läge där det är möjligt att se vad som händer ”under huven”, hur datan är konverterat från MARC-formatet till det nya.
En tyst revolution
Att den interna strukturen inte längre begränsas av MARC21 innebär större möjligheter att utnyttja auktoritetsdata, återanvända informationselement och erbjuda användaren ett intuitivt och lättöverskådligt sätt att navigera bland bibliografisk information. Under överskådlig framtid kommer systemet dock att behöva kunna exportera och importera MARC21. På så sätt är Libris XL en tyst revolution. Librisanvändarna kommer inte att behöva ändra sina rutiner för import, fjärrlån etc. Det nya katalogiseringsverktyget är en hjälp för att hantera bibliografisk information, men det kommer också att finnas en vy där man kan se och delvis även redigera datan i MARC-format. Samtidigt kommer systemet att till fullo utnyttja fördelarna med det nya interna formatet.
Genom att lyfta fram användningen av data, och minska gapet mellan katalogisatörer och alla slags användare, kan vi fokusera mer på den faktiska innebörden av de ting som katalogiseringen beskriver. Datastrukturen och verktygen ska stödja entydig länkning – mellan verk, författare, ämnen och till övriga saker som ett verk är knutpunkten för. Effekten av detta slags länkning blir att det går att navigera mellan beskrivningar (på samma sätt som mellan webbsidor) och upptäcka samband som tidigare legat i det fördolda.
För att vi ska kunna skapa och bibehålla sammanhang i den växande framtiden måste vi också aktivt ta till oss – och verka för – en utökad gemensam och praktisk förståelse för denna form av data, genom att vara delaktiga i initiativ som Dublin Core, SKOS och BIBFRAME, samt inte minst den större (och spretigare) världen av data, där FOAF, DBPedia, Schema.org m.m. växer och frodas.
Vi är entusiastiska och stolta över att få utveckla ett system som ligger i framkant och redan har väckt internationellt intresse. Samtidigt är vi medvetna om att Libris endast utgör en del av det bibliografiska ekosystemet, och att användarna måste kunna välja att ta del av utvecklingen i sin egen takt. Vår ambition är att Libris XL inte ska kräva några förändrade rutiner, men däremot erbjuda enorma möjligheter för den användare som så önskar. Vi inbjuder alla att delta i en dialog om vårt arbete.
Presentation på ELAG
För ytterligare teknisk fördjupning, titta gärna på den presentation som Martin Malmsten, Markus Sköld och Niklas Lindström höll på den årliga ELAG-konferensen i Gent i slutet av maj. Glädjande nog fick vi mycket positiv feedback på presentationen av Libris XL bl.a. från Rurik Greenall som i sitt inlägg beskrev det hela så här;
The rest of the conference was ruined by illness, so I stayed in bed and watched Martin, Markus and Niklas from Libris give a masterful presentation of some really cutting-edge work with linked library data in the new Libris system. With this, Libris really are showing the world how things are done.
Conceptually, the system is designed with current principles in mind, componentized and appliance driven, this framework is both flexible and simple. The various architectural choices mirror those made in various other projects within other domains (and indeed our own), and seem to reflect the mood change we have seen in libraries in the last year; increasingly, library technology as developed in libraries is part of the wider IT sector and not part of “library IT”. This can only be a good thing.
While Libris’ core technology stack is largely the same as the one we’re developing at NTNU, Libris uses AngularJS, a Javascript library from Google that provides excellent support for dynamic views in HTML. Why hadn’t I heard of this before? Probably because I have been wrapped up in jQuery for a hundred years. Silly me, that will teach me.
I had the pleasure of being able to send the first real-world interface for cataloguing that has linked data beneath the hood to our cataloguers.
Nice work there!
Välkommen att testa
Libris katalogisering är utvecklad med HTML5/CSS3 och kräver en webbläsare med bra stöd för dessa standarder samt att JavaScript är aktiverat. Vi rekommenderar därför uppdaterade versioner av Google Chrome eller Mozilla Firefox. Vi jobbar på att få Internet Explorer att fungera, men systemet kommer inte att stödja tidigare versioner än IE 9 (här kan du testa din browser och se hur väl den stöder HTML5, http://html5test.com/index.html).
För att använda Libris katalogisering krävs inloggning. Har man ett konto för att beståndsregistrera i nuvarande tjänst Libris beståndsregistrering, kan man använda dessa uppgifter för att logga in. Det går dessutom att testa betaversionen av katalogiseringen med användarnamn: test och lösenord: test.
Välkommen att testa, ge oss förbättringsförslag, kommentera och ställa frågor.
Libris har varit tillgängligt som länkad data sedan 2008. I detta nya katalogsystem har vi gått ett steg längre och bygger en katalog på länkad data, en katalog som självklart utnyttjar fördelarna med länkad data och som kan länka in och länka ut till andra källor men även fortsättningsvis hanterar Marc-formatet.
The rest of the conference was ruined by illness, so I stayed in bed and watched Martin, Markus and Niklas from Libris give a masterful presentation of some really cutting-edge work with linked library data in the new Libris system. With this, Libris really are showing the world how things are done.
Conceptually, the system is designed with current principles in mind, componentized and appliance driven, this framework is both flexible and simple. The various architectural choices mirror those made in various other projects within other domains (and indeed our own), and seem to reflect the mood change we have seen in libraries in the last year; increasingly, library technology as developed in libraries is part of the wider IT sector and not part of “library IT”.This can only be a good thing.
While Libris’ core technology stack is largely the same as the one we’re developing at NTNU, Libris uses AngularJS, a Javascript library from Google that provides excellent support for dynamic views in HTML. Why hadn’t I heard of this before? Probably because I have been wrapped up in jQuery for a hundred years. Silly me, that will teach me.
I had the pleasure of being able to send the first real-world interface for cataloguing that has linked data beneath the hood to our cataloguers.
There are a couple of problematic areas which ultimately lead to the decision to end negotiations.
First, the asymmetrical nature of the relationship regarding transfer and re-use of records. OCLC is given very broad rights to records uploaded to WorldCat, including commercial re-use. Downloaded records on the other hand keep their status as “WorldCat records”, regardless of where they were originally created, and as such the guidelines of the WorldCat Rights and Responsibilities (WCRR) apply. This leaves us and the participating LIBRIS libraries in a situation where we do not have full control over the description of our collections. Under the WCRR we are discouraged from exposing and exporting data in whatever way we choose, which we see as an essential right.
Secondly, the WCRR states that every member library should “work to ensure the long-term viability of WorldCat” and “not engage in [...] activities that diminish the value of WorldCat [...]“. While we definitely see value in WorldCat as a service, we simply cannot, as a National Library, bind ourselves to support a single corporate entity. We need to support competition as well as cooperation, and to do so we must treat all discovery services equally and/or support the creation of any number of large scale discovery services.
Thirdly, the National Library of Sweden see a strategic importance in complete openness for bibliographic data, namely that of competition when it comes to services built upon it. We have chosen CC0 for the National Bibliography and authority file. We chose it because we see a problem with attribution licenses such as ODB-BY and CC-BY when it comes to re-use of data over time, for example so called ”attribution stacking”.
To this end we urge OCLC to allow members to treat downloaded records as their own, including releasing them under any open license such as CC0. We feel that this would strengthen rather than diminish OCLCs strong status as a service provider to the library community.
Before the summer the Swedish national librarian, Gunnar Sahlin, signed an agreement effectively releasing the Swedish National Bibliography and authority files into the public domain. We are now pleased to announce the general availability of these records (see below for details). We see the investment in Open Data as a strategic one and one that is needed to ensure long term sustainability and competition when it comes to the services needed by libraries and their users as well as the right to control over their collections. The license chosen is CC0 which waives any rights the National Library have over the National Bibliography and the authority data.
There are two ways to access the data, as Atom feeds with references to the records and using (a somewhat rudimentary implementation of) the OAI-PMH protocol. See the table below.
The National Bibliography and authority data is part of Libris, the Swedish Union Catalogue, and the long term goal is to release the whole database under an open license, though this will undoubtedly take some time. The data contains links to Wikipedia, DBPedia, LC Authorities (names and subjects) and VIAF. VIAF has also been used to find some of these links. These channels are provided as a complement to the Linked Data implementation.
I början av veckan var Kristin Olofsson, Martin Malmsten och jag i Köpenhamn och deltog i en workshop tillsammans med Dansk BiblioteksCenter. Ämnet var möjliga samarbeten mellan våra två organisationer. DBC arbetar med många liknande frågor som LIBRIS, men vänder sig främst mot folkbiblioteken. Man driver den danska nationalbiografin och söktjänsten bibliotek.dk. Förutom bättre väder än i Stockholm (vi missade tisdagmorgonens snöfall) bjöd Köpenhamn på mer grönska och gratis wifi på pendeltåget. Varför har vi inte det i Stockholm?
Under workshoppen redogjorde vi för våra respektive system och hur vi tänker oss att de ska utvecklas i den närmaste framtiden. Martin pratade om linked data, som även DBC börjat arbeta med. Under dagens lopp utkristalliserade det sig ett antal ämnen vi skulle ha nytta av att samarbeta kring:
Linked Data publiceringsprofiler
FRBR-plattform/algoritmer
titta på Pazpar2 som en lösning för federerad sökning (eller Universal Search som DBC kallar det)
Spännande frågor, eller hur? Nästa steg är en planerad workshop i Stockholm i början på hösten. Resultatet av samarbetet kommer senare att publiceras på dbclibris.wordpress.com.
Stort tack till DBC för en fantastiskt välordnad och fruktsam workshop!
Detta är ett gästinlägg från Ted Valentin, webbutvecklare och initiativtagare till 24 Hour Business Camp.
I webbvärlden har det på senare tid pratats mycket om öppen data. API:er, öppen myndighetsinformation och mashups byggda på denna data har det senate året varit allt mer omtalade. Tanken är att olika datakällor ska kunna kommunicera med hjälp av öppna format så att information kan återanvändas och kombineras på nya sätt. Typiska företag som ligger långt framme på området är Google, Twitter och Facebook. I myndighetsvärlden är det USA och Storbrittanien som ligger i framkant med initiativen Data.gov och data.gov.uk, där offentliga datakällor presenteras på en och samma webbplats.
Genom att göra många olika datakällor öppet tillgängliga uppmuntrar man till innovativa nya webbtjänster. Innovation kring information är en av tjänsteekonomins stora drivkrafter. Stat och myndigheter är bland de mest informationsintensiva verksamheter man kan tänka sig, men innovationsincitamenten i statlig verksamhet kan som bekant vara begränsade. Det som gör öppen data så intressant för både myndigheter och företag är insikten om att extern innovation kan leda till lösningar på problem som man själv inte visste existerade. Ett spänande sätt att beskriva detta är med begreppet unknown unknowns. Ett annat relaterat begrepp är serendipity – fenomenet att innovationer kan uppstå med slumpens hjälp, i mötet mellan discipliner eller i sökandet efter helt andra saker. Öppen data skapar alltså stora förutsättningar för ohämmad innovation.
En intressant person med tankar om detta är Sir Tim Berners-Lee. Han står bakom arbetet med brittiska open-data-initiativet, är skaparen av World Wide Web, och är en förespråkare för den semantiska webben och linked data.
Mitt eget perspektiv är mer jordnära: jag har egna erfarenheter av att bygga sajter med andras data från både offentlig och privat sektor.
Som webbutvecklare inser man hur snabbt det går att bygga intressanta nya tjänster om man utgår från redan existerande datakällor, som man kan kombinera på nya sätt. Det var i mitt eget utvecklingsarbete med bland annat Annonskartan.se och Auktionsfynda.se som jag fick upp ögonen för öppen data. En erfarenhet av dessa projekt var att mina sajter ibland påverkat den interna innovationen hos datakällorna ganska mycket, och även att en inledande tveksamhet ganska snart byttes mot entusiasm hos ägarna till datan. Snabbheten och enkelheten i dessa projekt inspirerade mig också till att dra igång 24 Hour Business Camp.
24 Hour Business Camp (24HBC) är ett utvecklar-event med syftet att deltagarna ska skapa varsin fungerande webbtjänst på 24 timmar. Den första gången eventet genomfördes skapades ett 50-tal nya webbtjänster. Eftersom många av de mest framgångsrika var mashups bestämde vi inför den andra omgången att ha öppna API:er som tema. Målsättningen var att uppmuntra svenska företag och myndigheter att ta fram datakällor och API:er som vi utvecklare kunde använda för att bygga nya tjänster. De svenska medieföretagen var snabba med att ta fram API:er. De myndigheter jag träffade inför 24HBC visade ett försiktigt intresse – men det blev tydligt att det behövdes beslut på lite högre politisk nivå för att få till en förändring.
Under det senaste halvåret har det dock börjat röra på sig. Frågan om öppen myndighetsdata diskuteras nu både av näringsdepartementet och finansdepartementet (med Mats Odell i spetsen), och förhoppningsvis är det bara en tidsfråga tills vi får vår egen ”data.gov” här i Sverige. Tills vidare har vi webbplatsen Opengov som listar myndigheter med öppna datakällor.
Jag blev väldigt glad när jag läste att det planeras en 24-timmarsworkshop på temat att använda LIBRIS öppna API:er. Mitt intryck av LIBRIS och biblioteksvärlden är att ni ligger långt fram i utvecklingen mot öppen data. Jag har själv byggt ett par sajter, bland annat Dissertations.se och Essays.se, (Uppsatser.se)som bygger på data från Uppsök och Swepub. Bägge sajterna riktar in sig på besökare från utlandet och har en klar majoritet av sina besökare från Asien, ett intressant fenomen som jag skrivit mer om här.
Samtidigt som LIBRIS och biblioteksvärlden kommit så långt i arbetet mot öppenhet rent tekniskt så kan det för en utomstående vara lite svårt att få insyn i er värld. Mitt eget intryck är att biblioteksutvecklare och webbutvecklare verkar ha samma mål – öppen data – men att vi i stor utsträckning lever i olika världar, använder olika terminologi och åker på olika konferenser.
Jag tror också att det är få svenska webbutvecklare som känner till LIBRIS API:er och vad man kan göra med dem. Just därför är det så välkommet både med workshops kring era API:er, och biblioteks-bloggar som även riktar sig mot utvecklare utanför biblioteksvärlden. Min förhoppning är naturligtvis att våra världar ska närma sig varandra, och att spännande saker ska uppstå i mötet mellan dem. Jag tror också att biblioteksvärldens långa erfarenhet av öppen data skulle kunna vara till stor användning hos svenska myndigheter.
För att sammanfatta tror jag att effekterna kan bli stora om biblioteksvärlden bjuder in såväl andra myndighetsaktörer och fristående webbutvecklare i sitt universum framöver. Mina egna erfarenheter av bland annat indiska studenter som Googlar miljöfrågor, IT och jämställdhet och på så sätt hittar till svenska universitetsuppsatser uppmuntrar till en fortsättning.
Det är nu två veckor sedan jag kom hem från Code4Lib-konferensen i Providence, Rhode Island. En oerhört bra och inspirerande konferens som jag verklingen vill rekommendera till alla som är intresserade av bibliotekssystem och lyckas få tag i en biljett (biljetterna brukar, säger ryktet, gå åt ungefär lika fort som när Bob Dylan gör en klubbspelning). Vid sidan om mig fanns svenska representanter från Högskolan i Jönköping och Karolinska institutet. Hur de fick tag på sina biljetter vet jag inte.
Själv fick jag en blijett i och med att jag och Martin skulle presentara vårt arbete med Linked data på konferensen. Martin står med i programmet men kunde tyvärr inte åka med till själva konferensen. Jag gjorde istället presentationen själv, vilket gick åtminstone nästan lika bra som om Martin varit med. Hela konferensen filmades, så om ett tag hoppas jag att det ska gå att se både min och de andra presentationerna på konferensens webbsida. Tills vidare kan man hålla tillgodo med pdf:er av presentationerna. Här är min: Why libraries should embrace Linked Data (finns även på slideshare).
När filmerna kommer upp rekommenderar jag alla att titta på så mycket som möjligt. Presentationerna höll överlag en riktigt hög kvalitet och nästan allt är sevärt. För den som har annat att göra än att titta på presentationer hela dagarna rekommenderar jag de tre keynote-föreläsningarna (särskilt Ian Davis, som sammanfattade ungefär hur jag själv ser på biblioteksdata och bibliotekssystem – se även hans uppföljande blogpost ”Why Open Data is More Important than Open Source”.)
Vidare finns bra presentationer av Jangle, Freebase, och intressanta idéer om FRBR (som även nämner LIBRIS). Jag kan även tänka mig att Juice är intressant för stressade systembibliotekarier med lite tid över och liten kontroll över den egna OPAC:en.
”Den skulle ha kommit redan i november 2008, men kom igår: nr. 5 av tidningen Nodalities, som ges ut av den engelska företaget Talis. Jag och Martin (Malmsten) har skrivit en artikel om ”LIBRIS – Linked Library Data”. http://www.talis.com/nodalities/”
Som Daniel skrivit på betabib så har Martin Malmsten och Anders Söderbäck skickat in förslag på presentation till Code4Lib-konferensen 2009 (Rhode Island, USA). Ett förslag bland 40 andra – ”Why libraries should embrace Linked Data”.
Efter omröstningen ligger Martin och Anders förslag på andra plats. Betyder det att vi måste vinka av våra kollegor i februari?
Nu finns ännu en LIBRIS-blogg: semweb@libris. Syftet är att få ut information och få feedback kring LIBRIS arbete med semantisk webb i allmänhet och Linked Data i synnerhet.