Tag: semantisk webb

Triple bypass

librisxl

Libris XL systemarkitektur

Under det senaste året har Libris arbetat med en ny infrastruktur. Kopplad till denna finns det katalogiseringsverktyg vi nu lanserar den senaste releasen av. Verktyget är avsett att underlätta katalogiseringshantverket och bättre utnyttja de olika hjälpmedel som finns (auktoritetsinformation, kontrollerade termlistor, mallar för olika medietyper med mera).

Den verkliga nyheten är dock inte katalogiseringsverktyget, utan den nya infrastrukturen, Libris XL. Med Libris XL lämnar vi MARC21 som produktions- och lagringsformat, suddar ut postbegreppet till förmån för relaterade informationselement och införlivar de principer som utgör webbens motor. Libris XL är formatoberoende – systemet ska kunna hantera alla format (Dublin Core, EAD, ONIX etc). Med hjälp av JSON-LD skapas det primära interna formatet som är bättre anpassat för moderna system än trotjänaren MARC21. Sedan den senaste releasen i april har mycket tid ägnats åt formatkonvertering. Vi arbetar med en uniform modell i botten, RDF, där vi tydliggör vad informationen syftar till och vad den kan användas för. För att kunna tolka informationen och bygga kvalitativa tjänster behöver vi förstå och tolka metadatat. Genom att översätta och konvertera MARC-data till JSON-LD kan vi beskriva och presentera den bibliografiska informationen på ett helt annat sätt än tidigare. I gränssnittet är informationen grupperad i olika nivåer enligt en FRBR- och BIBFRAME-inspirerad struktur. I betaversionen har vi implementerat ett JSON-LD-läge där det är möjligt att se vad som händer ”under huven”, hur datan är konverterat från MARC-formatet till det nya.

En tyst revolution
Att den interna strukturen inte längre begränsas av MARC21 innebär större möjligheter att utnyttja auktoritetsdata, återanvända informationselement och erbjuda användaren ett intuitivt och lättöverskådligt sätt att navigera bland bibliografisk information. Under överskådlig framtid kommer systemet dock att behöva kunna exportera och importera MARC21. På så sätt är Libris XL en tyst revolution. Librisanvändarna kommer inte att behöva ändra sina rutiner för import, fjärrlån etc. Det nya katalogiseringsverktyget är en hjälp för att hantera bibliografisk information, men det kommer också att finnas en vy där man kan se och delvis även redigera datan i MARC-format. Samtidigt kommer systemet att till fullo utnyttja fördelarna med det nya interna formatet.

Genom att lyfta fram användningen av data, och minska gapet mellan katalogisatörer och alla slags användare, kan vi fokusera mer på den faktiska innebörden av de ting som katalogiseringen beskriver. Datastrukturen och verktygen ska stödja entydig länkning – mellan verk, författare, ämnen och till övriga saker som ett verk är knutpunkten för. Effekten av detta slags länkning blir att det går att navigera mellan beskrivningar (på samma sätt som mellan webbsidor) och upptäcka samband som tidigare legat i det fördolda.

För att vi ska kunna skapa och bibehålla sammanhang i den växande framtiden måste vi också aktivt ta till oss – och verka för – en utökad gemensam och praktisk förståelse för denna form av data, genom att vara delaktiga i initiativ som Dublin Core, SKOS och BIBFRAME, samt inte minst den större (och spretigare) världen av data, där FOAF, DBPedia, Schema.org m.m. växer och frodas.

Vi är entusiastiska och stolta över att få utveckla ett system som ligger i framkant och redan har väckt internationellt intresse. Samtidigt är vi medvetna om att Libris endast utgör en del av det bibliografiska ekosystemet, och att användarna måste kunna välja att ta del av utvecklingen i sin egen takt. Vår ambition är att Libris XL inte ska kräva några förändrade rutiner, men däremot erbjuda enorma möjligheter för den användare som så önskar. Vi inbjuder alla att delta i en dialog om vårt arbete.

Presentation på ELAG
För ytterligare teknisk fördjupning, titta gärna på den presentation som Martin Malmsten, Markus Sköld och Niklas Lindström höll på den årliga ELAG-konferensen i Gent i slutet av maj. Glädjande nog fick vi mycket positiv feedback på presentationen av Libris XL bl.a. från Rurik Greenall som i sitt inlägg beskrev det hela så här;

The rest of the conference was ruined by illness, so I stayed in bed and watched Martin, Markus and Niklas from Libris give a masterful presentation of some really cutting-edge work with linked library data in the new Libris system. With this, Libris really are showing the world how things are done.

Conceptually, the system is designed with current principles in mind, componentized and appliance driven, this framework is both flexible and simple. The various architectural choices mirror those made in various other projects within other domains (and indeed our own), and seem to reflect the mood change we have seen in libraries in the last year; increasingly, library technology as developed in libraries is part of the wider IT sector and not part of “library IT”. This can only be a good thing.

While Libris’ core technology stack is largely the same as the one we’re developing at NTNU, Libris uses AngularJS, a Javascript library from Google that provides excellent support for dynamic views in HTML. Why hadn’t I heard of this before? Probably because I have been wrapped up in jQuery for a hundred years. Silly me, that will teach me.

I had the pleasure of being able to send the first real-world interface for cataloguing that has linked data beneath the hood to our cataloguers.

Nice work there!

Välkommen att testa
Libris katalogisering är utvecklad med HTML5/CSS3 och kräver en webbläsare med bra stöd för dessa standarder samt att JavaScript är aktiverat. Vi rekommenderar därför uppdaterade versioner av Google Chrome eller Mozilla Firefox. Vi jobbar på att få Internet Explorer att fungera, men systemet kommer inte att stödja tidigare versioner än IE 9 (här kan du testa din browser och se hur väl den stöder HTML5, http://html5test.com/index.html).

För att använda Libris katalogisering krävs inloggning. Har man ett konto för att beståndsregistrera i nuvarande tjänst Libris beståndsregistrering, kan man använda dessa uppgifter för att logga in. Det går dessutom att testa betaversionen av katalogiseringen med användarnamn: test och lösenord: test.

Välkommen att testa, ge oss förbättringsförslag, kommentera och ställa frågor.

http://kat.libris.kb.se

10 kommentarer 17 juni, 2013 Johan

LIBRIS öppna API:er – ett gästinlägg från Ted Valentin

Detta är ett gästinlägg från Ted Valentin, webbutvecklare och initiativtagare till 24 Hour Business Camp.

I webbvärlden har det på senare tid pratats mycket om öppen data. API:er, öppen myndighetsinformation och mashups byggda på denna data har det senate året varit allt mer omtalade. Tanken är att olika datakällor ska kunna kommunicera med hjälp av öppna format så att information kan återanvändas och kombineras på nya sätt. Typiska företag som ligger långt framme på området är Google, Twitter och Facebook. I myndighetsvärlden är det USA och Storbrittanien som ligger i framkant med initiativen Data.gov och data.gov.uk, där offentliga datakällor presenteras på en och samma webbplats.

Genom att göra många olika datakällor öppet tillgängliga uppmuntrar man till innovativa nya webbtjänster. Innovation kring information är en av tjänsteekonomins stora drivkrafter. Stat och myndigheter är bland de mest informationsintensiva verksamheter man kan tänka sig, men innovationsincitamenten i statlig verksamhet kan som bekant vara begränsade. Det som gör öppen data så intressant för både myndigheter och företag är insikten om att extern innovation kan leda till lösningar på problem som man själv inte visste existerade. Ett spänande sätt att beskriva detta är med begreppet unknown unknowns. Ett annat relaterat begrepp är serendipity – fenomenet att innovationer kan uppstå med slumpens hjälp, i mötet mellan discipliner eller i sökandet efter helt andra saker. Öppen data skapar alltså stora förutsättningar för ohämmad innovation.

En intressant person med tankar om detta är Sir Tim Berners-Lee. Han står bakom arbetet med brittiska open-data-initiativet, är skaparen av World Wide Web, och är en förespråkare för den semantiska webben och linked data.

Mitt eget perspektiv är mer jordnära: jag har egna erfarenheter av att bygga sajter med andras data från både offentlig och privat sektor.

Som webbutvecklare inser man hur snabbt det går att bygga intressanta nya tjänster om man utgår från redan existerande datakällor, som man kan kombinera på nya sätt. Det var i mitt eget utvecklingsarbete med bland annat Annonskartan.se och Auktionsfynda.se som jag fick upp ögonen för öppen data. En erfarenhet av dessa projekt var att mina sajter ibland påverkat den interna innovationen hos datakällorna ganska mycket, och även att en inledande tveksamhet ganska snart byttes mot entusiasm hos ägarna till datan. Snabbheten och enkelheten i dessa projekt inspirerade mig också till att dra igång 24 Hour Business Camp.

24 Hour Business Camp (24HBC) är ett utvecklar-event med syftet att deltagarna ska skapa varsin fungerande webbtjänst på 24 timmar. Den första gången eventet genomfördes skapades ett 50-tal nya webbtjänster. Eftersom många av de mest framgångsrika var mashups bestämde vi inför den andra omgången att ha öppna API:er som tema. Målsättningen var att uppmuntra svenska företag och myndigheter att ta fram datakällor och API:er som vi utvecklare kunde använda för att bygga nya tjänster. De svenska medieföretagen var snabba med att ta fram API:er. De myndigheter jag träffade inför 24HBC visade ett försiktigt intresse – men det blev tydligt att det behövdes beslut på lite högre politisk nivå för att få till en förändring.

Under det senaste halvåret har det dock börjat röra på sig. Frågan om öppen myndighetsdata diskuteras nu både av näringsdepartementet och finansdepartementet (med Mats Odell i spetsen), och förhoppningsvis är det bara en tidsfråga tills vi får vår egen ”data.gov” här i Sverige. Tills vidare har vi webbplatsen Opengov som listar myndigheter med öppna datakällor.

Jag blev väldigt glad när jag läste att det planeras en 24-timmarsworkshop på temat att använda LIBRIS öppna API:er. Mitt intryck av LIBRIS och biblioteksvärlden är att ni ligger långt fram i utvecklingen mot öppen data. Jag har själv byggt ett par sajter, bland annat Dissertations.se och Essays.se, (Uppsatser.se)som bygger på data från Uppsök och Swepub. Bägge sajterna riktar in sig på besökare från utlandet och har en klar majoritet av sina besökare från Asien, ett intressant fenomen som jag skrivit mer om här.

Samtidigt som LIBRIS och biblioteksvärlden kommit så långt i arbetet mot öppenhet rent tekniskt så kan det för en utomstående vara lite svårt att få insyn i er värld. Mitt eget intryck är att biblioteksutvecklare och webbutvecklare verkar ha samma mål – öppen data – men att vi i stor utsträckning lever i olika världar, använder olika terminologi och åker på olika konferenser.

Jag tror också att det är få svenska webbutvecklare som känner till LIBRIS API:er och vad man kan göra med dem. Just därför är det så välkommet både med workshops kring era API:er, och biblioteks-bloggar som även riktar sig mot utvecklare utanför biblioteksvärlden. Min förhoppning är naturligtvis att våra världar ska närma sig varandra, och att spännande saker ska uppstå i mötet mellan dem. Jag tror också att biblioteksvärldens långa erfarenhet av öppen data skulle kunna vara till stor användning hos svenska myndigheter.

För att sammanfatta tror jag att effekterna kan bli stora om biblioteksvärlden bjuder in såväl andra myndighetsaktörer och fristående webbutvecklare i sitt universum framöver. Mina egna erfarenheter av bland annat indiska studenter som Googlar miljöfrågor, IT och jämställdhet och på så sätt hittar till svenska universitetsuppsatser uppmuntrar till en fortsättning.

Ted Valentin

Kommentera 27 mars, 2010 Kristin

Artikel ‘LIBRIS – Linked Library Data’ i Nodalities

Citat från kollegan Anders Söderbäck:

”Den skulle ha kommit redan i november 2008, men kom igår: nr. 5 av tidningen Nodalities, som ges ut av den engelska företaget Talis. Jag och Martin (Malmsten) har skrivit en artikel om ”LIBRIS – Linked Library Data”. http://www.talis.com/nodalities/”

Kommentera 4 februari, 2009 Kristin

semweb@libris

Nu finns ännu en LIBRIS-blogg: semweb@libris. Syftet är att få ut information och få feedback kring LIBRIS arbete med semantisk webb i allmänhet och Linked Data i synnerhet.

Kommentera 4 december, 2008 Martin

Paper on Linked Data

Läs Martin Malmstens paper 'Making a Library Catalogue Part of the Semantic Web', till Dublin Core-konferensen i Berlin i september i år.

Martin: ”Den handlar om Linked Data, vad jag tror är vägen framåt vad gäller tillgängliggörandet av en bibliotekskatalogs ”tillstånd”, dvs mer än bara MARC-posterna”.

LIBRIS är en av de få (den enda?) bibliotekskatalogerna som finns på den semantiska webben.

8 oktober, 2008 Kristin

Ett nätverk av öppet data

Konferensen om den semantiska webben i onsdags var oerhört lyckad. Ett stort tack till mina kollegor som ordnade detta! (Den som inte var där kan hålla utkik efter föreläsarnas presentationer, som rimligen dyker upp på KB:s webbplats snart. Det var prat om att filma hela evenemanget, men planerna gick tyvärr inte att genomföra.)

 

Fyra bra föreläsare, även om det största behållningen för mig var Corey Harper som pratade om Linked Data. Vi på LIBRIS har ju intresserad oss för Linked Data under året, och det var roligt att Martin Malmsten kunde avsluta konferensen med att visa hur LIBRIS finns tillgängligt som Linked Data, och berätta om hur vi tänker kring detta. Så vitt jag vet är det bara vi och Ed Summers vid Library of Congress som gjort något liknande. Å ena sidan gör det mig lite fånigt stolt, å andra sidan önskar jag att vi var fler. Efter att ha pratat med Corey känns det som att intresset Linked Data är ganska stort vid amerikanska bibliotek, även om nästan ingen (ännu) gjort något praktiskt.

 

Vinsterna med att lägga upp bibliotekens databaser som Linked Data känns ganska självklara. Det finns så mycket värdefull information i biblioteksdatabaser, och att göra den tillgänglig på webben skulle gynna både biblioteken och övriga samhället. Vårt Xsearch är ju ett sätt att försöka tillgängliggöra LIBRIS-data snabbt och enkelt. Men Linked Data skulle kunna innebära interoperabilitet på en helt annan nivå. De stora vinsterna (både vad gäller effektivitet och kvalitet) kommer förstås att öka exponentiellt utifrån hur mycket data som görs tillgängligt. Men även om vinsterna med öppna system kan vara enorma, är de svårare att se än den mer kortsiktiga vinst som ägande av en sluten databas kan ge. För mig (och många andra, verkar det som) är det uppenbart att de mer eller mindre slutna databaserna och biblioteksdatasystemen gör det svårare att kommunicera med övriga Internet, och att det är en nackdel. ExLibris slår tidsenligt på stora trumman för sin Open Platform Strategy, och jag gillar också hur Oren Bent-Arie, ExLibris Chief Stragy Officer motiverar detta i ett samtal med Richard Wallis på Talis: ”I know that we will never be able to be everything for everyone and for everybody…”  

 

Det stora hindret mot öppet biblioteksdata verkar vara att det ofta är oklart vem som äger informationen i bibliotekens databaser. Lars Svensson berättade under onsdagens konferens att SWD, den tyska ämnesordsdatabasen, ägs gemensamt av nationalbiblioteken i Tyskland, Schweiz och Österrike. Av den anledningen är det svårt för något av nationalbiblioteken att ensidigt öppna upp databasen. I USA verkar den stora frågan vara hur man ska förhålla sig till OCLC. Själv lutar jag åt den till synes radikala lösning som föreslås av Science Commons i deras ”Protocol for Implementing Open Access Data” – att helt och hållet avsäga sig anspråk på ägandet av databaser. Om den bibliografiska kontroll biblioteken är så duktiga på ska ha något genomslag utanför bibliotekskatalogen, behöver man ge upp alla försök att kontrollera hur informationen i bibliotekskatalogen används.

 

Jag har skrivit en artikel om detta, som förhoppningsvis kommer i nummer 8 av en känd svensk branschtidning. Jag och Henrik kommer delvis in på dessa frågor i KB+SLBA:s monter på bokmässan nästa torsdag. På onsdag pratar Martin om LIBRIS och Linked Data på Dublin core-konferensen i Berlin.

2 kommentarer 19 september, 2008 Anders

LIBRIS – en del av semantiska webben

Så heter Martin Malmstens framförande på konferensen ”The Semantic Web and Libraries, archives and museums – trends for the future”, 17 september på Filmhuset i Stockholm. Ett spännande seminarium som verkligen berör biblioteksvärlden och som nog kan räta ut många frågetecken kring begreppet ‘semantisk webb’. Gå om ni har möjlighet!

2 kommentarer 12 september, 2008 Kristin


Kategorier

Senaste kommentarer

Arkiv

Verktyg

Informationskanaler