DigiLellky – en digital kortkatalog på SMB

Under 2008 ansökte Statens Musikbibliotek hos Riksbankens Jubileumsfond om finansiering för skanning, indexering och publicering av bibliotekets systematiska musikaliekatalog. Katalogen, avslutad 1985, innehåller nästan 300 000 kort och bakom dessa döljer sig ca 120 000 noter. Som en jämförelse kan nämnas att bibliotekets onlinekatalog i skrivande stund innehåller ca 46 000 noter. Merparten av materialet utgörs av noter tillgängliga för utlån, men även av en större mängd rariteter från 1600-,1700- och 1800-tal. Till den ursprungliga katalogen tillkom även kort ifrån bibliotekets orkesteravdelning inklusive blåsorkestermusik och marscher samt en katalog över autograferna bland de rara samlingarna. Biblioteket erhöll sökta medel under senhösten 2008 och arbetet började i stor skala på det nya året 2009.

Den övergripande tanken med projektet är att tillgängliggöra dessa äldre delar av bestånden i en databas på bibliotekets webbplats. Låntagare skall kunna söka och bläddra ibland korten i databasen samt även beställa noter direkt ifrån önskad kortbild. Noterna hämtas sedan i lånexpeditionen på Torsgatan i Stockholm. Om en beställd not får lånas hem, dvs. om den inte är över 100 år alt. i för dåligt skick, så katalogiseras den i LIBRIS vid tillbakalämnande. Varje not lånas alltså endast ut en gång från databasen och den gamla kortkatalogen blir till slut (förhoppningsvis) en ren raritetskatalog.

Åke Lellky (se bild) var den bibliotekarie som under 1940-talet arbetade fram en systematik skräddarsydd för dåvarande Musikaliska Akademiens Bibliotek. Systematiken är nästan uteslutande uppbyggd efter besättning och därför även hylluppställd i magasinet efter besättning. Instrument/röst eller ensembletyp ges varsin kategori med en signifikativ bokstav. P = Piano, S = Sång. V= Violin och kombinationer såsom VP = Violin och Piano. Lellky har försett huvudkategorierna med ytterligare nyanser, detta i form av fler bokstäver i kombination. Dessa är inte alltid helt självförklarande. Några exempel:

Pb = Piano fyra eller 6 händer. PB = Piano samlingar, Gi/Sv = Svensk instrumental barnmusik, Xe = Mikrofilm, KbQE = Damkör med Orgel och ett eller flera andra instrument. Inalles finns över 300 Lellkykategorier, mer eller mindre förvirrande för en vanlig låntagare.

Då systematiken är skuren på olika ledder, t.ex. besättning kontra informationsbärande media, och ibland saknar konsekvens var vi tvungna att bygga ut den, framförallt med klartext för respektive kategori.

Inledningsvis lades mycket krut på planering av indexeringsprinciper och användargränssnitt, bildkvalitet samt OCR-tolkning (optisk teckenigenkänning) av korten. OCR-tolkningen visade sig, trots ett toppmodernt program, vara en utmaning då korten är smutsiga efter (i vissa fall) 100 år av bläddrande. Många kort är dessutom mycket bleka då man, gissningsvis under krigsåren, använt skrivmaskinernas färgband till sista bläckdroppen. Fördelen med moderna OCR-program är att man kan lära dem typiska avvikelser och därmed få ett avsevärt bättre resultat, även om texten ser hopplös ut vid en första anblick. Ca 90% av texten från OCR-tolkningen blev till slut korrekt, vilket utgör en bra ingång för fritextsökning i databasen. De äldsta handskrivna korten får dessvärre inget OCR-stöd alls.

En svårighet med bildinställningarna var att få maximal bildläslighet på skärmen för användare samt att OCR-programmet skulle kunna tolka så bra som möjligt. Efter enträget finjusterande träffades en god kompromiss. Med den för projektet inköpta dokumentskannern kunde ca 7-8 kortlådor skannas in per dag, dvs ca 6000 kort. En mycket behändig apparat på det hela taget, men den fick utstå svåra prövningar med dessa gamla kort. Mikko Niskanen, som gjorde det mesta av skanningsarbetet, fick öppna skannern och damma ur den flera gånger per dag. Gummihjulen som matar in korten i skannern slets ned och fick bytas ut totalt 4 gånger. Serviceteknikern som bytte hjulen fick även rengöra skannerns ömtåliga innandömen flera gånger samt byta andra slitna och repiga delar.

För att ge säkra sökingångar i materialet gjordes en indexering av vart 5:e kort där tonsättare/huvuduppslag samt titel angavs exakt som de står på kortet (de flesta andra kortkataloger som publicerats digitalt har index på vart 10:e eller 20:e kort). Detta var ett drygt arbete och det sista kortet ur den ursprungliga katalogen gavs sitt index av Mattias Karlsson på absolut sista officiella projektdagen, närmare bestämt den 30:e december vid 15-tiden. Sammanlagt indexerades alltså totalt ca 60 000 kort. Sviter av kort inom en Lellkykategori och med samma tonsättare genomindexerades med huvuduppslag, detta med ett verktyg som Jan Johansson skapat på beställning. Den tonsättarlista som skapats skall nu, när indexeringen är i det närmaste klar, rensas från skräp och uppenbara stavningsvarianter av samma namn slås ihop. Detta ger ännu säkrare ingångar i databasen.

Datakonsult Jan Johansson, som tidigare arbetat med Dübenprojeket i Uppsala, kontrakterades för databaskodning/-hantering samt webbpublicering. Han har även fortlöpande varit behjälplig med programmering av formuläret för indexering, en stor mängd andra förnämliga verktyg samt idéer/synpunkter.

Text: David Jansson

Åke Lellky, 1903-1973. Bibliotekarie vid Musikaliska Akademiens Bibliotek 1936-1968

Åke Lellky, 1903-1973. Bibliotekarie vid Musikaliska Akademiens Bibliotek 1936-1968