Kunnskapsdeling

Bibliografisk kontroll

… Oss kontrollfrikere imellom:

Library of Congress har kommet med en erklæring om at fremtiden til bl.a. MARC21 må revurderes.
Nye tider har strammet inn på katalogiseringsbudsjettene rundt om, samtidig stilles det større krav til bibliografiske data enn noensinne (fritt oversatt).

«Cultural heritage institutions see their resources dwindling at the same time that they need to invest in dramatic new uses of bibliographic data. In this environment, many institutions have been forced to relax standards of quality in bibliographic records while still being asked to broaden their services, especially in terms of the availability of digital data.

Efficiencies in the creation and sharing of cataloging metadata are therefore imperative: information providers and cultural heritage institutions must reevaluate their use of scarce resources, both as individual organizations and as a community.»

Det litt vittige er forresten at akkurat de samme tingene var begrunnelsen for FRBR-rapporten, da den kom i 1998.

Går utifra at både form og innhold må vurderes mht hvordan vi katalogiserer, og det er jeg helt sikker på at LC kommer til å gjøre. Ellers er det jo mange som er veldig opptatt av
selve MARC-formatet, og vil dets død. Her er noen argumenter som stadig høres, jeg kommenterer i parantesen.

MARC er et slags «stammespråk», bare fagfolk forstår det.
(Er LITT usikker på hvor problemet egentlig ligger her?)
MARC-21-felt inneholder for mye ikke-maskinleselig (og ikke-standardisert) informasjon.
(Har det med formatet å gjøre? Er andre formater pr def standardiserte når det gjelder hvilke
opplysninger du plotter inn i de? Er de??)
MARC-21 katalogisatorer er altfor pirkete.
(Ja. Det er noe i at bibliotekarer har en viss respekt for katalogiseringsreglene, og har problemer med å bryte dem. Kanskje det er pga våre personlige egenskaper? Kanskje vi burde bryte minst én regel om dagen, som terapi?)
MARC-formatet legger opp til for dårlig utnyttelse av de bibliografiske dataene.
(Ja, ganske enig)
Det er alt for vanskelig å bruke MARC-21. Og vi trenger flere eksplisitte relasjoner, mer standardisering, og mere gjenbruk.
(Her har LC en nøtt)

Jeg synes mye høres vanskelig ut i denne forbindelse, men min enkle oppfatning er noe sånt som:

På webben trenger vi noe som er enklere å fortolke for en datamaskin. Koder som viser at her begynner denne opplysningen, og her slutter den. Koding som viser hvilke opplysninger som hører sammen, og hvorfor de hører sammen (relasjoner). Og vi trenger entydige opplysninger; mer standardisering.

Mye informasjon ligger implisitt i en MARC-post, men den samme informasjonen bør gjøres eksplisitt. At (alle?) opplysninger på en katalogpost hører sammen, er en type implisitt imformasjon. At 100-tagen forholder seg til 245-tagen er implisitt. At kanskje over 95% av alle 100-tagger er en forfattertag ligger implisitt. Men om 100-taggen også har en kode «aut» i $4, er det både sikkert og eksplisitt at her er det en forfatter det er snakk om.

Om en 700-tag har kode «edt», så vet vi at her er det (høyst sannsynlig) snakk om en redaktør til den boka som har tittel på samme post som er registrert i 245. Men om det ikke står noen kode i en 700-tag, så er det ganske mange relasjonsmuligheter.

Om noen har glemt 700 $a og $t og i stedet brukt 700 og 740 så er det duket for trøbbel (de som skjønte dette tilhører ”stammen”).

På en katalogpost står de fleste taggene (MARC-feltene) i ett eller annet forhold til resten av feltene. Men forholdet er ikke alltid like opplagt som det er med 100 (forfatter) og 245 (tittel). (Stammespråk: 700, 740, 500, for ikke å si 600, kan være problematiske. For ikke å snakke om 691 !! )

Går utifra at LC vil se på alle disse tingene. Og håper de legger vekt på å få frem HVILKE opplysninger er så viktige at de må kunne entydig tolkes og utnyttes av en datamaskin.
Det er tross alt noe med at AACR2 ikke får tydelig frem om vi bør være mer pinlig nøyaktig noen steder enn andre.
Håper LC analyserer hva som er «pirk» og hva som er standardisering. (Foreslår to kolonner slik at det kommer klart fram 😉 )

Det er iallefall flott at LC vil granske både RDA, MARC-21 i forhold til hva de mener vi trenger av bibliografiske data fremover.

Det som er litt uklart for meg, er hvordan LC skal kunne klare å slå alle fluer i en smekk:
Behovet for mer entydige data, behovet for mer detaljerte data, behovet for mer eksplisitt kodete data, behovet for konvertering til mer datavennlige data, behovet for enklere gjenbruk og mekking på andres data OG behovet for mer rasjonalisering pga strammere økonomi.

Det blir spennende å se hvor vi havner. Nå skal jo vi også straks over til MARC-21 fordi vi har fått et nytt
biblioteksystem. Man er jo nesten avmodernisert før man har begynt!
Men trøsten er at dersom vi får dataene våre mer eller mindre velberget over til MARC-21, så blir vi i neste runde med på en kyndig styrt masseovergang til noe nyere og bedre.

PS1. I Trondheim er det en lek der du holder en haug med sand i hånden, snur hånden og sanden havner på håndbaken. Du snur hånden igjen og igjen, mens du sier:
”Så my hadd æ, så my ga æ bort, så my mista æ, og så my fekk æ igjen…”
Av en eller annen grunn får ”datakonvertering” meg til å få den assosiasjonen. Men det var en total digresjon.
PS2 innledningen her var en festlig spøk.
Jeg er veldig veldig klar over at det er mange av oss som er blitt bibliotekarer for å kompensere for alt
det vi ellers roter med.

Sigrun

This entry was posted on fredag, juni 3rd, 2011 at 13:17 and is filed under KORG. You can follow any responses to this entry through the RSS 2.0 feed. You can skip to the end and leave a response. Pinging is currently not allowed.

2 svar til “Bibliografisk kontroll”

Sigrun sier:

06.06.2011, kl. 13:51

La heller MARC pensjonere seg, men bruk den som konsulent.
MARC er komplisert, men den reflekterer en komplisert dokument-verden.
At det skal være enkelt for lånerne er absolutt ikke det samme som at det er enkelt for oss. Men likevel enig med deg i at MARC
må gjennom en skikkelig alderstest.

Fint om feltnavn er entydige og forståelige både for maskin og menneske, men jeg har ennå tilgode å se et vokabular som tolkes likt av alle, selv om det er brukt ord. Ofte er begreper snublende nær hverandre, og det er ikke alt som like lett kan uttrykkes med ett ord heller.
For min del må man gjerne bruke koder, bare det er klart definert et sted hva kodene står for, og det er med gode eksempler.
Det gjelder uansett koder eller ord. Koder kan uansett oversettes til noe menneskeleselig. Det viktigste må være at informasjonen er puttet i tagger som ikke kan forveksles med hverandre og at ikke formatene blir brukt forskjellig av de som registrerer.

Litt urettferdig synes jeg, å si at MARC bare kan lage en digital representasjon av katalogkortet, og ikke helt sant det jeg sier i innlegget heller, at MARC ikke kan knytte sammen relaterte opplysninger på en eksplisitt måte.
Det finnes nemlig mulighet for å lage eksplisitte relasjoner mellom marc-felt.
http://www.loc.gov/marc/bibliographic/ecbdcntf.html
(Problemet er at kodingen ikke kan skje internt i et marc-felt, f.eks. ikke i felt 260 (ikke mulig å sammenstille Oslo : Aschehoug, 1998)

Vi vil ha linked data. Men linked data er fortsatt er en metode og ikke et format.
Vi trenger et godt format som kan erstatte MARC, men det kommer til å ta tid å lage, og imens må vi holde MARC(-kunnskapen) i live.

Karen Coyle og Jonathan Rochkind sier mye bra om disse tingene, f.eks på RDA-postlista .

Karen Coyle har også laget en wiki som er interessant å se på. Her har hun f.eks. begynt å analysere MARC i forhold til hva vi trenger i et nytt format.

Ja, hva med et linked data prosjekt på spesialsamlingene. Det hadde vært interessant. De har en tesaurus f.eks.
Tarje sier:

04.06.2011, kl. 14:12

Det er bare en ting å si: linked data. Vi har rett og slett ikke bruk for MARC lengre. Det er maskinleselig (vel, egentlig ikke), men knapt leselig for mennesker, Ingen kan vel påstå at 008 er lett å tyde. MARC er et stammespråk, en anakronisme og absolutt ikke et «lingua franca» på noen måter.

«MARC-21-felt inneholder for mye ikke-maskinleselig (og ikke-standardisert) informasjon. (Har det med formatet å gjøre? Er andre formater pr def standardiserte når det gjelder hvilke opplysninger du plotter inn i de? Er de??)»
Tenk 245 $c. Maskiner må bruke reg.ex. for å tolke delfeltet, om det ligger mer informasjon enn bare forfatter. Ja, du har andre felt for å uttrykke dette, men det er en elendig løsning som tar meg videre til neste poeng.

Hovedårsaken til at MARC må dø er at det «bare» er i stand til å lage en digital representasjon av katalogkortet. Ingen av feltene kan brukes for seg selv, «100 Dude, Some» gir ikke mening uten posten. Linked data gjøre sammenhengen eksplisitt, med http URIer for subjekt – predikat – objekt (mer: http://brinxmat.posterous.com/microdata-how-wrong-can-it-be). Det gjør det mulig å knyttet sammen relaterte ressurser, enklelt lage autoriteter og dele/mikse ontologier .
Et nett av data gjør deling og gjenbruk av bibliografisk metadata lettere, men selv om våre (meta)data ikke skal deles fritt er linked data prinsippet overlegent MARC. Jeg tror det vil frigjøre ressurser til å lage tjenester på toppen av vår metadata. Hva med et linked data prosjekt på spesialsamlingene?

MARC RIP!

Les mer:
http://linkeddatabook.com/editions/1.0/#htoc30
http://en.wikipedia.org/wiki/Linked_data
http://obd.jisc.ac.uk/
http://discovery.ac.uk/

Bibliografisk kontroll

2 svar til “Bibliografisk kontroll”

Legg igjen en kommentar

Arkiv

Bloggrøkt