Kunnskapsdeling

Biletsøking

juni 17th, 2011

BetaUB og Ole Husby melder i dag om ei ny teneste frå Google. Det er no mogeleg å laste opp eit bilete (eller oppgi url til eit bilete), og få Google til å søke etter liknande bilete. Surra litt før eg kom i gang, men det verka umiddelbart lovande. Eg brukte url til eit bilete eg sjølv hadde tatt, og Google klarte umiddelbart å sjå at dette var innsida av kuppelen i det finske nasjonalbiblioteket. Gitt at biletet var med lang lukketid og utan blits, var eg ganske imponert over kva Google klarte å finne att (klikk på biletet for ein større versjon). I trefflista fann eg to lenker til Nasjonalbiblioteket (alltid nyttig å ha) samt fleire ‘liknande bilete’, mange frå nasjonalbiblioteket. Det var bilete tatt frå andre vinklar, men og frå andre rom. Kva fyren i blå skjorte gjer der, veit eg ikkje, men han er tydelegvis også finsk. -Kanskje ein nasjonalibibliotekar? I denne samanhengen kunne søket verifisere kvar eg hadde tatt biletet, og trefflista syntest nyttig.

Men så søkte eg vidare, og var ikkje heilt like fornøgd. Om eg i staden søker basert på eit blomsterbilete frå ein nyleg arrangert blåtur, ser trefflista heilt annleis ut. For å seie det slik: denne trefflista ville ikkje hjelpt meg synderleg på quizen.

Arten er ikkje gjenkjend (kanskje litt optimistisk å håpe på). Om alle blomane på biletet var kvite, var dei elles nesten heilt, men ikkje komplett ulike den på mitt bilete. Botanisk sett var det lite slektskap å snakke om.

Tenesta kjem heilt sikkert til å utvikle seg og bli betre. Og om ein ikkje kan stole på å få nyttige treff, så kan ein tydelegvis få det innimellom. Og det kan kanskje vere nok til å kikke innom av og til?

1 Comment | Ukategorisert | Permalink
Posted by bubhf

Bibliografisk kontroll

juni 3rd, 2011

… Oss kontrollfrikere imellom:

Library of Congress har kommet med en erklæring om at fremtiden til bl.a. MARC21 må revurderes.
Nye tider har strammet inn på katalogiseringsbudsjettene rundt om, samtidig stilles det større krav til bibliografiske data enn noensinne (fritt oversatt).

«Cultural heritage institutions see their resources dwindling at the same time that they need to invest in dramatic new uses of bibliographic data. In this environment, many institutions have been forced to relax standards of quality in bibliographic records while still being asked to broaden their services, especially in terms of the availability of digital data.

Efficiencies in the creation and sharing of cataloging metadata are therefore imperative: information providers and cultural heritage institutions must reevaluate their use of scarce resources, both as individual organizations and as a community.»

Det litt vittige er forresten at akkurat de samme tingene var begrunnelsen for FRBR-rapporten, da den kom i 1998.

Går utifra at både form og innhold må vurderes mht hvordan vi katalogiserer, og det er jeg helt sikker på at LC kommer til å gjøre. Ellers er det jo mange som er veldig opptatt av
selve MARC-formatet, og vil dets død. Her er noen argumenter som stadig høres, jeg kommenterer i parantesen.

MARC er et slags «stammespråk», bare fagfolk forstår det.
(Er LITT usikker på hvor problemet egentlig ligger her?)
MARC-21-felt inneholder for mye ikke-maskinleselig (og ikke-standardisert) informasjon.
(Har det med formatet å gjøre? Er andre formater pr def standardiserte når det gjelder hvilke
opplysninger du plotter inn i de? Er de??)
MARC-21 katalogisatorer er altfor pirkete.
(Ja. Det er noe i at bibliotekarer har en viss respekt for katalogiseringsreglene, og har problemer med å bryte dem. Kanskje det er pga våre personlige egenskaper? Kanskje vi burde bryte minst én regel om dagen, som terapi?)
MARC-formatet legger opp til for dårlig utnyttelse av de bibliografiske dataene.
(Ja, ganske enig)
Det er alt for vanskelig å bruke MARC-21. Og vi trenger flere eksplisitte relasjoner, mer standardisering, og mere gjenbruk.
(Her har LC en nøtt)

Jeg synes mye høres vanskelig ut i denne forbindelse, men min enkle oppfatning er noe sånt som:

På webben trenger vi noe som er enklere å fortolke for en datamaskin. Koder som viser at her begynner denne opplysningen, og her slutter den. Koding som viser hvilke opplysninger som hører sammen, og hvorfor de hører sammen (relasjoner). Og vi trenger entydige opplysninger; mer standardisering.

Mye informasjon ligger implisitt i en MARC-post, men den samme informasjonen bør gjøres eksplisitt. At (alle?) opplysninger på en katalogpost hører sammen, er en type implisitt imformasjon. At 100-tagen forholder seg til 245-tagen er implisitt. At kanskje over 95% av alle 100-tagger er en forfattertag ligger implisitt. Men om 100-taggen også har en kode «aut» i $4, er det både sikkert og eksplisitt at her er det en forfatter det er snakk om.

Om en 700-tag har kode «edt», så vet vi at her er det (høyst sannsynlig) snakk om en redaktør til den boka som har tittel på samme post som er registrert i 245. Men om det ikke står noen kode i en 700-tag, så er det ganske mange relasjonsmuligheter.

Om noen har glemt 700 $a og $t og i stedet brukt 700 og 740 så er det duket for trøbbel (de som skjønte dette tilhører ”stammen”).

På en katalogpost står de fleste taggene (MARC-feltene) i ett eller annet forhold til resten av feltene. Men forholdet er ikke alltid like opplagt som det er med 100 (forfatter) og 245 (tittel). (Stammespråk: 700, 740, 500, for ikke å si 600, kan være problematiske. For ikke å snakke om 691 !! )

Går utifra at LC vil se på alle disse tingene. Og håper de legger vekt på å få frem HVILKE opplysninger er så viktige at de må kunne entydig tolkes og utnyttes av en datamaskin.
Det er tross alt noe med at AACR2 ikke får tydelig frem om vi bør være mer pinlig nøyaktig noen steder enn andre.
Håper LC analyserer hva som er «pirk» og hva som er standardisering. (Foreslår to kolonner slik at det kommer klart fram 😉 )

Det er iallefall flott at LC vil granske både RDA, MARC-21 i forhold til hva de mener vi trenger av bibliografiske data fremover.

Det som er litt uklart for meg, er hvordan LC skal kunne klare å slå alle fluer i en smekk:
Behovet for mer entydige data, behovet for mer detaljerte data, behovet for mer eksplisitt kodete data, behovet for konvertering til mer datavennlige data, behovet for enklere gjenbruk og mekking på andres data OG behovet for mer rasjonalisering pga strammere økonomi.

Det blir spennende å se hvor vi havner. Nå skal jo vi også straks over til MARC-21 fordi vi har fått et nytt
biblioteksystem. Man er jo nesten avmodernisert før man har begynt!
Men trøsten er at dersom vi får dataene våre mer eller mindre velberget over til MARC-21, så blir vi i neste runde med på en kyndig styrt masseovergang til noe nyere og bedre.

PS1. I Trondheim er det en lek der du holder en haug med sand i hånden, snur hånden og sanden havner på håndbaken. Du snur hånden igjen og igjen, mens du sier:
”Så my hadd æ, så my ga æ bort, så my mista æ, og så my fekk æ igjen…”
Av en eller annen grunn får ”datakonvertering” meg til å få den assosiasjonen. Men det var en total digresjon.
PS2 innledningen her var en festlig spøk.
Jeg er veldig veldig klar over at det er mange av oss som er blitt bibliotekarer for å kompensere for alt
det vi ellers roter med.

Sigrun

2 Comments | KORG | Permalink
Posted by bubak

Biletsøking

Bibliografisk kontroll

Arkiv

Bloggrøkt