dinsdag 29 september 2009

Maak je eigen zoekmachine - Ewoud Sanders

Ewoud Sanders schrijft in IP 2009/10 over de manier waarop hij de door hem gebruikte informatie (m.n. taalhistorisch) heeft ontsloten op zijn PC. Zijn advies: "Leg gebruikmakend van openbare bronnen, op je eigen PC een digitale materiaalverzameling aan".

Hoe doe je dat?
Hier het evrslag van de lezing van Sanders waarin hij de stappen beschrijft, aangevuld met toevoegingen uit IP artikel [bron: http://tinyurl.com/ykoc7ze].

Ewoud Sanders maakt een eigen digitale bibliotheek in 7 stappen
Op 1 september organiseerde de opleiding Nederlands van de Universiteit Leiden een lezing door Ewoud Sanders getiteld: De reïncarnatie van het boek, in zeven stappen een eigen bibliotheek. Roos Goverde, Cora Pieffers en Simone Kortekaas waren er bij en maakten het volgende verslag.

Ewoud Sanders (bekend van vooral zijn column in het NRC over etymologie en aanverwante zaken) betoogt dat het voor taal- en letterkundigen en historici grote voordelen heeft om een eigen digitale bibliotheek te hebben, en dat het helemaal niet zo moeilijk is om zo’n digitale bibliotheek op je eigen pc aan te bouwen. Met relatief kleine investeringen zouden onderzoekers de kwaliteit van hun onderzoek enorm kunnen verbeteren. Hoe? Ewoud Sanders legt het, gelardeerd met veel voorbeelden van de voordelen, uit in zeven stappen:

Stap 1
Koop twee softwareprogramma’s, namelijk een professioneel indexeringsprogramma en een programma waarmee je pdf’s kunt maken en OCR-en .

Stap 2
Ga oogsten. Op internet (Digitale Bibliotheek Nederlandse Letterkunde (www.dbnl.org ), Google Books, Bibliografie van de Nederlandse Taal- en Literatuurwetenschap, Picarta, webpagina’s, etc), kijk wat op CD of DVD verschenen is, vraag pdf’s op bij uitgevers of andere bronnen.

Stap 3
Hernoem de documenten zodat je ze goed kunt sorteren (jaartal vooraan, soort publicatie of thema).

Stap 4
Maak thematische mappen.

Stap 5
Maak indexen aan, op het moederbestand of op (wisselende) deelselecties. Aanbevolen indexeringsprogramma (€120 per jaar): Isys Personal Edition [www.isys-search.com]. Daarmee kun je 200 bestandformaten doorzoeken (ook mail), zowel Boleaans als met * (fuzzy). Een x vervangt een willekeurig woord.

Stap 6
Voeg zo nodig handmatig metadata toe, die bruikbaar is voor je (toekomstig) onderzoek.

Stap 7
Ga zelf scannen. Koop een professionele scanner, snijdt de rug van je boeken en scan wat je aan handboekerij in de kast had staan.

De digitale bibliotheek die je op deze wijze opbouwt bevat al snel veel meer tekst en woorden dan je op andere wijze bij elkaar kunt vergaren. Groot voordeel is dat je je bronnen kunt afperken en dat je voor je onderzoek flexibel deelsets van bronnen kunt maken, nieuwe bronnen toevoegen, beperken op een bepaalde periode etc. Je bepaalt zelf welke indexen je voor je onderzoek nodig hebt en indexeren van je bestand kost steeds maar een paar minuten.

Bij de lezing verscheen een mooi boekje waarin alles nog eens uitgelegd wordt, met veel voorbeelden, plaatjes en een CD met daarop een handleiding plus een deel van de taalkundige digitale bibliotheek die Ewoud Sanders zelf heeft opgebouwd (51 miljoen woorden). Dit boekje is aardig voor onze Utrechtse historici en taal- en letterkundigen en zal daarom worden afgeleverd bij de collega’s van de UBB voor mogelijke opname in de collectie van Geesteswetenschappen.
Wat wij hier van leren als bibliotheekmedewerkers? Het is goed om te weten dat onderzoekers hun bronnenmateriaal graag ook zelf verzamelen en wat zij er dan zoal mee doen. En om die onderzoekers te faciliteren moeten we vooral doorgaan met het digitaal aanleveren van materiaal en ons nationaal en internationaal hard maken voor open access van alles wat digitaal beschikbaar is.

Geen opmerkingen:

Een reactie posten