Islandora Online: Islandora and Migration

Dit jaar wordt er vanwege de corona crisis ook door Islandora een Online event gehouden, of eigenlijk zijn het 4 events van elk 5 uur.
Hieronder het verslag van het derde event, gehouden op 4 augustus. Het verslag van het eerste event is hier te vinden. Het verslag van het tweede event is hier te vinden.

Helaas kon ik niet “live” aanwezig zijn bij dit event vanwege vakantie, maar gelukkig is het hele event opgenomen. Hierbij een verslag gebaseerd op het opgenomen event.

Uitdagingen

Het onderwerp van dit event is het migreren van content naar Islandora 8 vanaf Islandora 7 of een ander systeem. Migreren levert altijd vragen en problemen op, tenzij de data die gemigreerd wordt al perfect is. En dat is eigenlijk nooit het geval. Migreren levert altijd uitdagingen op: Omdat de metadata niet perfect is. Omdat lastige keuzes gemaakt moeten worden. Omdat bepaalde delen van de data niet passen in het nieuwe systeem. Omdat het nieuwe systeem (een nieuw soort) data verwacht of kan bieden die nog niet in het oude systeem zat. Omdat de metadata op een ander precisie niveau ingevoerd moet worden.

Soms moeten er lastige keuzes gemaakt worden tijdens de migratie, die er later voor zorgen dat er meer mogelijk wordt. Zo heeft in de metadata een persoon vaak een rol. Ook kan een persoon identifiers hebben en/of een of meerdere namen. De manier waarop deze data gemigreerd wordt, bepaalt voor een groot deel wat er daarna in Drupal (mee) gedaan kan worden.

Drupal Migrate

Drupal Migrate is de manier om veel migraties te doen. Natuurlijk zijn ook andere manieren mogelijk, maar bij alle zijn twee technieken te onderscheiden: ETL en ELT. ETL staat voor Extract data, Transform data en Load data. Dus eigenlijk haal je de data eerst uit het oorspronkelijke systeem, daarna vorm je de data zo dat het ingelezen kan worden in het nieuwe systeem en dan lees je het in. De letters van ELT staan ook voor Extract, Transform en Load. Alleen wordt de data nu eerst ingelezen waarna het wordt omgevormd.

Drupal Migrate gebruikt ETL, waarbij deze fases duidelijk te onderkennen zijn binnen het proces. Een migratie wordt uitgedrukt als een YAML document. Drupal Migrate maakt ook gebruik van de Drupal Plugin API waardoor het mogelijk is om eigen acties tijdens de migratie te definiëren. Natuurlijk bestaan er al veel van dit soort plugins in de Drupal community en worden ze ook gebruikt binnen Islandora 8. Zo is er een plugin om data te “extracten” uit Islandora 7, maar ook data van bestanden of data via een web API kan gebruikt worden. Maar ook zelf een plugin ontwikkelen is relatief simpel.

Drupal Migrate ondersteunt ook high water marks, wat betekent dat bij een migratie die niet helemaal goed gaat alleen het stuk wat misgaat opnieuw gedaan hoeft te worden. Mocht het helemaal misgaan, dan kan ook een rollback (terug naar een punt waar het nog wel goed was) gedaan worden.

Hulpmiddelen en tutorials

migrate_islandora_csv is een online begeleiding (tutorial) over hoe men Drupal Migrate kan gebruiken. Als bron gebruikt men een CSV bestand, maar er wordt uitgebreid stilgestaan bij het opschonen en vormen van de data (de T van ETL) en hoe men relaties tussen data aanlegt tijdens de migratie. Bovendien wordt dit alles stap-voor-stap uitgelegd.

migrate_7x_claw is een module bedoeld om te migreren vanaf Islandora 7 naar Islandora 8. Alle datastreams worden hiermee gemigreerd, inclusief “audit trail“. De metadata wordt gemigreerd vanuit Solr of een willekeurige XML datastream. Maar migrate_7x_claw is vooral een startpunt voor de migratie en nog geen volledige oplossing. Het is iets wat nog verder ingevuld en ontwikkeld moet worden voor de specifieke situatie. Om migrate_7x_claw goed te kunnen gebruiken en begrijpen, is migrate_islandora_csv een goed startpunt. Ook is het belangrijk om de Drupal Migrate API goed te begrijpen, maar ook Drupal config synchronization en Drupal features.

Andere migratie methodes

Migratie kan natuurlijk ook op een andere manier. Islandora 7 content wordt opgeslagen in Fedora 3.x. Islandora 8 content wordt (deels) opgeslagen in Fedora 5. Fedora 5 en 6 verschillen niet veel van elkaar, in elk geval veel minder dan Fedora 3 verschilt van Fedora 5. Islandora 8 of 9 gaat op een gegeven moment ook draaien op Fedora 6. Vanuit de Fedora community is er een project om de overgang van Fedora 3 naar Fedora 6 wat betreft migratie zo simpel mogelijk te houden. Ze zijn hier ook druk mee bezig dus het is interessant om te kijken of dit ook een manier is om van Islandora 7 naar Islandora 8 over te gaan.

Zowel Islandora 7 als Fedora 3 hebben een REST API. Ook Islandora 8 bevat een REST API. Dus in principe is het mogelijk om data uit het oude systeem te halen via de REST API. Daarna deze data omzetten in een ander formaat met welke methode/programmeertaal dan ook. Vervolgens de data inlezen via de Islandora 8 REST API. Voordeel is dat je volledige controle hebt over de data en het proces, maar dat is ook meteen het nadeel. Dit betekent namelijk dat je alles zelf moet doen.

Islandora Workbench is een ander hulpmiddel om te gebruiken bij migraties. Het gebruikt de REST API en gebruikt als bron een CSV bestand. Dit bestand moet al wel het juiste formaat hebben. De export en transform moet dus eigenlijk buiten Workbench om gedaan worden. Hierdoor is de configuratie en gebruik van Workbench vrij simpel, maar het werk ervoor kan complex(er) zijn. Workbench heeft allerlei manieren om de data voor ingesten te checken, zodat bij ingest er geen verrassingen zijn.

Migratie naar Islandora 8 kan dus op veel manieren, maar zal altijd (in meer of mindere mate) werk en hoofdbrekers opleveren. Al met al een erg interessant event, waarbij ik veel geleerd heb. Migratie naar Islandora 8 is veel verder dan ik gedacht had. Het verslag van het vierde en laatste event is hier te vinden.

Islandora Online: Islandora & Metadata

Dit jaar wordt vanwege de corona crisis ook door Islandora een Online event gehouden. Eigenlijk zijn het 4 events van elk 5 uur. Hieronder het verslag van het tweede event, gehouden op 28 juli. Het verslag van het eerste event is hier te vinden.

Metadata anders

Het tweede event had als onderwerp metadata. Islandora 8 behandelt metadata anders dan Islandora 7. In Islandora 7 wordt de metadata in een XML bestand ingeladen. MODS, Dublin Core, METS en MADS (voor personen) zijn opties, waarbij meestal MODS gekozen wordt. Islandora 7 genereert dan Dublin Core metadata uit de MODS omdat Dublin Core in Fedora verplicht is. Islandora 8 slaat de metadata op in Drupal fields die aan een “Repository item” hangen. Deze velden kunnen bepaalde beperkingen hebben, zoals lengte of inhoud. Zo kan je instellen dat bijvoorbeeld een datum veld ook echt alleen datums kan bevatten.

Beperkter met meer mogelijkheden

Islandora 8 levert standaard al veel metadata velden mee. Er is een mapping van MODS naar deze velden. Maar MODS (en andere metadata schema’s) bieden veel meer mogelijkheden om de metadata precies te typeren/classificeren. Er werd dus gediscussieerd over deze mapping en of het gebruik van velden niet te beperkend is. Hier werd geen concensus over bereikt.

Nu is het wel zo dat hoewel wij in Islandora 7 MODS gebruiken met een groot aantal velden, we lang niet alle velden van deze MODS ook echt afbeelden of op andere manieren gebruiken. Deel van de discussie was ook of Islandora nu echt de plek is om al je metadata te managen. Of zijn er systemen die daar beter geschikt voor zijn. Ik denk dat het laatste het geval is.

Taxonomie en Linked Data

Drupal 8 maakt voor de velden (indien gewenst) wel gebruik van een taxonomie. Deze kan zowel open (gebruikers kunnen eigen termen toevoegen) als gesloten (gebruiker kan alleen kiezen uit een vastgestelde lijst) zijn.
Er was ook een praatje over hoe je een autocomplete veld maakt die via Linked Data de data ophaalt. Hierbij werd zowel de tekst als een URI opgeslagen, zodat de relatie gehouden blijft.
De metadata bij een Repository item wordt in Fedora als Linked Data opgeslagen. Wanneer de metadata wijzigt van een item, dan wordt deze geserialiseerd in RDF en vanuit Drupal naar Fedora gestuurd, zodat de metadata ook duurzaam bewaard blijft.

Gebruik en tools

Er werd natuurlijk ook gesproken over het gebruik van metadata; welke velden missen in welke situaties en hoe wordt metadata opgeruimd in Islandora 7 zodat de migratie naar Islandora 8 beter en soepeler verloopt. Dat de metadata in Islandora 7 opgeruimd moet worden voordat aan de migratie naar Islandora 8 begonnen wordt, staat als een paal boven water.
Islandora Workbench is een tool om metadata (maar ook objecten) te kunnen wijzigen of inladen. Er zijn verschillende andere manieren om dit te doen voor zowel Islandora 7 als 8. Maar het is goed te zien dat verschillende tools worden ontwikkeld want dan is er iets te kiezen.

De dagen zijn wel lang als je een online event “bezoekt” wat in Canada gehost wordt. Ze hielden wel een beetje rekening met andere landen door het begin uur steeds te verschuiven, maar dit event was pas om 10 uur ’s avonds afgelopen. Hier is het verslag van het derde event te lezen.

Islandora Online: Islandora 8

Dit jaar wordt vanwege de corona crisis ook door Islandora een Online event gehouden. Eigenlijk zijn het 4 events van elk 5 uur. Hieronder een verslag van het eerste event, gehouden op 21 juli en alleen online (dus geen mooie plaatjes van exotische oorden).
De events hebben allemaal een soortgelijke opbouw: steeds ongeveer 1 uur praatjes en daarna korte pauze, met in het midden een langere pauze van een uur waarvan een half uur “social” is: je kan praten met de anderen (business or pleasure) of een spelletje spelen (vooral kruiswoordraadsels in het Engels zijn een uitdaging).

Verschil tussen Islandora 7 en Islandora 8

Het eerste event had als onderwerp Islandora 8. Islandora 8 verschilt van Islandora 7 nog meer dan Drupal 7 verschilt van Drupal 8. Maar dat is zeker niet slecht. Waar Islandora 7 Drupal 7 gebruikt om Islandora content te tonen, is in Islandora 8 deze content eigenlijk gewoon al Drupal 8 content. Dit houdt in dat Islandora 8 veel dichter bij Drupal 8 blijft en daardoor allemaal technieken maar vooral ook modules van Drupal 8 (een soort plug-ins voor extra functionaliteit) zonder enige aanpassing meteen kan gebruiken. Dit maakt Islandora 8 flexibeler en makkelijker uitbreidbaar.

Taken en microservices

Taken worden ook veel beter gescheiden van andere zaken: microservices voeren precies 1 bepaalde taak uit, los van de rest van het systeem. Bijvoorbeeld het aanmaken van afgeleiden of “optische tekenherkenning” (OCR) wordt geheel los van Drupal uitgevoerd, eventueel op hele andere servers. Een bepaalde actie start de microservice vanuit code door een en met een bepaalde context. De microservice wordt echter niet meteen gestart. De vraag en context worden in een wachtrij gezet totdat de microservice vrij is om de vraag te beantwoorden. Als de microservice klaar is, komt het antwoord (bijvoorbeeld een afgeleide of een OCR bestand) terug naar Drupal.

Digitale preservatie en opslaan

De taak van het opslaan van de data wordt uitbesteed aan Flysystem. Flysystem zorgt ervoor dat de plek waar de data opgeslagen wordt en de manier waarop opgeslagen wordt abstract is voor Drupal. Flysystem koppelt Fedora aan Drupal, waardoor de belangrijke data in een Digital Asset Management system wordt opgeslagen. Aangezien dit allemaal in te stellen is, kan gekozen worden wat nu eigenlijk belangrijke data is die dus opgeslagen wordt in Fedora, zodat Fedora de digitale preservatie kan regelen. Maar als de data naar een andere plek moet, kan dit ook. Opties hierbij zijn ondere andere local disk, (s)ftp, dropbox, AWS S3 of andere Cloud storage (via OpenStack swift).

Integraties en community

Islandora 8 heeft inmiddels een grote groep mensen die eraan werken en ook integraties met andere systemen maken. Zo is er al een integratie met ArchivesSpace. Voor statistieken wordt Matomo gebruikt, maar dit staat nog in de kinderschoenen. Islandora 8 biedt ook OAI-PMH. Zoals bij alles in Drupal 8 is ook dit een view, die helemaal is in te stellen zoals je wilt. Ook is Islandora 8 uit de box IIIF compatible. Cantaloupe implementeert de IIIF image API. Drupal 8 genereert de IIIF manifests (ook een view). Islandora 8 kan een manifest interpreteren en via een ingebouwde IIIF viewer afbeelden.

Support en updates

Drupal 7 support is uitgebreid tot november 2022. Islandora 7 houdt vast aan de eerdere datums. Dit betekent features tot november 2020, bug fixes tot november 2021 en security updates tot april 2022. Drupal 8 support loopt (gek genoeg) tot november 2021, maar de overstap naar Drupal 9 is relatief klein. Wanneer Islandora 9 uitkomt en de support voor Islandora 8 eindigt, is nu nog niet bekend.

Het was een hele interessante middag en avond. Over de andere 3 events verschijnt binnenkort ook een blog. Hier staat de blog van de tweede dag en hier die van de derde dag.

Coronamoe

Voor deze rubriek gaan we iedere maand op zoek naar nieuwe taaluitingen. Soms is het even zoeken en staat er niet meer dan één woord op mijn keuzelijstje, maar deze keer viel de oogst erg mee:

Anderhalve-meter-challenge, afschalen, amateurviroloog, anderhalve-meter-economie, balkonzanger, buitenschaamte, coroneus, coronials, coronomie, corontaine, digitale pandemie, disselen, druppelbesmetting, ellebooggroet, elleboogniezen, epidemiologische paraatheidsinnovaties, groepsimmuniteit, hamsterschaamte, handenschudverbod, hoestschaamte, hoestscherm, houdt-afstandhesje, infectietsunami, intelligente lockdown, kuchscherm, landelijk coördinatiecentrum patiëntenspreiding, lichaamscondoom, lockdown, lockdownparty, lockdownpopulisme, luchtmuur, massasurveillance, no-fly-periode, onthamsteren, oversterfte, pandemierooster, paniekwinkelen, physical distancing, quarantainehotel, raambezoek, Skypevisite, social distancing, sociale onthouding, superverspreider, thuisquarantaine, toerismeverbod, TOGS-regeling, virusbuddy, voetgroet, weigerklant, winkelprotocol, wuhanshake, zelfisolatie, ziektelast, ziektebubbel, ziektepiramide, zoomen, zorgapplaus en zorgheld.

En natuurlijk corana-aanpak, corana-advies, corana-afdeling, corana-alarm, coranababy, coranabesmetting, coranabrandhaard, coranacontactadvertentie, coronacrimineel, coranacrisis, coranadagboek, coronadictatuur, coronadienst, coronadode, coronadossier, corona-emoji, corona-epidemie, corona-expert, coronafeest, coronagebied, coronahotspot, coronahulpverlening, corona-informatie, corona-invloed, coronalied, coronaloket, coronamaatregel, corona-on-ice, coronaoverleg, coronapandemie, coronapatiënt, coronaregering, coronarichtlijnen, coronaroman, coronaslachtoffer, coronasticker, coronastress, coronasymptomen, coronatest, corona-uitbraak, coronavirus, coronazieke, coronaziekenhuis, corona-akkoord, corona-angst, corona-apocalyps, corona-app, coronaboete, coronacocooning, coronacontainer, coronacrash, coronagezant, coronagriep, coronahufter, coronakiller, coronaklever, coronanie, corona-ontkenner, coronaparanoia, coronapiek, coronaprotocol, coronaspuger, coronavakantie, coronaverdacht en coronaviering.

Maar de keuze viel deze maand, zonder concurrentie, op het woord boven dit stukje.

Infodemie

Het coronavirus zorgt naast een hoop ellende ook voor een nieuw woord in de Nederlandse taal: infodemie. Het is een mixwoord van informatie en epidemie. De eerste vermelding die ik vond, staat op de website van de Vereniging België China en dateert van 3 februari. De site gebruikt infodemie als vertaling van het Engelse infodemic, in een verwijzing naar een uitspraak van directeur-generaal Tedros Adhanom Ghebreyesus van de World Health Organization (WHO). Ghebreyesus zegt dat er niet alleen gevochten wordt tegen een epidemic, maar ook tegen een infodemic, die zich sneller verspreidt dan het Coronavirus en net zo gevaarlijk is. Een infodemic, en dus ook een infodemie, is een overvloed aan informatie, waardoor het lastig is om betrouwbare berichten te vinden. Het gaat dan niet alleen om de stroom aan geruchten, complottheorieën en (ander) fake news, maar bijvoorbeeld ook om experts die tegenstrijdige dingen zeggen over het gebruik van mondkapjes en andere voorzorgsmaatregelen. Net als bij een epidemie is het zaak om de infodemie in de kiem te smoren, aldus Ghebreyesus. De WHO werkt samen met Facebook, Pinterest, Tencent, Twitter, TikTok, YouTube en andere social media om de geruchten en desinformatie de kop in te drukken. In samenwerking met Google wordt berichtgeving van de WHO bovenaan de zoekresultaten gezet.

Het gekke is dat de oorsprong van het woord Infodemic in Nederland ligt. Al in 1999 werd het IT-bedrijf Infodemic bv ingeschreven bij de Kamer van Koophandel. In het Engelse taalgebied komen we Infodemic voor het eerst tegen in 2003. Toen ging het over de stroom aan berichten over SARS. Omdat die epidemie aan ons land voorbij ging, is het toen nooit tot een vertaling gekomen. Overigens ging het Nederlandse Infodemic bv een paar jaar na de oprichting failliet. Laten we hopen dat het de huidige infodemie niet veel beter vergaat.

(Eerder verschenen in de rubriek IP Lingo van IP-Vakblad voor informatiespecialisten 2020-3)

Digital Curation Conference Dublin

Mart van Duijn bezocht van 17-20 februari 2020 de International Digital Curation Conference in Dublin. Hieronder volgt een beknopt verslag.

Op 17 t/m 20 februari vond in Dublin de International Digital Curation Conference (IDCC) plaats, georganiseerd door het Digital Curation Centre (DCC), een expertisecentrum voor digital curation dat is ondergebracht bij de University of Edinburgh. Het IDCC is een jaarlijks internationaal congres (vanaf 2005) dat volledig is gericht op het gebruik en beheer van digitale objecten door onderzoekers, organisaties en instellingen.

Op de keynote lezingen na, zijn de bijdragen tijdens deze editie van het IDCC grofweg in te delen in presentaties over research data management (RDM) en digital preservation (DP). Voor Bijzondere Collecties is vooral digital preservation van belang, research data management is bij het CDS in portefeuille. DP draait voornamelijk om het acquireren, duurzaam opslaan en beschikbaar stellen van zowel gedigitaliseerd als born digital materiaal. Lezingen op dit punt gingen in op verschillende rollen en verantwoordelijkheden, namelijk die van de onderzoekers die zich meer bewust zouden moeten zijn van de noodzaak van het duurzaam bewaren van digitale onderzoeksdata en -objecten, instellingen die de juiste infrastructuur moeten inrichten voor dergelijk materiaal en actief bij het aanmaken daarvan betrokken zouden moeten zijn, en gebruikers die bediend moeten worden zodat digitaal materiaal hergebruikt kan worden. Een rode draad door hele congres heen waren dan ook de FAIR principes: Findable, Accessible, Interoperable, Reusable. Meerdere malen werd tevens herhaald dat die principes alleen nagestreefd kunnen worden als er communicatie en samenwerking is tussen de verschillende betrokken partijen.

Voor de Bijzondere Collecties van de UBL waren meerdere sessies en presentaties relevant, vooral die die ingingen op de rol van instellingen in het gebruik en beheer van digitaal materiaal. In het bijzonder relevant was de presentatie van Katrina Fenlon (University of Maryland) waarin zij aangaf welke rol instellingen zouden moeten spelen in het beheer van Digital Humanities Collections. In veel gevallen is bij de totstandkoming daarvan geen beherende instelling betrokken, met grote gevolgen voor de duurzame opslag. Instellingen moeten zich daarbij niet opstellen als laatste rustplaats, maar als actieve deelnemer. Vanuit de National Library of Ireland werd een lezing gegeven door directeur Sandra Collins. Zij benaderde het beheer van digitaal materiaal vanuit een historisch perspectief en benadrukte de rol die de bibliotheek van oudsher heeft en die ook in digitale tijden voortgezet dient te worden. Daarbij ging ze voornamelijk in op gedigitaliseerd materiaal en bleef born digital helaas onderbelicht. Dat instellingen elders op dezelfde manier geconfronteerd worden met born digital materiaal en dezelfde ontwikkeling doorgaan als de UBL, werd goed duidelijk in de posterpresentatie van Emma Yan en Clare Paterson, getiteld University of Glasgow: Our Digital Transformation (https://zenodo.org/record/3664615#.XmDqQ6TvKUk).

Born digital zal een van de speerpunten zijn in het beleidsplan voor de periode 2021-2025. Dan moeten er grote stappen gezet worden in het acquireren en duurzaam beheren van dergelijk materiaal. De sessies en presentaties tijdens het IDCC in Dublin hebben duidelijk gemaakt dat de UBL kan aansluiten bij ontwikkelingen en expertise elders, maar dat zij geenszins tot de achterhoede behoort.

Mart van Duijn

Leesoffensief

Ha, dat klinkt nog eens goed, leesoffensief. Een woord dat dynamiek en daadkracht suggereert, dat blijk geeft van een haast militaire aanpak. Het is het centrale thema van een brief die OCW-minister Van Engelshoven en haar collega Slob van Basis- en Voortgezet Onderwijs en Media in december aan de Kamer stuurden. De ministers reageren daarin op het internationale PISA-rapport, waaruit blijkt dat het niet goed gaat met de leesvaardigheid van de Nederlandse jongeren. En dus is het tijd voor actie! De ministers baseren hun actieplan op Lees!, een adviesrapport van de Onderwijsraad en de Raad voor Cultuur. In dit advies wordt het begrip leesoffensief geïntroduceerd. Zowel de Onderwijsraad en de Raad voor Cultuur als de ministers zien een belangrijke rol weggelegd voor leerkrachten en bibliothecarissen, niet helemaal toevallig twee beroepsgroepen die de afgelopen jaren nogal te lijden hadden van overheidsbezuinigingen. In Lees! gaan de auteurs uitgebreid in op de kaalslag die plaatsvond in de bibliotheekwereld. Ze geven aan dat gemeenten zorg moeten dragen voor een goede bibliotheekvoorziening en dat de overheid hen daarop aan moet spreken als dit niet gebeurt. Voor scholen geldt dat ze extra moeten worden gefinancierd.

Dat is nog eens mooi advies! En het is niet tegen dovemansoren gezegd, want  de ministers Slob en van Engelshoven beloven in hun brief dat de regering middelen gaat reserveren voor … een letterenfestival en een organisatie die lezers en schrijvers met elkaar in contact moet brengen. En de bibliotheken en scholen? Er staan veel mooie woorden in de brief van de ministers, maar het komt er uiteindelijk op neer dat de bibliotheekmedewerkers (tegenwoordig vooral vrijwilligers) gewoon hun wettelijke leesbevorderingstaak moeten oppakken. Het toch al bomvolle onderwijscurriculum krijgt als extra onderdeel het vak leesplezier. Probleem opgelost. En als blijkt dat hierdoor andere vakken in de knel komen, dan introduceren de ministers volgend jaar waarschijnlijk gewoon het vak rekenpret.

Leesoffensief. Het is een mooi woord, maar of de vlag de lading dekt? Mijn suggestie voor de ministers: leesschijnaanval.

Kamerbrief over leesoffensief

Dit artikel verscheen in licht gewijzigde vorm in InformatieProfessional 2020/1

Naar aanleiding van mijn artikeltje in de InformatieProfessional kwamen er nogal wat reacties. Daarom schreef ik op mijn eigen blog een nadere toelichting:

Soms vraag ik bij het schrijven van een nieuwe IPLingo wel eens af of de stukjes gelezen worden, want er bereiken me nauwelijks reacties. Dat was met mijn laatste stukje, over het leesoffensief dat de onderwijsministers aankondigden, wel anders. Ze vragen om een antwoord.

Voor alle duidelijkheid, ik vind de gedachte achter het Leesoffensief prima en ik wil zeker niet op de rem trappen. En ook weet ik dat de Openbare Bibliotheken veel goed werk doen op dit gebied. Ik heb zelf in de openbare bibliotheekwereld gewerkt en ben op de hoogte van dBoS en andere initiatieven. Maar mijn kritiek richt zich niet op het werk van de bibliotheken.

Essentieel in Lees!, het rapport van de Raad voor Cultuur en de Onderwijsraad, is een goede en structurele financiering voor het slagen van het beleid (zie kader). Hoezeer de ministers ook putten uit Leef!, over financiering wordt met geen woord gerept en daarmee wordt het plan een reus op lemen voeten. Ik vind het een schrijnend voorbeeld van hoe onderwijs en bibliotheekwereld taken toebedeeld krijgen terwijl anderzijds de benodigde financiële middelen niet ter beschikking worden gesteld, sterker nog, terwijl de kaalslag nog steeds voortduurt. In dat kader had ik het in mijn stukje over “vooral vrijwilligers” in de bibliotheek. Dat is niet bedoeld om bibliotheekprofessionals die bezig zijn met leesvaardigheid etc. weg te zetten als ongekwalificeerde krachten, maar om nogmaals aan te geven dat een goed beleid alleen gevoerd kan worden met een deugdelijke financiering.

https://www.bibliotheekinzicht.nl/organisatie/vrijwilligers-de-bibliotheek

Een “zure” IPLingo? Wie mijn andere IPLingo’s en artikelen leest, zal  zien dat die vrij luchtig zijn en er weinig zuurheid in te vinden is. Maar omdat ik me tijdens het lezen over het Leesoffensief steeds meer ergerde over de vrijblijvendheid van de ministersbrief werd het inderdaad een zuur stukje. Volgende keer weer iets leuks!

De geboorte van een woord: woordenverbod

Luistert u al naar drill? De kans is groot dat u niet bekend bent met deze vrij nieuwe vorm van rap, maar als u een clip ziet waarin de artiesten zijn voorzien van een bivakmuts, en als ze dan ook nog eens crimineel gedrag en wapengebruik verheerlijken in hun met veel fockings gelardeerde teksten, dan kunt u er verzekerd van zijn dat u te maken heeft met een drillrap. Kijk en luister maar eens naar de fine fleur van de Nederlandse drill op https://www.youtube.com/watch?v=cg22-pX8jdw.

De Engelse drillrapper en drugshandelaar Rico Racks werd onlangs veroordeeld tot drie jaar gevangenisstraf én een verbod op het rappen van woorden als trapping (dealen) en bandoe (drugspand). De Engelstalige media spraken over een word ban.
Die uitdrukking werd een paar jaar daarvoor ook veel gebruikt toen er ophef was over het nieuws dat het Amerikaanse Center for Disease Control woorden als transgender en fetus (foetus) niet meer mocht gebruiken van de overheid. Het bleek achteraf een storm in een glas water, maar ook in de Nederlandse media was er gedurende korte tijd veel aandacht voor dit minirelletje. Voor word ban werden omslachtige beschrijvingen gebruikt als ‘het verbod op het gebruik van bepaalde woorden’. Woordenverbod was immers nog geen bestaand woord. Dat duurde tot 21 oktober 2019, toen de veroordeling van Rico Racks bekend werd gemaakt. NOS.nl maakte om 14:54 als eerste gewag van een woordenverbod. Toen was het hek direct van de dam. Nog diezelfde dag spraken ook 7days, het Jeugdjournaal, De Morgen en tal van andere media over een woordenverbod alsof het de normaalste zaak van de wereld was. En toen het Instituut voor de Nederlandse taal woordenverbod ook nog bekroonde tot neologisme van de week wisten we het zeker: een nieuw levensvatbaar woord was geboren.

(Eerder verschenen in IP- Vakblad voor informatiespecialisten 2019-9)

Islandoracon 2019

IslandoraCon is de Islandora Conferentie die eens in de 2 jaar wordt gehouden. Islandora is het open source digitaal repository systeem dat door de Universiteit Leiden gebruikt wordt voor haar Digitale collecties en binnenkort ook voor het Scholarly Repository en het Student Repository.
IslandoraCon werd na Charlottetown (2015) en Hamilton (2017) dit jaar in Vancouver gehouden. Het was een vooral Canadees/Amerikaanse aangelegenheid want van de 110+ bezoekers kwamen er 3 van buiten Canada en Amerika; een uit Afrika, een uit Nieuw-Zeeland en een uit Europa (ik). Het congres zelf duurde 3 dagen maar werd voorafgegaan door een dag met workshops en afgesloten door een Use-a-Thon/unconference.
Hieronder een verslag van de 5 dagen.

De eerste workshop waar ik aan deelnam ging over ISLE. De afkorting staat voor Islandora Enterprise en wordt ontwikkeld door de Islandora Collaboration Group (ICG). Eigenlijk is dit Islandora als een Docker container, waardoor naar eigen zeggen het minder werk is om Islandora te installeren en onderhouden, makkelijker overgegaan kan worden naar nieuwe versies (dus ook de overstap van Islandora 7 naar Islandora 8) en het betere security en reliability biedt omdat het vaker geüpdatet wordt. Natuurlijk staat daar tegenover dat er minder mogelijk is wat betreft eigen invulling van hoe de componenten samenwerken en waar ze geïnstalleerd zijn (meerdere servers). We hebben zelf ISLE geïnstalleerd op onze lokale laptop met behulp van Docker, dit was redelijk eenvoudig maar vereiste dan wel weer kennis van Docker en andere componenten zoals Traefik.

De tweede workshop ging over plugins maken voor Drupal 8. Dit was erg interessant maar drukte me meteen met de neus op de feiten: er is nog een heleboel te leren, alleen al over Drupal 8.
Een plugin is een nieuwe API in Drupal 8. Het is de bedoeling dat een plugin precies 1 ding doet, zodat het goed herbruikbaar en snel is. Plugins zijn configureerbaar, ze kunnen verschillend gedrag/functionaliteit implementeren via een zelfde interface. In Drupal 8 zijn er ook services. Services zijn uitwisselbaar met elkaar en bieden hetzelfde gedrag/functionaliteit maar met verschillende interne implementaties. Een voorbeeld van een service is bijvoorbeeld caching; er zijn verschillende services die caching binnen Drupal kunnen verzorgen, en deze zijn uitwisselbaar al naar gelang de wensen en eisen. Een voorbeeld van een plugin is bijvoorbeeld het maken van afgeleide plaatjes wanneer er een TIF plaatje wordt ingeladen binnen Islandora 8 (wat dus eigenlijk Drupal 8 is aan de voorkant).
Het plugin systeem vervangt het hook systeem van Drupal 7 en is net zo krachtig, maar duidelijker gedefinieerd en meer toekomst bestendig.

Na de workshops van dag 1 werd de conferentie echt geopend met een overzicht van Islandora nu en in de toekomst. Natuurlijk ligt de focus nu op Islandora 8, wat voorheen Islandora CLAW genoemd werd. Maar Islandora 7 wordt zeker niet vergeten. Er wordt voor Islandora 7 overgegaan naar een jaarlijkse release (dit was 2 keer per jaar), maar aangezien er nog steeds veel instellingen gebruikmaken van Islandora 7, wordt het voorlopig nog ondersteund: na november 2020 wordt er geen nieuwe functionaliteit meer toegevoegd, na november 2021 worden er geen bug fixes meer gedaan en na april 2022 worden er geen security fixes meer gedaan. Dit hangt ook samen met Drupal 7 dat vanaf november 2021 niet meer ondersteund wordt.
Verschillende aspecten van Islandora worden behartigd door verschillende groepen: de Coordinating Committee (voorheen de Roadmap Committee) bepaalt de richting van Islandora op de langere termijn en bevordert de Islandora community, de Technical Advisory Group doet aanbevelingen met betrekking tot de architectuur en technische roadmap van Islandora, de Multi-tenancy Interest Group houdt zich bezig met multi-site support in Islandora 8 (één Islandora installatie met meerdere websites) en de Metadata Interest Group focust op metadata (vooral in Islandora 8 aangezien het hier heel anders werkt). Andere interest groups zijn hier te vinden: https://github.com/islandora-interest-groups

Er werd deze dag veel over Islandora 8 verteld. Versie 1.0.0 is op 5 juni 2019 officieel uitgekomen. Waar Islandora 7 nog als een hamburger werd gerepresenteerd, wordt Islandora 8 als een bento box gezien, namelijk verschillende onderdelen die goed met elkaar samengaan (samenwerken) maar uitwisselbaar zijn. Islandora 8 is veel meer verweven met Drupal 8. Waar Islandora 7 het mogelijk maakte om Islandora objecten binnen Drupal te gebruiken, is het bij Islandora 8 zo dat die objecten volledige Drupal nodes zijn. Islandora 8 maakt gebruik van nodes (waar islandora 7 een object gebruikt), files (vergelijkbaar met de datastreams in 7) en media (deze koppelt de nodes aan de files en hier wordt de technische metadata bewaard). Islandora objecten zijn dus “first-class citizens“. Dit betekent dat alle modules die voor Drupal 8 geschreven zijn, ook meteen toepasbaar zijn voor Islandora 8. Eigenlijk is Islandora 8 zelf onder andere een Drupal 8 module die de functionaliteit van een digital repository aan Drupal toevoegt. Veel functionaliteit waarvoor in Islandora 7 veel code nodig was, is in Islandora 8 al beschikbaar via Drupal 8 en door configureren beschikbaar te maken. Islandora 8 voegt aan Drupal 8 onder andere het volgende toe: JSON-LD (een manier om Linked Data over te dragen als JSON), een koppeling met Fedora Commons (met behulp van Flysystem worden bepaalde bestanden in Fedora bewaard) en het genereren van afgeleiden.
Er wordt al hard gewerkt aan de volgende versies van Islandora 8: er worden onder andere breadcrumbs, paged content (wat boeken en kranten mogelijk maakt), IIIF manifesten, text extraction en versioning toegevoegd. Dit zou voor het eind van dit jaar gereed moeten zijn. Ook wordt er gekeken naar de migratie naar Drupal 9 en Fedora Commons 6, aangezien Drupal 9 eind 2020 uitkomt. Dit betreft een kleine update en is zeker geen migratie zoals van Islandora 7 naar 8. Wel biedt Fedora Commons 6 het Oxford Common File Format. Dit is een standaard manier voor opslaan van digitale informatie waardoor deze data compleet (de hele repository kan opnieuw opgebouwd worden met deze data), leesbaar (voor mens en machine, ook zonder de originele software), robuust (fouten in bestanden kunnen ontdekt worden, migratie is makkelijker) en versiebeheerd (wijzigingen zijn herleidbaar en kunnen teruggedraaid worden) opgeslagen kan worden op verschillende storage mogelijkheden (filesystem, cloud, etc.).
Migratie van data naar Islandora 8 werd ook uitvoerig besproken. Ook dit gaat op een standaard Drupal 8 manier. Er is een Migrate API in Drupal 8 ingebouwd die werkt volgens het ETL principe; Extract – Transform – Load. Hier zijn al meerdere plugins voor beschikbaar en migratie is dus vooral een kwestie van veel configuratie bestanden maken of aanpassen, testen en migreren. Er wordt druk gewerkt aan standaard manieren om Islandora 7 data te migreren naar Islandora 8, maar aangezien er altijd “eigen wensen” zijn zal geen enkele migratie dit zonder aanpassingen kunnen gebruiken.

Gedurende de hele conferentie waren er interessante presentaties van andere Islandora gebruikers. Er was een presentatie over een interactieve kaart met verhalen over Vancouver, waarbij op de kaart aangegeven was waar het verhaal was verteld. De verhalen worden zo op een heel andere manier gevonden. Zoals veel bij Islandora, is de code achter de site vrij toegankelijk. Zie https://thisvancouver.vpl.ca/story-city
De mensen van Discover Okanagan Historical Resources hadden een aparte kijk op digitaliseren: het afbreken van een collectie en het opnieuw digitaal opbouwen ervan, waarbij bepaalde impliciete relaties worden verwijderd die later opgebouwd moeten worden in metadata.
Er was een sessie over performance van Islandora, waaruit bleek dat we al veel goed doen, maar Solr optimalisatie is nog wel een belangrijk punt wat nog gedaan moet worden. Optimalisatie bleek ook nu weer een zeer gespecialiseerd onderwerp te zijn waarbij er niet altijd standaard oplossingen zijn.
Een andere sessie ging over microservices. Dit zijn een of meerdere gespecialiseerde programma’s die communiceren met Drupal over (meestal) http. Deze microservices kunnen draaien op “any server, in any language and under any technology”. Islandora 8 maakt veel gebruik van microservices, onder andere voor afgeleiden maken (audio, video, images), FITS (File Information Tool Set, technische metadata uit bestanden halen), text extraction, fixity checks en BagIt integration. In Drupal kan een bepaalde actie gedaan worden als binnen een context aan bepaalde condities voldaan is. Dit is zonder veel code te configureren, zodat bijvoorbeeld als er een original file aan de media wordt toegevoegd (context en conditie), deze door Drupal aan CrayFITS (microservice) gegeven wordt, die de technische metadata uit het bestand haalt en weer binnen Drupal bewaard (action), waarna dit weer in Solr geïndexeerd wordt (dit is weer een andere microservice).
Er waren nog vele andere interessante presentaties, onder andere over content modelling in Islandora 8, diverse manieren van inlezen van content, over namen (“Falsehoods librarians believe about names”) en over headless Islandora. Helaas staan deze presentaties nog niet online, dus kan ik hier niet naar linken.

De laatste dag was gereserveerd voor een Use-a-Thon en de unconference. Tijdens de Use-a-Thon werden bepaalde usecases opgelost in groepsverband, waarbij mooie prijzen te winnen waren. De winnaars hadden een oplossing voor Oral History Transcriptions, Collection Search en multi-tenancy. Helaas viel onze groep (de “Exhibitionists”) net buiten de prijzen, maar toch een mooi resultaat.

Het was een erg zinvolle conferentie waarbij ik veel geleerd heb, maar waar het ook duidelijk werd dat er nog heel veel te leren valt, vooral over Islandora 8.