
Durante la presentazione del libro di Gino Roncaglia L’architetto e l’oracolo. Forme digitali del sapere da Wikipedia a ChatGPT (Laterza, 2023) in Biblioteca a Piacenza (il 17 febbraio dell’anno scorso) commentavo, in coda all’esposizione, che probabilmente uno dei lavori in biblioteca in cui bibliotecarie e bibliotecari sarebbero stati sostituiti dall’Intelligenza Artificiale sarebbe stata la catalogazione. La catalogazione descrittiva è il risultato dell’applicazione di una serie di istruzioni relativamente rigide per recuperare le informazioni su una pubblicazione (preferibilmente) dalla pubblicazione stessa e disporle in modo organizzato in un record bibliografico che sia ricercabile tramite alcuni campi preferenziali (autore, titolo, titolo dell’opera originale – in gergo tecnico titolo uniforme -, anno di pubblicazione). Alcune agenzie aggiungono altri campi a quelli preferenziali come: luogo di pubblicazione, editore. Poi ci sono pure i canali legati alla catalogazione semantica: soggetto, classe, parole chiave. Infine gli OPAC (per chi non è bibliotecaria/o: il portale che permette la ricerca dei documenti in una biblioteca o in un sistema bibliotecario) generalmente consentono pure la ricerca libera, che a volte è su tutto il complesso del record bibliografico mentre altre solo sui campi principali. Rispetto alla catalogazione semantica che prevede una “valutazione”, una “interpretazione” del documento per potergli assegnare un soggetto o una classe precisa legata all’argomento trattato in modo prevalente, la catalogazione descrittiva è la descrizione “formale” del documento: il titolo (del documento e dell’opera, oltre che della eventuale collana), l’autore (oltre ad eventuali altre responsabilità come curatore, traduttore, illustratore, ecc.), l’indicazione di edizione, il luogo di pubblicazione, l’editore, l’anno di pubblicazione, le dimensioni, eventuali note che segnalino elementi speciali della pubblicazione, dettagli sulla tipologia di fruizione (utile per documenti audiovisivi o multimediali, ecc.), dove gli elementi vanno recuperati dalle fonti prescritte dalle Regole Italiane di Catalogazione (REICAT) così come applicate dalla Guida alla catalogazione in SBN (il Servizio Bibliotecario Nazionale gestito dall’Istituto per il Catalogo Unico delle Biblioteche Italiane o ICCU). La catalogazione descrittiva è quindi un’operazione che può essere descritta come algoritmica e quindi (almeno teoricamente) automatizzata (molto più facilmente di quella semantica).
Nonostante questa convinzione mi sia stata contestata da colleghe e colleghi, la recente uscita del libro AI-Powered Cataloguing: A Practical Guide to Building a Cataloguing Application with Power Apps di Hannes Lowagie (Facet Publishing), capo dell’Agenzia per l’informazione bibliografica della Biblioteca Reale del Belgio (KBR) che si occupa dei progetti di retrocatalogazione e del deposito legale, contemporaneamente conferma la mia previsione ed i dubbi di colleghe e colleghi.
Conferma la mia previsione perché il libro è esattamente la descrizione di un progetto di retrocatalogazione (cioè di catalogazione dei fondi presenti in biblioteca ma non ancora catalogati, per lo meno nel catalogo elettronico) realizzato utilizzando un’applicazione che sfrutta anche l’Intelligenza Artificiale. Conferma però anche i dubbi di colleghe e colleghi perché gli innegabili risultati della sperimentazione evidenziano problemi sicuramente da affrontare.
Lowagie deve affrontare la catalogazione di pregresso e di documenti provenienti dal deposito legale dovendo fronteggiare la scarsità di risorse sia in termini economici sia di personale. Per questo si rivolge alla possibilità di utilizzare l’AI (userò da qui in poi l’acronimo inglese) all’interno della suite Power Platform di Microsoft. Dato che Power Platform (e i prodotti al suo interno come Power Bi, Power Apps, ed altri) non è un’applicazione specificatamente pensata per il mendo bibliotecario e per la catalogazione dei documenti, la maggior parte del libro di Lowagie è dedicata a spiegare per filo e per segno come strutturarla a questo fine. Tanto che l’editore si sente in dovere di avvisare all’inizio che il libro non è un prodotto ufficiale di Microsoft Power Apps e che non è sponsorizzato, approvato o pagato da Microsoft. E questo ovviamente è il primo e più generale problema: qual è la sostenibilità di una soluzione se ogni biblioteca deve, magari non programmarsi l’applicativo (anche se qualche riga di codice è presente nel libro), ma certamente mettersi nei panni di un “app designer” prima di poter utilizzare l’applicativo per i progetti di catalogazione? Un’altro problema sempre legato all’applicativo usato è che è realizzato da Microsoft per finalità generali e, come mostra lo stesso Lowagie, principalmente pensato per affiancare aziende e attività di business e quindi potrebbe, negli aggiornamenti, non tenere conto delle applicazioni dedicate alla catalogazione realizzate con esso e complicarle o addirittura vanificarle. E non sto, per carità patria, a sollevare questioni sull’utilizzo di software aperti nella Pubblica Amministrazione.
Ma ci sono anche problemi specifici forse maggiormente interessanti (ipotizzando che quelli generali possano essere superati con lo sviluppo di applicazioni dedicate).
Il primo problema è che all’AI all’interno dell’app vanno forniti dati che possa gestire, e non può gestire libri, riviste o altri documenti in formato fisico. Occorre fare le scansioni delle parti da cui la AI possa recuperare i dati. E già questo significa che occorre affiancare personale umano alla app non solo per controllare eventuali errori o malfunzionamenti, ma come indispensabile collaborazione al funzionamento, anche in assenza di problemi. Lowagie raccomanda – per i libri – la scansione della copertina, del frontespizio, del colophon e della quarta di copertina. Questo a suo parere dovrebbe permettere all’applicazione non solo di recuperare quasi tutti i dati per la catalogazione descrittiva, ma anche per quella semantica. In aggiunta c’è la necessità di collegarsi a un database esterno per altre informazioni quali le dimensioni fisiche ma anche classificazioni commerciali (ad esempio BISAC). Ma Lawagie non specifica o non valuta che non è del tutto possibile affidare il compito della scansione a personale non specializzato: non sempre le pagine indicate sono nelle posizioni standard, non sempre sulla quarta di copertina c’è un abstract affidabile. Non è del tutto infrequente poi, soprattutto se stiamo parlando di catalogazione retrospettiva o di catalogazione di documenti che arrivano per legge ma che non sempre sono realizzati da editori “industriali” che seguono standard riconosciuti, dover andare a cercare i dati che ci occorrono anche al di fuori dalle aree formalmente prescritte. Per la catalogazione semantica spesso non è sufficiente la quarta di copertina, ma occorre valutare anche l’indice, parti accessorie quali introduzione, prefazione, appendici, recensioni esterne. Cose che indubbiamente l’AI può fare, ma solo se le mettiamo i dati corretti a disposizione: e quindi occorre che ci sia qualcuna/o ad affiancarla sufficientemente competente per riconoscere quali sono le parti corrette per la catalogazione di un tipo e dell’altro. Tra l’altro siffatti collaboratori e collaboratrici rendono anche relativamente inutile l’accesso a database esterni dato che, intanto che scansionano le pagine corrette, possono anche inserire numero di pagine, dimensioni, presenza di illustrazioni o materiale allegato, tanto più che il lavoro per interfacciare l’app nel database esterno e importare i dati corretti nei campi corretti è sicuramente di gran lunga più lungo e complesso. Di più: avere persone competenti a fare le scansioni fa si che in caso di errori da parte dell’AI, questi possano più facilmente e velocemente trovare la soluzione (ad esempio scansionando altre pagine in prima battuta magari ritenute non indispensabili).
Un altro problema è il numero massimo di categorie disponibili che è 200. Numero assolutamente insufficiente sia per una soggettazione sia per una classificazione. In più non stiamo parlando di una vera e propria soggettazione, ma di una più semplice assegnazione di parole chiave. Nell’applicazione messa a punto da Lawagie infatti non si affronta assolutamente il problema di come istruire l’AI ad applicare la sintassi necessaria a costruire una frase di soggetto (ad esempio il soggetto per Pedagogia del gioco e dell’apprendimento : riflessioni teoriche sulla dimensione educativa del gioco di Rosa Cera è “Bambini – Sviluppo psichico – Ruolo [dei] Giochi”: espressione estremamente significativa che non può essere resa dall’uso di parole chiave isolate) ma neppure del resto a costruire una classe Dewey complessa che preveda l’uso delle Tavole. Anche questo problema è ovviamente legato all’utilizzo di uno strumento non specifico e può essere superato nell’ottica di una implementazione dell’AI nelle esistenti applicazioni per la catalogazione.
Del resto lo stesso Lowagie è consapevole che:
This book is not just a guide, it is an invitation. It is an invitation to use this tool but also to become part of something bigger: a community of innovators transforming the way we approach bibliographic cataloguing. By collaborating, we can unlock new possibilities, refine best practices and create solutions that go beyond the needs of today to prepare us for the challenges of tomorrow.
Questo libro non è solo una guida, è un invito. È un invito a usare questo strumento ma anche a diventare parte di qualcosa di più grande: una comunità di innovatori che sta trasformando il modo in cui affrontiamo la catalogazione bibliografica. Collaborando, possiamo sbloccare nuove possibilità, affinare le migliori pratiche e creare soluzioni che vanno oltre le esigenze di oggi per prepararci alle sfide di domani.
In questo senso, davvero Lowagie è da ammirare come un pioniere che ha affrontato in una barchetta un mare apparentemente intraversabile e col suo anche diseconomico dimostrare che la cosa “si può fare!” (per citare, ovviamente, Mel Brooks) ha aperto la strada per quanti non si vorranno a tutti costi barricare nella tradizione ma saranno disposti a mettersi in gioco (magari con barche un po’ meglio attrezzate) per provare ad aprire nuove rotte commerciali… pardon, catalografiche e biblioteconomiche. E, contemporaneamente, ha tranquillizzato anche chi come me aveva fatto la previsione della AI catalogatrice ma temendola, in considerazione che l’attività della catalogazione – pur non essendo mai stato io un catalogatore “puro” – ho sempre apprezzato come attività che, ordinando i documenti, in qualche modo dava un ordine rassicurante anche al mondo. Tranquillizzato perché è evidente che fino a quando o tutti i documenti saranno digitali e digitalizzati o l’AI riuscirà ad interagire direttamente con il mondo analogico (tramite i Librarianator?) ci sarà ancora spazio per noi, catalogatrici e catalogatori.

Link nel post:
- La mia presentazione de L’architetto e l’oracolo: https://ossessionicontaminazioni.blogspot.com/2023/12/non-solo-architetti-e-oracoli-il-nuovo.html
- REICAT: https://norme.iccu.sbn.it/index.php?title=Reicat (qui anche la versione in pdf: https://www.iccu.sbn.it/export/sites/iccu/documenti/2015/REICAT-giugno2009.pdf)
- Guida alla catalogazione in SBN: https://norme.iccu.sbn.it/index.php?title=Guida_alla_catalogazione_in_SBN
- ICCU: https://www.iccu.sbn.it/it
- Hannes Lowagie su LinkedIn: https://www.linkedin.com/in/hanneslowagie
- Pagina dedicata a AI-Powered Cataloguing sul sito di Facet Publishing: https://www.facetpublishing.co.uk/page/detail/ai-powered-cataloguing/?k=9781783308071
- Sito della KBR: https://www.kbr.be
- Power Platform di Microsoft: https://www.microsoft.com/it-it/power-platform
- Descrizione bibliografica di Pedagogia del gioco sull’OPAC SBN: http://id.sbn.it/bid/MOD1559679

Lascia un commento