UN «THESAURUS STRUTTURATO» PER LA GESTIONE AUTOMATICA DEL LEMMARIO LATINO DEL LESSICO FILOSOFICO DEI SECOLI XVII E XVIII
Giacinta Spinosa
UN «THESAURUS STRUTTURATO» PER LA GESTIONE AUTOMATICA DEL LEMMARIO LATINO

DEL LESSICO FILOSOFICO DEI SECOLI XVII E XVIII
17

Nel lemmario latino del Lessico filosofico dei secoli XVII e XVIII sono

confluiti tutti i lemmi con le loro principali ricorrenze sintagmatiche, così

come sono stati selezionati e lemmatizzati nel corso di più anni da parte

di un gruppo di ricercatori del Lessico Intellettuale Europeo che ha lavo-

rato allo spoglio di 49 opere latine appartenenti a 24 autori. La visione

complessiva e allo stesso tempo sintetica dell’insieme di tali lemmi si è avuta

in seguito alla memorizzazione dell’intera documentazione che costituisce

il materiale di partenza per la redazione del Lessico filosofico dei secoli

XVII e XVIII. La memorizzazione di più di 11.000 contesti selezionati,

infatti, è avvenuta contestualmente a quella degli 8.000 lemmi messi in

evidenza ed ha avuto come esito la creazione di una base di dati capace di

fornire tutte le risorse di un sistema di documentazione automatica. Tra

queste, la creazione di un thesaurus — il nostro lemmario — che «nella

documentazione automatica» si definisce come un «insieme di termini (pa-

role chiave) utilizzati quali elementi di classificazione di una serie di docu-

menti e quali codici per il loro reperimento» 1 . In senso proprio, quindi,

c’è una certa differenza tra la natura di un thesaurus e quella di un lem-

mario: indice-soggettario, il primo, elenco dei lemmi presenti in una serie

di contesti, il secondo.

È da notare a questo proposito che i sistemi di documentazione auto-

matica attualmente esistenti, ivi incluso quello adottato per il Lessico filo-

sofico (l’Univac Document Access System, studiato per gestire schedari

bibliografici), non sono facilmente adattabili alla gestione di dati lessicali

e lessicografici. Tuttavia l’utilità complessiva, risultante dalla possibilità di

avvalersi di un sistema di documentazione automatica per il trattamento

della vasta mole di dati relativi al Lessico filosofico, ha indotto all’adozione

18

dell’UNIDAS e, conseguentemente, all’operazione consistente nel 'piegare’

le caratteristiche del suo «thesaurus strutturato» (i cui componenti cioè

sono collegati da strutture di relazione) alla gestione di un lemmario lessi-

cografico. Operazione tanto più utile in quanto capace di ovviare ad un fe-

nomeno di cui si era del resto pienamente consapevoli, anche alla luce delle

esperienze condotte da altre équipes e da singoli ricercatori in settori ana-

loghi di ricerca: vale a dire la forte incidenza della sensibilità individuale

dello schedatore e delle peculiarità lessicali di ciascun testo schedato sul-

l’esito finale della lemmatizzazione. Procedura, quest’ultima, per la quale si

è ancora privi di una prassi uniformata su norme fisse, nonostante venga

auspicata da più parti 2 .

Dalla constatazione della complessa articolazione del lemmario e di

alcune difformità derivanti dalle oscillazioni nella lemmatizzazione è nata

l’esigenza di individuare un sistema in grado di creare una rete di rela-

zioni tra tutti quei termini i quali, variamente lemmatizzati e perciò collo-

cati anche a notevole distanza nella successione alfabetica, in realtà devono

essere presi in considerazione in un’unica soluzione dal redattore delle voci

del Lessico filosofico, allo scopo di valutare sotto quale di tali entrate vada

composta la voce. Tale sistema è stato individuato appunto nel «thesaurus

strutturato» fornito da UNIDAS.

L’intervento sul lemmario, mirante a istituire strutture di relazione

tra i suoi componenti, è stato quindi condotto a tre livelli: 1) disambigua-

zione delle omografie; 2) elevazione di un termine al rango di termine più

comprensivo rispetto ad altri ad esso subordinati; 3) istituzione di un nesso

di correlazione tra più termini.

I

Il primo livello di intervento ha messo riparo alla indebita fusione tra

lemmi diversi (ma omografi al nominativo), operata dal sistema adottato 3 .

Infatti, avendo assegnato in fase di edizione la desinenza del genitivo al

19

campo « qualificatori » e il nominativo del lemma al campo « descrittori »,

è risultato (in presenza di desinenze diverse per imo stesso « descrittore »)

un output di questo tipo:

anatomicus

-a-um

-i

complexus

-a-um

- us

fundo

-as

-is

liber

-bri

-era-erum

os

oris

ossis

physice

( indecl.)

-es

propago

-as

-inis

singuli

-ae -a

-orum

Come si può vedere, la ripartizione secondo omografia non distinta

avrebbe disposto sotto un’unica entrata entità linguistiche diverse, del

tipo: aggettivo della prima classe e sostantivo da esso derivato; sostantivo

della quarta declinazione e participio passato; verbi appartenenti a coniu-

gazioni diverse; aggettivo della seconda classe a tre uscite e sostantivo della

seconda declinazione in - er ; sostantivi etimologicamente e semanticamente

diversi; avverbio in -e e sostantivo con declinazione alla greca; verbo e so-

stantivo; aggettivo al plurale della prima classe e sostantivo maschile plu-

rale 4 .

Per ottenere la distinzione delle suindicate tipologie di lemmi, il si-

stema informativo richiede l’inserimento di un elemento discriminante a

20

livello di «descrittore» o lemma al nominativo. È stato perciò inserito in

coda al lemma il codice A o il codice B (e se necessario quello C e così

via) in modo da ottenere un output più aderente alla prassi lessicografica tra-

dizionale:

anatomicus [A]

-i

anatomicus [B]

-a -um

complexus [A]

-us

complexus [B]

-a -um

fundo [A]

-as

fundo [B]

-is

e così via

II

Gli altri due livelli di intervento sul lemmario, sempre nell’intento ge-

nerale di costruire connessioni tra i lemmi che lo compongono, si sono av-

valsi di alcune delle facilities fornite da UNIDAS. È da notare tuttavia a

questo proposito che solo alcune delle numerose funzioni di strutturazione

del thesaurus (lemmario) proprie di UNIDAS risultano utilizzabili a

questo specifico scopo. Tra esse infatti, quelle «esplicative» e quelle di

«equivalenza» non si presentano idonee, in quanto instaurano relazioni

tra elementi, uno solo dei quali è un «descrittore», ovvero una chiave di

accesso alla documentazione dei dati. Mentre è evidente che nel caso

delle entrate del lemmario del Lessico filosofico tutti e due gli elementi della

relazione, cioè i lemmi, sono «descrittori», parole chiave che rinviano a

realtà lessicali effettivamente presenti nei documenti-contesto registrati in

memoria nella banca dati. Le «relazioni di affinità» previste dal sistema

sono le uniche a soddisfare alla condizione di collegare due «descrittori»;

sono queste che sono state quindi adottate, anche grazie alla proprietà di

reciprocità di cui godono, in base alla quale il reciproco di ogni relazione

viene generato automaticamente.

Tra le «relazioni di affinità», in particolare, quelle «generiche» e

quelle «associative» hanno inoltre fornito una soluzione, almeno opera-

21

tiva, di due fra i maggiori problemi posti dalla lemmatizzazione: le varianti

grafiche e il rapporto participio-verbo.

Per quanto riguarda le varianti grafiche, dove si situa il secondo livello

di intervento sul lemmario, si è adottata una relazione di tipo gerarchico,

ovvero subordinante, da porre tra le varie grafie; si è infatti ritenuto possi-

bile, anzi necessario, assumere una grafia base come entrata principale nel

lemmario, attribuendo quindi alle varianti il ruolo di entrate di rinvio al

lemma base 5 .

È da notare a questo proposito che la grafia base viene assunta come

entrata principale nel lemmario anche se essa non è mai attestata nel lem-

mario stesso. Questo per due ordini di ragioni. Primo, perché ci si dispone

in questo modo ad accogliere integrazioni e arricchimenti di lemmi, tra i

quali potrebbe comparire la grafia base; secondo, perché quest’ultima costi-

tuisce in ogni caso l’entrata sotto la quale l’utente del Lessico filosofico si

disporrà a ricercare in prima istanza un determinato vocabolo. Nel caso

dunque che la voce del Lessico filosofico venga costruita intorno ad una

entrata che sia una grafia secondaria (in quanto essa è l’unica attestata nei

contesti), la struttura precedentemente elaborata permette di porre una

entrata di rinvio dalla grafia base a quella sotto cui la voce si trova effetti-

vamente nel Lessico.

Poiché la relazione gerarchica pone:

A ha un broader term che è B

il reciproco, automaticamente generato dal sistema, è:

B ha un narrower term che è A.

Per cui si avrà nel lemmario:

humidus BT umidus -a-um -a-um umidus NT humidus -a-um -a-um janua BT ianua -ae -ae ianua NT janua -ae -ae — 22

lubitus BT libitus -US -us libitus NT lubitus -us -us monstrosus BT monstruosus -a-um -a-um monstruosus NT monstrosus -a-um -a-um negligentia BT neglegentia -ae -ae neglegentia NT negligentia -ae -ae poenitentia BT paenitentia -ae -ae paenitentia NT poenitentia -ae -ae sybilla BT sibylla -ae -ae sibylla NT sybilla -ae -ae tenta tio BT temptatio -onis -onis temptatio NT tentatio -onis -onis

Vale a dire: humidus ha un «termine» più comprensivo e sovraordinan-

te in quanto grafia base, che è umidus : mentre umidus ha un «termine»

meno comprensivo e subordinato che è humidus, sua variante grafica. Ana-

logamente per gli altri esempi.

Per cui nel Lessico filosofico (in assenza di attestazioni della grafia base

nei contesti) si avrà:

umidus v. humidus

humidus voce

ianua v. janua

janua voce

e così via.

Nel caso più frequente, invece, in cui ambedue le grafie, quella base e

quella o quelle secondarie, siano presenti nei contesti e quindi anche nel

lemmario, le strutture BT e NT permettono al sistema informativo di segna-

lare la grafia base e di fornire al redattore un tabulato della voce effettiva-

23

mente completo, costituito da tutti i contesti relativi a quel lemma. Questi,

infatti, possono presentarsi disposti sotto entrate anche alfabeticamente

lontane e risultare quindi non facilmente reperibili a una consultazione ma-

nuale del lemmario, sempre passibile di omissioni.

Alla soluzione adottata per le varianti grafiche sono stati assimilati

quei casi in cui si riteneva similmente opportuno scegliere un’entrata unica;

come per i sostantivi a doppio genere (antidotum,-i / antidotus,-i-, commen-

tarius,-ii/ commentarium,-ii) e per quelli a doppia declinazione (prima e

quinta, alla greca, o mista: barbaria,-ae / barbaries ,-ei-, dialectica,-ae / dialecti-

ce,-es; metaphysica,-ae/metaphisice,-es; methodus,-i/methodos,-i·, optica, -

ae / optice, - es). Anche questi termini sono stati collegati tramite BT e NT.

III

Infine, il terzo livello di intervento sul lemmario. Come si è detto, esso

include la lemmatizzazione dei participi presenti e passati, un problema

'angoscioso’ per i lessicografi 6 . Data la natura particolare del Lessico filo-

sofico, le cui voci sono costituite, per la sua sezione latina, da termini scelti

per la loro rappresentatività nella terminologia latina in uso nel dibattito

filosofico europeo dei secoli XVII e XVIII, la soluzione di questo proble-

ma non poteva essere di tipo puramente grammaticale, né basata su una

norma generale. In questa prospettiva, la valutazione della funzione assunta

nei contesti da una data forma viene fatta valere di volta in volta come

discriminante per la determinazione dell’entrata della voce.

Anche in questo caso si è voluto mirare ad una soluzione operativa. Per

i participi si è trattato di ovviare alla dispersione delle forme appartenenti

ad uno stesso verbo o da esso derivate, e quindi di fornire al redattore della

voce una documentazione esaustiva che raccogliesse tutte le attestazioni.

Solo alla luce di una valutazione complessiva è infatti possibile passare al

vaglio le lemmatizzazioni precedenti, realizzate in una fase in cui non era

ancora attuabile un esame riassuntivo dell’estensione della nozione filosofica

sottesa da ciascun lemma. Viene fatta così valere la possibilità di operare ca-

so per caso una scelta corretta, decidendo ora di incentrare la voce intorno al

verbo all’indicativo, con partizioni interne, costituite dal participio pre-

sente, dal participio passato e dal sostantivo neutro deverbale; oppure, al

contrario, optando per l’impostazione di più voci autonome, costituite volta

24

a volta dal participio presente, dal participio passato (i quali spesso assu-

mono funzione di aggettivo e talvolta di sostantivo) e dal sostantivo neutro.

In tale ambito problematico l’applicazione della relazione associativa di

tipo coordinante, related term, è sembrata la più confacente agli scopi

da raggiungere, essendo dotata anch’essa, tra l’altro, della proprietà di reci-

procità che genera automaticamente la relazione inversa 7 .

Così abbiamo nel lemmario:

abstractus RT abstraho

abstraho RT abstractus

E ancora:

causatus RT causor creatus RT creo demonstratus RT demonstro informatus RT informo relatus RT refero significatus RT significo subiectus RT subicio agens RT ago consequens RT consequor integrans RT integro intellegens RT intellego

tutti con le loro reciproche relazioni.

Anche nel caso dell’applicazione del related term, come già per il

broader term, e per le medesime ragioni, il termine correlato che pos-

siede una maggiore comprensività (la grafia base per il BT, il verbo all’in-

dicativo per l’RT) entra a far parte del lemmario anche se non è presente

effettivamente nei contesti.

Oltre che nelle tipologie precedenti, la relazione coordinante RT è

stata ritenuta un efficace sussidio anche nella esplicitazione di altre con-

25

nessioni di tipo coordinante che si riteneva necessario instaurare tra i

lemmi. E particolarmente nel rapporto già accennato tra sostantivo neutro

deverbale e verbo, in quello tra aggettivo e aggettivo sostantivato, tra

lemmi corradicali e tra entrate altrimenti distinte, per le quali si vuole se-

gnalare al redattore un collegamento.

Esempi di queste tipologie sono:

aggregatum,-i RT aggrego beneplacitum,-i RT beneplaceo mixtum, -i RT misceo praedicatum-i RT praedico subiectum,-i RT subicio ablativus,-i RT ablati vus, -a-um bonum,-i RT bonus,-a-um mathematica,-ae RT mathematicus,-a-um sacrum, -i RT sacer,-cra-crum simile, -is RT similis, -e subdi tus, -i RT subdi tus,-a-um alchymia RT chymia alchymista RT chymista diastole RT sistole

Il tabulato che segue, stralciato dalla lettera A, costituisce un esem-

pio del risultato complessivo ottenuto con l’introduzione delle strutture di

relazione fin qui descritte. Si può rilevare che la loro adozione all’interno

di un sistema di documentazione automatica ha generato un risultato dina-

mico, con la produzione di nuove entrate nel lemmario e la formazione di

«grappoli» di related terms, broader terms e narrower terms, assenti dal

lemmario di partenza, non strutturato. Questo ha permesso di ottenere,

sotto forma di tabulati, materiali lessicali fortemente elaborati, in qualità

di strumenti ottimali per la redazione delle voci del Lessico filosofico dei

secoli XVII e XVIII.

1.
M. MORELLI, Dizionario di informatica e degli elaboratori elettronici , Milano 1980.
2.
L’esperienza lavorativa ha dimostrato che l’adozione di un dizionario di riferimento

non risolve tutti i problemi emergenti nei singoli casi. Per un breve excursus sullo stato

della questione e per le relative indicazioni bibliografiche rinvio al mio contributo Alcune

osservazioni sulle tendenze della lemmatizzazione latina. Lessicografia e informatica, in

« Revue », (LASLA, Liège), in corso di stampa.
3.
UNIDAS 1100, di cui è stato utilizzato il livello 6R4 su un calcolatore UNIVAC 1100/82

presso il Centro di Calcolo dell’Università di Roma «La Sapienza». Alle varie fasi del

lavoro sul lemmario latino, filologiche e informatiche, hanno partecipato i colleghi M.

Bianchi, E. Canone, A. Russo, M. Veneziani.
4.
Si utilizza qui la classificazione morfologica tradizionale.
5.
Per l’individuazione della grafia base è stato adottato l’ Oxford Latin Dictionary

(Oxford 1982) che costituisce il punto di arrivo dei più aggiornati studi filologici relativi

al latino classico. Per i problemi posti dalle particolarità del latino secentesco, in special

modo neologismi, ci si è avvalsi degli strumenti attualmente disponibili, dal Blaise,

Dictionnaire latin-français des auteurs chrétiens, Turnhoult 1954, al Latham, Revised

mediaeval latin word-list from british and irish sources, London 1965, ai dizionari naziona-

li di latino medievale facenti capo all’Union Acedémique Internationale.
6.
Cfr. A. DURO, Un angoissant problème de lemmatisation: le traitement du participe,

in Proceedings of the Second International Round Table Conference on Historical Lexi-

cography
, Leyde, Mai, 1977, Cinnaminson, N. J., USA 1980, pp. 117-148.
7.
Per l’applicazione del codice RT è stato adottato come dizionario di riferimento il

Latin dictionary di Lewis and Short. Esso infatti è fra quei dizionari, come il Thesaurus

linguae latinae (non ancora ultimato) e il Forcellini (assai antico), che raggruppa forte-

mente più sottolemmi sotto un’unico lemma di entrata, riducendo così il numero comples-

sivo delle entrate stesse. Le scelte operate in questo ambito dal Lewis and Short, sulla

base delle leggi morfologiche e lessicali della lingua latina, vengono comunque verificate

sul più recente Oxford latin dictionary che, pur adottando per le entrate il criterio opposto

(le formazioni derivate grammaticalmente hanno voci autonome, se sufficientemente les-

sicalizzate), fornisce nell’ incipit di ogni voce indispensabili indicazioni sulle relazioni

grammaticali, morfologiche, etimologiche e semantiche con gli altri lemmi.


Giacinta Spinosa . :

This page is copyrighted

Refbacks

  • There are currently no refbacks.