24.07.2023 Elio Grande

Tra game e game. Vita sotterranea degli alberi decisionali

Un'idea segue talora sentieri imprevisti. S'insinua sotterra, mette radici, attraversa il tempo e alfine germoglia, infestante come il nasturzio o longeva quanto la sequoia.

Come quando Platone lasciò cadere tra le righe del suo Sofista (218c-221b) il seme di uno strano arbusto, subito abbarbicatosi al testo e cresciuto su per un nodoso ramoscello. Sapendo difficile acchiappare la fuggevole figura del sofista, lo Straniero di Elea fedelmente assistito da Teeteto decise infatti di esercitarsi alla futura tenzone provando a definire, «come modello di ciò che è più importante», il concetto dell’arte di pescare con la lenza mediante suddivisioni in serie: dalla cesura tra tecniche acquisitive e produttive giù fino alla pesca con la fiocina o con l’amo. Senza saperlo stava inizializzando il training, su un dato appositamente semplificato, del primo decision tree di sempre: la dialettica, il metodo diairetico. In fase successiva di test, invero, le prestazioni del modello lasciarono un po’ a desiderare. Il furbo oratore non si lasciava avvinghiare tra le pur strette maglie logiche. Un informatico, d’altra parte, suggerirebbe forse oggigiorno che l’ingenua sobrietà di un pescatore è talmente lontana dai cavilli sofistici da far peccare l’albero di overfitting, cioè un’eccessiva congruenza coi dati di apprendimento e la conseguente incongruenza coi nuovi dati di verifica.


Nondimeno, in ambito di Intelligenza Artificiale un albero decisionale è uno dei più efficaci algoritmi di machine learning. Ha potere di generalizzazione induttiva e, preso un record di dati dove ogni istanza è una collezione di attributi, impara rapidamente a indovinare il valore di variabili nascoste (come l’età di una persona), letteralmente squadrando una mappa di variabili note (quali altezza, peso e genere). Il più noto algoritmo, quello di Hunt, somiglia a un albero a testa in giù che, interrogando ripetutamente i dati sotto condizioni diverse (operazione detta splitting), cresce dalla radice diramandosi nodo dopo nodo fino a fermarsi (stopping) quando raggiunge una foglia, ossia un nodo che racchiude (quasi) esclusivamente elementi di una stessa classe – ad esempio, solo individui tra quaranta e cinquant’anni. Se il Sofista però argomentava per concetti e significati, un computer lavora per forza di cose su estensioni numerabili, insiemi di oggetti. Un albero decisionale efficiente è infatti un abito cucito sul target e la bravura del sarto si misura in purezza ed omogeneità: maggiore è la discrepanza tra risultati presso un nodo-foglia, maggiore sarà l’entropia incrociata sulle probabilità distribuite in output.

Una mutazione è dunque avvenuta lungo venticinque secoli di vita sotterranea: il dominio. Ma in fondo, nihil sub sole novum. Integrati tra gli ingranaggi della mente o impigliati tra foglie artificiali, abbiamo saltato a piè pari lo scarto di spontaneità creativa, indossando ancora – parafrasando un verso – i panni di un alieno che non vola. Un “mondo dietro il mondo”, il realissimo Iperuranio, occorreva a Platone – non conoscendo il numero di pescatori con la lenza di ieri e di oggi – per ancorare le partizioni binarie alla ferrea necessità logica. Un universo conforme per tipologia e distribuzione ai training sets, perfino omologando ogni sfumatura del nostro agire, è richiesto invece dagli alberi artificiali per incrementare la performance in the wild – per esempio, per ottenere pubblicità mirata su una piattaforma web. I decision trees dell’Intelligenza Artificiale ricrescono e ci tirano per la giacchetta in un game, proprio come i loro antenati. Un fatto ci consola: tra game e game, si sa, la contesa lascia sempre un lembo scoperto. Il lenzuolo, quello di Procuste, per fortuna non è mai abbastanza lungo.

 

Credits Copertina: Midjourney Bot