Il lessico dei giovani attraverso l'osservazione della comunicazione sui servizi chat di Internet: analisi e confronto con altri lessici
Maurizio Amizzoni, Nicola Mastidoro, Patrizia Sposetti
Sintesi della comunicazione presentata in occasione del
IX Convegno Nazionale GISCEL "I bisogni linguistici delle nuove generazioni" Roma, 26-28 marzo 1998
(il presente testo è sintesi di un articolo in corso di pubblicazione)
Obiettivo del lavoro è analizzare il lessico dei giovani attraverso l'analisi di conversazioni chat su Internet. Riteniamo particolarmente interessante la comunicazione in chat su Internet poiché:
- l'età media degli utenti Internet è inferiore a 30 anni, secondo le stime oggi disponibili (vedi per esempio http://stars.euregio.net/joe/zodiac/surveyresults.html);
- il dialogo avviene attraverso la tastiera (scrittura) e il video (lettura) e può essere registrato automaticamente;
- la trasmissione dei messaggi avviene pressoché in tempo reale, e la risposta può essere immediata;
- il dialogo non ha limiti di tempo;
- il numero di interlocutori è virtualmente illimitato;
- generalmente gl'interlocutori non si conoscono;
- si fa uso di pseudonimi e non è possibile individuare l'identità degl'interlocutori se non dichiarata volontariamente (cosa che avviene assai di rado);
- è possibile riprendere una conversazione a distanza di tempo;
- la comunicazione è pubblica: chiunque può inserirsi e intervenire, chiunque può leggere senza intervenire.
Alcuni meccanismi di comunicazione propri della conversazione attraverso la chat avvicinano questa forma di conversazione a quella verbale. In particolare, questo tipo di situazione comunicativa può essere classificata, richiamandosi alla tipologia messa a punto da Miriam Voghera nel Lessico di frequenza dell'italiano parlato (LIP), come "scambio unidirezionale o bidirezionale non faccia a faccia con presa di parola libera". Questo tipo di discorsi si caratterizza per un grado di naturalezza piuttosto elevato. Inoltre, la garanzia di anonimato rende la comunicazione particolarmente spontanea e disinvolta, accrescendo questa caratteristica. D'altra parte la comunicazione in chat implica un uso scritto della lingua. Una delle ipotesi alla base di questo lavoro è che l'analisi lessicale di un corpus di conversazioni attraverso la chat permette di analizzare un uso scritto dell'italiano che ha significativi punti in comune con quello parlato. Per poter verificare quest'ipotesi, nel corso del lavoro la lista di frequenza elaborata viene confrontata con quelle del LIF, del LIP e di "Due parole".
Il campione oggetto dell'analisi è stato costruito registrando le conversazioni in lingua italiana di un insieme di servizi chat. In questo senso, il lavoro si colloca da un punto di vista privilegiato, permettendo di ovviare, in parte, alle difficoltà che presenta la costruzione di un campione di testi parlati.
Per creare il campione abbiamo selezionato i servizi disponibili dove si parla italiano. Le classi di dati registrate sono le seguenti: - data e ora della registrazione; - servizio chat registrato; - testo della conversazione; - indice di traffico.
I dati diversi dal testo della conversazione vengono associati al testo delle conversazione e utilizzati in fase di analisi per verificare eventuali correlazioni tra i giorni della settimana, gli orari, il traffico e i fatti lessicali individuati.
Il materiale è stato acquisito con il seguente metodo: - un computer continuamente collegato a Internet è stato programmato per registrare le conversazioni dei servizi chat selezionati; - periodicamente le registrazioni del computer sono state trasferite su altri computer e preelaborate in modo da associare ai testi le informazioni extratestuali; - l'insieme delle registrazioni preelaborate è stato unito in un unico file e analizzato.
Nel lavoro vengono esposti i risultati dell'analisi lessicale di un corpus significativo di conversazioni, oltre le 650.000 occorrenze. I risultati dell'analisi vengono proposti sotto forma di liste di frequenza, analisi dei segmenti ripetuti, analisi delle polirematiche, concordanze, confronto con le liste citate. Obiettivo finale è giungere alla definizione di un lessico di tale forma di comunicazione e di indicarne gli aspetti caratterizzanti.
Bibliografia essenziale
Maurizio Amizzoni, Nicola Mastidoro, ""Linguistica applicata alla leggibilità: considerazioni teoriche e applicazioni, in 'Bollettino della Società Filosofica Italiana' n. 149 (maggio - agosto 1993), pp. 49 - 63;
Umberta Bortolini, G Tagliavini, Antonio Zampolli, "Lessico italiano di frequenza", Garzanti, Milano 1972;
Tullio De Mauro, "Guida all'uso delle parole", Etas Libri, Milano 1993;
Tullio De Mauro, Federico Mancini, Massimo Vedovelli, Miriam Voghera, "Lessico di frequenza dell'italiano parlato", Etas Libri, Milano 1993;
Nicola Mastidoro, "EuloTech: sistema lessicale integrato di analisi linguistica", in 'JADT 1995 - III Giornate internazionali di analisi statistica dei dati testuali', atti, Roma 1995, pp. 211;
Nicola Mastidoro, "EuloTech: sistema lessicale integrato per l'analisi linguistica e il miglioramento della leggibilità", in 'MC-Microcomputer' n. 142 (luglio-agosto 1994) pp. 378 - 383; n. 143 (settembre 1994) pp. 394 - 398;
Nicola Mastidoro, "The project EuloTech: an interactive machine dictionary and lemmatizator for terminological data extracting, managing and retrieving", in: atti del 'Workshop on Terminology, information retrieval and linguistics', Roma, 1995, p. 113;
Nicola Mastidoro, "Il Sistema EuloTech per la valutazione automatica della leggibilità", in: Pietro Lucisano, 'Misurare le parole', Kepos Edizioni, Roma 1992, pp. 125 - 140;
Nicola Mastidoro, "Spoglio elettronico del lessico delle prime cinque annate di "Due parole"", in: Maria Emanuela Piemontese 'Capire e farsi capire. Teorie e tecniche della scrittura controllata', citato in bibliografia;
Maria Emanuela Piemontese, "Capire e farsi capire. Teorie e tecniche della scrittura controllata", Tecnodid, Napoli, 1996, pp. 273-391.
|