
Gli psicolinguisti dell’HSE Center for Language and Brain hanno scoperto che durante la lettura, le persone non sono solo in grado di prevedere parole specifiche, ma anche le proprietà grammaticali delle parole, che aiutano a leggere più velocemente. I ricercatori hanno anche scoperto che la prevedibilità delle parole e delle caratteristiche grammaticali può essere modellata con successo con l’uso di reti neurali. Lo studio è stato pubblicato sulla rivista PLOS ONE. La capacità di prevedere la parola successiva nel discorso di un’altra persona o nella lettura è stata descritta da molti studi psicologici e neurolinguistici negli ultimi 40 anni. Si presume che questa capacità ci consenta di elaborare le informazioni più velocemente. Alcune recenti pubblicazioni sulla lingua inglese hanno dimostrato che durante la lettura le persone possono non solo prevedere parole specifiche, ma anche le loro proprietà (ad esempio, la parte del discorso o il gruppo semantico). Tale previsione parziale ci aiuta anche a leggere più velocemente. Per accedere alla prevedibilità di una determinata parola in un contesto, i ricercatori di solito utilizzano il cloze task, come “La causa dell’incidente era un telefono cellulare, che ha distratto il ____”. In questa frase sono possibili nomi diversi, ma “guidatore” è il più probabile, che è anche il vero finale della frase. La probabilità della parola guidatore nel contesto viene calcolata come il numero di persone che hanno indovinato correttamente questa parola rispetto al numero totale di persone che hanno completato l’attività. L’altro approccio per prevedere la probabilità delle parole nel contesto è l’uso di modelli linguistici che offrono probabilità delle parole basandosi su un grande corpus di testi. Tuttavia, non esistono praticamente studi che possano confrontare le probabilità ricevute dal task cloze con quelle del modello linguistico. Inoltre, nessuno ha provato a modellare la prevedibilità grammaticale poco studiata delle parole. Gli autori dell’articolo hanno deciso di scoprire se i madrelingua russi avrebbero previsto le proprietà grammaticali delle parole e se le probabilità del modello linguistico potessero diventare una sostituzione affidabile delle probabilità dai task cloze. I ricercatori hanno analizzato le risposte di 605 madrelingua russi nel compito cloze in 144 frasi e hanno scoperto che le persone possono prevedere con precisione la parola specifica in circa il 18% dei casi. La precisione della predizione di parti del discorso e le caratteristiche morfologiche delle parole (sesso, numero e maiuscole / minuscole; tempo, numero, persona e genere dei verbi) variava dal 63% al 78%. Hanno scoperto che il modello di rete neurale, che è stato addestrato sul Russian National Corpus, prevede parole specifiche e proprietà grammaticali con una precisione paragonabile alle risposte delle persone nell’esperimento. Un’osservazione importante è stata che la rete neurale predice le parole a bassa probabilità meglio degli umani e predice le parole ad alta probabilità peggio degli umani. Il secondo passo dello studio è stato quello di determinare in che modo le probabilità sperimentali e basate su corpus influiscono sulla velocità di lettura. Per esaminare questo, i ricercatori hanno analizzato i dati sul movimento degli occhi in 96 persone che stavano leggendo le stesse 144 frasi. I risultati hanno mostrato che in primo luogo, maggiore è la probabilità di indovinare la parte del discorso, il sesso e il numero di nomi, nonché il tempo dei verbi, più velocemente la persona legge le parole con queste caratteristiche. I ricercatori affermano che questo dimostra che per le lingue con una morfologia ricca, come il russo, la previsione è in gran parte correlata all’indovinare le proprietà grammaticali delle parole. In secondo luogo, le probabilità delle caratteristiche grammaticali ottenute dal modello di rete neurale spiegavano la velocità di lettura correttamente quanto le probabilità sperimentali. Ciò significa che per ulteriori studi, saranno in grado di utilizzare le probabilità basate su corpus dal modello linguistico senza condurre nuovi esperimenti basati sul task cloze. Inoltre, le probabilità di parole specifiche ricevute dal modello linguistico spiegavano la velocità di lettura in modo diverso rispetto alle probabilità basate sull’esperimento. Gli autori presumono che un tale risultato possa essere correlato a diverse fonti di probabilità basate su corpus e sperimentali: i metodi basati su corpus sono migliori per le parole a bassa probabilità e quelli sperimentali sono migliori per quelli ad alta probabilità. Due cose sono state importanti di questo lavoro. In primo luogo, hanno scoperto che leggere in madrelingua di lingue con una morfologia ricca coinvolge attivamente la previsione grammaticale. In secondo luogo, i ricercatori, linguisti e psicologi che studiano la predizione hanno avuto l’opportunità di valutare la probabilità delle parole con l’uso del modello linguistico: http://lm.ll-cl.org/. Ciò consentirà loro di semplificare notevolmente il processo di ricerca.
Daniele Corbo
Bibliografia: “Morphosyntactic but not lexical corpus-based probabilities can substitute for cloze probabilities in reading experiments” by Anastasiya Lopukhina et al. PLOS ONE
Immagine: A girl reading (Elena Morozova)
I am always interested in this topic. It’s interesting that I consider myself to be slightly slower in reading than other people and I think I struggle with grammar. Maybe that’s the problem.
"Mi piace""Mi piace"