Home
Notes
Traductions & Res.
eStudio
Vielbein
Latest notes...
Some notes on Relativity and other arguments
Frame, Informazione e Tipicita nelle categorie semantiche
<p style="text-align: justify;">In questa nota analizziamo l'articolo di Hampton e Gardiner del 1983 "<em>Measure of internal category structure: a correlational analysis of normative data</em>", limitandoci all'esperimento di tipicità sulle categorie semantiche per mostrare come esso possa essere rappresentato tramite frame. Una volta definito il frame potremo calcolare la corrispondente quantità di informazione.</p> <p style="text-align: justify;">I due autori hanno proposto una serie di tre esperimenti per valutare la struttura interna delle categorie, soffermandosi sulle dimensioni di tipicità, familiarità e frequenza associativa che le caratterizzano; noi ci soffermeremo solo sulla prima di esse.</p> <p style="text-align: justify;">Nella seconda metà degli anni 70 e nei primi anni 80 dello scorso secolo la maggior parte delle ricerche sulla memoria semantica è stata indirizzata ad identificare la natura delle categorie di parole ed in particolare come queste si distribuiscono all'interno di una medesima categoria. La tipicità è una dimensione fondamentale e definisce quanto le parole siano tipiche di una certa categoria. La tipicità è una delle dimensioni fondamentali della teoria dei prototipi concettuali.</p> <p style="text-align: justify;">Di solito gli esperimenti per determinare la tipicità di una categoria consistono nel richiedere ad un gruppo di soggetti di indicare su una scala graduata quanto una serie di parole siano tipiche della categoria in esame. Il gruppo di persone che è stato intervistato negli esperimenti di Hampton e Gardiner è costituito da 93 studenti universitari, a cui è stato consegnato un 'booklet' di categorie e relative cue-word (le parole di cui bisogna determinare la tipicità). Le categorie sono in totale 12 - anche se agli studenti ne sono state consegnate solo 6, ognuna delle quali è identificata da una parola (ad es: bird) e da N parole associate (ad es. per la categoria 'bird' vi sono 50 parole, fra cui 'sparrow', 'chicken'...). Ai soggetti è stato richiesto di indicare la tipicità delle singole parole rispetto alla categoria di appartenenza su una scala di 6 valori, dove i valori corrono da 1 - per una parola molto tipica - al valore 5 - per una parola molto atipica (il valore 6 corrisponde ad una parola che non appartiene alla categoria).</p> <p style="text-align: justify;">Cerchiamo ora di rappresentare tale esperimento con i Frame. Come osservato più volte in note precedenti un frame è un insieme attributi-valori, dove i valori a loro volta possono essere costituiti da frame (la struttura è ricorsiva). Nel nostro esperimento dobbiamo costruire un frame per ogni categoria; per comodità ci soffermeremo sulla tipicità della categoria 'bird'. Definiamo il frame 'bird_typicality" come:</p> <p style="text-align: center;">bird_tipicality = {cue-word:[blackbird, sparrow...emu]}</p> <p style="text-align: justify;">dove si ha un solo attributo ('cue-word') i cui valori sono le singole 'cue-word' della categoria di appartenenza. Siccome le cue-word sono equiprobabili è possibile definire un <em>probabilistic ensemble </em>le cui caratteristiche sono {w, {w1 .. wn}, {Pw1 .. Pwn}}, dove w è la variabile casuale, wi è la i-esima cue-word ed infine Pwi è la probabilità della i-esima que-word. Nel nostro caso Pwi = 1/n dove n è il numero di cue-word.</p> <p style="text-align: justify;">Una volta definito l'insieme probabilistico è possibile calcolare la quantità di informazione del frame come:</p> <p style="text-align: center;"><img title="H(W)=\sum _{i}p(w_i)log_2\frac{1}{p(w_i)}" src="https://latex.codecogs.com/gif.latex?H(W)=\sum&space;_{i}p(w_i)log_2\frac{1}{p(w_i)}" /></p> <p style="text-align: justify;">che porta ad una informazione del frame pari a <img title="log_2(n)" src="https://latex.codecogs.com/gif.latex?log_2(n)" />. Questa informazione tiene conto per ora solo del fatto che le cue-word della categoria 'bird' sono equiprobabili.</p> <p style="text-align: justify;">Passiamo dunque a calcolare l'informazione legata alla tipicità per ogni cue-word; questo corrisponde a considerare un sub-concetto per ogni valore del frame appena introdotto. Ad esempio al valore 'sparrow' corrisponderà un sub-concetto di tipicità i cui valori sono i 6 score attribuiti dagli studenti che partecipano all'esperimento. Definiamo dunque il frame:</p> <p style="text-align: center;">cue-word_tipicality = {tipicality:[1,2,3,4,5,6]}</p> <p style="text-align: justify;">dove anche in questo caso si ha un unico attributo i cui valori sono gli score che possono scegliere i partecipanti all'esperimento. E' possibile inoltre definire un probabilistic ensamble in base alle effettive scelte compiute dai soggetti; così ad esempio se consideriamo la tipicità della cue-word 'sparrow' avremo che la probabilità che si scelga score = 1 è molto più alta di quella corrispondente allo score = 6, in quanto 'sparrow' è una parola molto tipica della categoria 'bird'. Avremo dunque un probabilistic ensamble {s, {s1 .. s6}, {Ps1 .. Ps6}} legato agli score che porta ad avere un'informazione pari a:</p> <p style="text-align: center;"><img title="H(S)=\sum _{j}p(s_j)log_2\frac{1}{p(s_j)}" src="https://latex.codecogs.com/gif.latex?H(S)=\sum&space;_{j}p(s_j)log_2\frac{1}{p(s_j)}" /></p> <p style="text-align: justify;">dove il parametro j assume i valori da 1 a 6.</p> <p style="text-align: justify;">Ora è necessario unire le due tipologie di informazione in modo tale che si abbia l'informazione effettiva associata al frame e all'esperimento di conseguenza. Teniamo conto che per ogni cue-word vi è una determinata distribuzione statistica associata agli scores; ad es. se consideriamo la cue-word 'sparrow' (che ha probabilità 1/n di verificarsi) avremo come distribuzione di probabilità degli scores quella legata a 'sparrow' e non quella ad esempio legata a 'emu', che in generale sarà differente. Possiamo quindi definire l'informazione del frame come:</p> <p style="text-align: center;"><img title="H(W,S)=\sum _{w \in {W}}p(w)\cdot H(S_w)" src="https://latex.codecogs.com/gif.latex?H(W,S)=\sum&space;_{w&space;\in&space;{W}}p(w)\cdot&space;H(S_w)" /></p> <p style="text-align: justify;">dove l'informazione associata agli score è pesata dalla probabilità che venga selezionata la relativa cue-word.</p> <p style="text-align: justify;"> </p>