Translate

domenica 8 luglio 2018

La valutazione nei contesti educativi

La valutazione nei contesti educativi
di Giuseppina D’Auria
    
La valutazione nei contesti educativi consiste nell’ “acquisire informazioni per conoscere”. Per conoscere meglio un fenomeno determinato (conoscenza diretta funzionale alla presa di decisioni che hanno lo scopo di migliorarlo), e, uscendo dal generico, per raccogliere informazioni su un fenomeno possiamo iniziare da quello più noto, di cui ciascuno di noi ha fatto esperienza, cioè l'apprendimento. Si possono raccogliere informazioni su una molteplicità di fenomeni il più noto dei quali è l'apprendimento. Raccogliere maggiori informazioni sull'apprendimento, per esempio un corso, un programma, una scuola, la professionalità di un docente, di conseguenza si possono sottoporre a valutazione un insieme di fenomeni che, nel nostro caso, riguardano il contesto, il mondo dell'educazione. Queste informazioni si possono raccogliere in diversi modi, utilizzando  diversi strumenti, lo scopo è sempre quello di migliorare (se si parla di apprendimento) l'apprendimento,  se si parla dell' efficacia di un programma, si tratta di migliorare l'efficacia di “quel programma”, di professionalità dei docenti, ecc.. questo è un po' il senso della valutazione. Facciamo un piccolo passo indietro: ritengo utile darvi queste informazioni perché si tratta di una sperimentazione didattica e quindi stiamo parlando di qualcosa che ha a che fare con i nostri studi e con la vostra futura professione, cioè quella di sperimentare metodologie nuove.
Possiamo dire che è molto difficile concepire una valutazione senza un obiettivo, senza una precedente esplicitazione e descrizione di uno o più obiettivi quindi, ci occuperemo di descrivere gli obiettivi, le funzioni e gli oggetti della valutazione.  Ma perché valuto anche le funzioni? Per verificare se durante un percorso stai apprendendo come io mi aspetto oppure no. La valutazione intermedia, in itinere, con funzione formativa oppure sommativa. Per raccogliere informazioni ci vogliono strumenti di valutazione e, quindi, le prove valutative, le cosiddette prove strutturate, semistrutturate, ossia di tipo osservativo. Inoltre conoscere e descrivere il concetto di feedback è la funzione formativa della valutazione. Il feedback letteralmente è retroazione; quando io sollecito l'allievo a manifestare una certa abilità, e l'allievo risponde a questa mia sollecitazione, c'è un feedback, una retroazione, io valuto quella prestazione e restituisco allo studente un'informazione. Bene, la tua prestazione è proprio quello che mi aspettavo, oppure, hai manifestato questa prestazione con questo limite, cioè do un'informazione di ritorno allo studente. Anche questo è un feedback. Nella valutazione formativa il feedback è fondamentale; è un modo per descrivere con maggiore precisione, per restituire con maggiore precisione l'osservazione sulla prestazione. Io posso misurare, che non è valutazione, misurazione non è valutazione, non significa la stessa cosa.  È parte della valutazione, posso misurare quella abilità, un apprendimento alla conoscenza. In quale misura la possiedi, al massimo livello, ad un livello medio, ad un livello minimo.. naturalmente io qui ho usato una scala semplificata, basso, medio e alto come livello di possesso della conoscenza. Ma posso arrivare a livelli un po' più articolati di misurazione, conoscere e descrivere alcuni semplici calcoli statistici sui dati valutativi, nel momento in cui io la prestazione che osservo, la misuro e quindi ottengo dei numeri;  con quei numeri ci posso fare dei calcoli semplici: media, moda, mediana, deviazione standard, eccetera. Una delle principali forme di valutazione è la valutazione oggettiva. L'aggettivo oggettiva nasce proprio con la docimologia negli anni Venti e Trenta del secolo scorso, come reazione alle degenerazioni soggettive: la docimologia nasce perché in quegli anni ci si rendeva conto che superare un concorso, prendere la maturità, era un terno al lotto, si poteva capitare con Tizio con Caio con Sempronio: con Tizio si era promossi con Caio si era bocciati. Ogni valutatore applicava i propri criteri e quindi c'era un eccesso di soggettività; l'arbitrarietà del valutatore in forme diverse, più contenute, si possono osservare ancora oggi quando vuoi fare gli esami. Spesso si fanno queste considerazioni: no, Tizio è più generoso di Caio,Tizio è più analitico, pretende di più, pretende di meno.. Prevalgono i criteri della persona, del soggetto che esamina. Siccome negli anni Venti - trenta del secolo scorso c'era posto un problema sociale, cioè prendere la maturità o meno, superare un concorso nella pubblica amministrazione o meno, era diventato un fatto estremamente importante e, di conseguenza, furono avviate delle ricerche che hanno dato origine alla docimologia, che nasceva come reazione alla soggettività definendola valutazione rivista e corretta, metodo oggettivo che, nel nostro Paese, è avvenuto in ritardo  rispetto alla Francia e ai paesi anglosassoni: la valutazione oggettiva ha fatto il suo ingresso ufficiale negli anni Settanta del secolo scorso, con moltissimo ritardo storico culturale e fortissime resistenze all'introduzione di una valutazione di tipo oggettivo, seguito da un movimento di critica alla valutazione oggettiva perché, come spesso accade, ci sono stati degli eccessi. Negli anni 90, soprattutto negli Stati Uniti, il movimento della valutazione autentica, di critica agli eccessi della valutazione tradizionale, che ha fatto il suo ingresso nella scuola italiana nella seconda metà degli anni settanta (per la precisione nel 1977, con l'introduzione della scheda di valutazione alla fine del millennio, con la fondazione dell'invalsi e, quindi, la conseguente diffusione dell'uso delle prove oggettive per le rilevazioni dell'invalsi, si è cominciato a diffondere la pratica della valutazione oggettiva). Le proposte del movimento della valutazione autentica indicano come sbocco professionale la scuola primaria e la scuola dell'infanzia, investite dal sistema nazionale di valutazione delle procedure per l'autovalutazione d'istituto,  quindi c'è un Rav per il sistema scolastico. Il processo di valutazione, definito dal SNV, inizia con l'autovalutazione. Lo strumento che accompagna e documenta questo processo è il Rapporto di autovalutazione (RAV). Viene messo a disposizione un format a livello nazionale, aperto comunque alle integrazioni delle scuole per cogliere la specificità di ogni realtà senza riduzioni o semplificazioni eccessive. Il rapporto fornisce una rappresentazione della scuola attraverso un'analisi del suo funzionamento e costituisce la base per individuare le priorità di sviluppo verso cui orientare il piano di miglioramento. Tutti i RAV vengono pubblicati nell'apposita sezione del portale "Scuola in chiaro" del MIUR. Con le esercitazioni e, soprattutto con il rapporto finale, il Docente aspira a ottenere qualcosa di più delle semplici conoscenze cioè, per esempio, che i discenti non solo conoscano le diverse tipologie di prove, quali sono le regole o i criteri per costruire una prova di valutazione, ma che siano anche in grado di costruirle:  conoscere e costruire, conoscere e produrre, sono verbi che fanno riferimento a due livelli di apprendimento. Perché un conto è sapere e un conto è saper fare. Molti docenti universitari alla fine di tutto il percorso realizzano un seminario dedicato alla certificazione alla valutazione e certificazione delle competenze negli ambienti di apprendimento digitali. La disponibilità di sempre più sofisticate tecnologie dell'informazione e della comunicazione sta creando nuovi ambienti di apprendimento, i portali sono ambienti di apprendimento digitale e, la valutazione, in questi ambienti, affronta questioni specifiche, oltre un laboratorio con obbligo di frequenza, con delle ore di introduzione e di ricapitolazione di alcuni contenuti e altre ore dedicate al lavoro di gruppo, mediante la costruzione di prove valutative. Coloro che, studiando per diventare insegnanti nella scuola dell'infanzia e nella scuola primaria, sanno che la valutazione, in questi 2 gradi dell'istruzione, ha delle specificità, delle peculiarità. Mentre nella scuola primaria l'oggetto principale della valutazione è l'apprendimento degli allievi, nella scuola 06 l'oggetto non è più costituito dagli apprendimenti ma dalla qualità dei servizi: è come dire non mi occupo degli apprendimenti ma mi occupo delle condizioni che consentiranno lo sviluppo degli apprendimenti, per una ragione molto semplice. Nella scuola dell'infanzia le acquisizioni degli apprendimenti non sono il risultato principalmente del contesto scolastico, i bambini a quell'età, apprendono soprattutto per un contesto più ampio, più ricco che parte dalla famiglia, per arrivare alla famiglia più allargata, alla comunità a cui appartengono e, quindi, anche alla scuola dell'infanzia. Mentre nella scuola primaria c'è una organizzazione molto dettagliata per discipline, materie e anni scolastici, nella scuola dell'infanzia non c’è, anche se esiste la sezione dei tre quattro e cinque anni. Sappiamo anche che le Indicazioni nazionali non sono c'entrate sugli apprendimenti e che, da qualche tempo a questa parte, si sta sviluppando un’attenzione anche a questa dimensione. Nel passato, in Italia, soprattutto all'estero, l'attenzione dei valutatori si è concentrata sulle condizioni degli apprendimenti e cioè sui servizi, sulle normative, sulle leggi, sull’ organizzazione degli spazi, sulla preparazione dei docenti, sulle relazioni scuola famiglia, sul progetto pedagogico, più che sull' apprendimento dei singoli bambini. Il tema della valutazione, in questi ultimi anni, è stato piuttosto vivace, caratterizzato da un movimento positivo che ha portato  all’introduzione sistematica e massiccia di pratiche, di procedure valutative, soprattutto di procedure di valutazione esterna, realtà in passato estranea al sistema scolastico italiano. L’Italia è stato uno degli ultimi paesi a dotarsi di un Istituto Nazionale di valutazione e a dotarsi di un sistema nazionale di valutazione; questo ritardo si è accompagnato anche ad una cultura poco pragmatista, più idealistica che positivista. Dov'è il valore del quantitativo, dov'è il valore della misura, dell'accertamento? Avveniva ed è stato sistematicamente posto in secondo piano a causa di una resistenza, anche culturale, alla valutazione esterna, alla misurazione. Infatti nella seconda metà degli anni 70, quando con la legge 517, nel nostro paese è stata introdotta la scheda di valutazione, la programmazione e la valutazione. Alla fine degli anni 90, quando i due istituti di ricerca introdotti dai decreti delegati del 74 ( uno era il Centro europeo dell'educazione con sede a Frascati vicino Roma e l'altro era la Biblioteca di documentazione pedagogica di Firenze), avevano il compito di rappresentare l'Italia nelle ricerche comparative internazionali, ancora non avevano iniziato le loro rilevazioni campionarie, esisteva un campione di circa 300 scuole in Italia che partecipavano con i loro dati favorendo la creazione una competenza disciplinare in campo docimologico. A partire dal 97/99, 2001-2004 date dei provvedimenti dei decreti che hanno l'invalsi, è stato quasi subito scelto l'approccio censuario invece che quello campionario. L'approccio campionario si ha quando una piccola parte di scuole partecipano ad una relazione con i primi tre anni di progetto pilota a partecipazione volontaria. Questo tipo di partecipazione è durata 3 anni dal 2001 al 2003-2004. Quindi bisogna conoscere il processo, il modo migliore per attrezzarsi è quello di conoscere, diventare consapevoli e formarsi una propria idea. Il nostro sistema scolastico dal 97 è basato su un regime di autonomia. Quindi ogni scuola è libera di organizzarsi. Recentemente sono state sviluppate delle pratiche inutili e dannose poichè alcune scuole, alcuni insegnanti, ritengono la prova Invalsi come il giudizio di Dio. In effetti risultati di quella prova dicono quanto io sono bravo oppure i risultati di quella prova possono rivolgersi contro di me (insegnante); quindi che cosa faccio io che sono furbo, preparo i miei studenti sulle prove che si trovano in circolazione, testi, libri, libretti di preparazione, test Invalsi, li somministro una volta, due volte, tre volte, finché non si sono dimenticati, non sono diventati bravi. Così, poi, quando ci sarà la prova Invalsi, tutto andrà per il meglio.  Questa è una procedura pessima perché le prove Invalsi avvengono una volta all’anno e quella valutazione risponde a esigenze di ricerca, valutazione di sistema.  L’insegnante  può scegliere di dedicare molto tempo ad addestrare i bambini a rispondere alle prove, ma è una scelta pessima, che va denunciata pubblicamente, perché significa sottrarre tempo alla didattica vera, ad attività educative e pedagogiche di grande spessore per dedicarla all'addestramento puro e semplice, ai test.
In Italia siamo arrivati ultimi in queste pratiche valutative, stiamo importando cose che all'estero avvenivano 20-30 anni fa quando questa pratica dell'addestramento ai test era già considerata pessima. Teaching to the test, insegnare per i test. Le prove Invalsi avvengono una volta l'anno, da aprile-maggio, rispondono ad esigenze di valutazione standardizzata. Sicuramente l'insegnante deve fare una valutazione che, in alcuni casi, utilizza un repertorio di prove valutative, strutturate e oggettive ma, passare tutto il tempo a proporre ai bambini test perché così diventano bravi a rispondere alla prova Invalsi, non corrisponde ad una responsabilità pedagogica totale e con denuncia una pratica didattica-valutativa non sempre adeguata. Il tema generale della valutazione, della docimologia, rappresenta una rivoluzione di significati e pratiche nei contesti educativi e scolastici. Proporrò alcune definizioni di docimologia, di valutazione e poi descriverò le principali dimensioni di cui si compone il complesso processo della valutazione. Iniziamo dall’etimologia della parola docimologia, composta di due radici greche dokimazo che significa esaminare in logos e la consueta radice che indica un discorso su una riflessione; quindi possiamo dire che la docimologia è il discorso sull' esaminare.
Pieron che è stato uno degli studiosi che ha contribuito ad avviare a diffondere gli studi di tipo docimologico definiva nel 1929 la docimologia come lo studio destinato alla critica e al miglioramento delle votazioni scolastiche. Ricordo brevemente che la docimologia ha origine proprio dagli studi condotti negli anni Venti e trenta del secolo scorso sulla efficacia, sulla validità sull' oggettività degli esami di stato, che concludevano la scuola secondaria superiore in Francia, il cosiddetto baccalaureato che con qualche modifica rimane ancora oggi l'esame conclusivo di quel grado di istruzione. De Landsheere, pedagogista belga, nel 1973 definisce la docimologia la Scienza che ha per oggetto lo studio sistematico degli esami in particolare dei sistemi di valutazione il comportamento degli esaminatori e degli esaminandi. In un periodo successivo abbiamo un estensione dei significati del termine docimologia da parte di De Ketele (1982) per il quale la docimologia è la disciplina che ha per oggetto lo studio dei sistemi di valutazione in educazione. De Landsheere nel 1992 afferma che La docimologia riguarda anche gli insegnanti, gli istituti, il sistema scolastico. Gli oggetti della valutazione e cioè gli insegnanti, gli istituti, il sistema scolastico, negli ultimi decenni del secolo scorso, sono oggetto di un’estensione del campo semantico della docimologia passando, di fatto, dalla docimologia alla valutazione. Oggi il termine più diffuso, più utilizzato sia in sede scientifica sia in campo scolastico è valutazione. Utilizzando una definizione molto generale e reale del prof. Luciano Cecconi, della cattedra di Docimologia dell’Università di Modena e Reggio Emilia, che va oltre i contesti educativi e scolastici, la valutazione è  un processo che ha lo scopo di determinare il valore di una cosa. Pellerey rappresenta la valutazione, sotto il profilo umano, come un fatto simmetrico (A giudica B e Bgiudica A) e riflessivo (A e B giudicano se stessi).  Due concetti chiave sono processo e il valore: è bene sottolineare la centralità del concetto di processo, inteso come una sequenza ordinata di azioni organicamente collegate tra di loro che si sviluppano arrivando al conseguimento di uno scopo. La valutazione va intesa proprio come un processo, non è un singolo atto, un singolo concetto, sono diversi concetti, è una molteplicità di concetti, di azioni collegate tra loro organicamente, collegate tra loro il secondo concetto di valore che qualifica la valutazione (il processo è finalizzato a determinare il valore ad apprezzare un evento, una cosa, un organismo o istituzione, una prestazione ed ha lo scopo di determinare il valore di una cosa).  La valutazione può essere rappresentata come un fatto simmetrico  e riflessivo in cui ogni soggetto valuta contemporaneamente se stesso e l’altro emergendo la complessità del processo. Secondo Tyler, padre del curricolo, La valutazione consiste essenzialmente nella comparazione tra le prestazioni degli allievi e gli obiettivi determinati, prefigurati dai responsabili di un programma di formazione, sviluppata e affermata a partire dagli anni 50 del secolo scorso, concentra la sua attenzione sulla relazione che c'è tra le prestazioni degli allievi, quelle che si osservano (i bambini che erano stati determinati, prefigurati da responsabile un programma di formazione, responsabile curriculum): qui emerge un altro concetto fondamentale nella valutazione, si effettuava una comparazione tra “ciò che osservo” e “ciò che mi aspettavo di osservare” e, cioè, tra le prestazioni degli allievi e gli obiettivi che erano stati predeterminati.
Lipari nel 1995 propone un'altra definizione della valutazione: è un atto che implica nei casi di maggiore complessità raccolta di informazioni analisi e riflessione tendente alla formulazione di giudizi di valore sull'oggetto su una situazione o su un evento. Questa definizione mette in evidenza e fa ricorso a molti concetti che sono fondamentali per comprendere la complessità del processo di valutazione. Per cominciare la valutazione è un sistema di raccolta informazioni e di analisi. Bisogna interpretare i dati raccolti,  riflettere e tendere alla formulazione di giudizi di valore. Quali sono gli oggetti della valutazione, che cos'è che viene sottoposto a valutazione? Un oggetto, una situazione, un evento, la valutazione si può configurare come un'attività cognitiva della nostra mente, rivolta a fornire un giudizio su di un complesso di azioni coordinate, intenzionalmente e destinata a produrre effetti esterni, che si fonda su attività di ricerca nelle scienze sociali e che segue procedure rigorose e codificabili. Palumbo, esperto italiano di valutazione, nel 2001 fa ricorso alle scienze sociali; di fatto la valutazione è un'attività di ricerca, la sua struttura logica è quella di un'attività di ricerca, raccolta sistematica di informazioni, analisi dei dati, interpretazione dei dati e, in conclusione, espressione in giudizi di valore. “La valutazione è la raccolta sistematica di informazioni sulle attività, caratteristiche, e risultati, per formulare giudizi sul programma, migliorarne l’efficacia, e/o indirizzare decisioni sulla futura programmazione”. In questa definizione proposta da Patton nel 1998, uno dei maggiori esperti nel campo della valutazione della Formazione, dei programmi di formazione, dei programmi educativi e, soprattutto, in campo extrascolastico, c'è il riferimento ad altri concetti, che sono utili per migliorare la nostra comprensione del processo di valutazione e formulare giudizi sul programma Eco. Qui diventa esplicito l'oggetto della valutazione, non la singola prestazione dell' allievo o dell'Istituto scolastico, in un programma Nazionale. Voglio ricordare che uno stimolo fortissimo agli studi sulla valutazione è venuto proprio dalla necessità di mettere sotto controllo la realizzazione di programmi statali o, addirittura, di grandi istituzioni come la banca mondiale, si investivano ingenti risorse in azioni educative, programmi educativi di lungo periodo. Quindi avevano la necessità di porre sotto controllo l'uso di queste risorse, soprattutto i risultati; altro aspetto fondamentale è quello del riferimento al miglioramento per formulare giudizi sul programma, migliorarne l'efficacia e indirizzare decisioni sulla futura programmazione, quindi uno scopo è quello di prendere decisioni che indirizzino la futura programmazione (la valutazione che faccio di un programma oggi concluso, può essere utile a migliorare nel futuro; oppure una decisione che prendo oggi di un  programma in via di svolgimento può aiutarmi a migliorare lo stesso programma durante il suo svolgimento).  Abbiamo visto definizioni con accenti diversi che ci hanno aiutato ad avviarci in questo lungo percorso di comprensione di un processo molto complesso, che possiamo intendere anche individuandone gli aspetti essenziali. Se riusciamo a dare una risposta alle domande fondamentali perché valutare? cosa valutare? come valutare? quando valutare? chi esercita l'azione del valutare? possiamo ricostruire un significato complessivo che si approssima al significato vero e complesso del processo di valutazione. Queste domande definiscono le caratteristiche essenziali del processo di valutazione e rientrano nell'ambito educativo formativo scolastico; quindi tutte le risposte ricadono in questo ambito per migliorare i risultati dell'apprendimento,  per  valutare le competenze raggiunte dei miei allievi, per individuare situazioni di insufficienza, delle lacune ,delle criticità e intervenire per colmarle. Posso anche valutare per selezionare gli allievi alla fine di un ciclo, posso fare una selezione per individuare un po' di allievi da destinare ad un'attività e li sottopongo a valutazione di selezione, oppure posso valutare per migliorare la qualità del servizio e mettere in campo azioni di compensazione, di recupero, per superare le criticità. Posso valutare per migliorare le prestazioni del sistema locale o nazionale (pensate alle rilevazioni Invalsi aventi lo scopo di avere informazioni che ci aiutino a valutare l'efficacia e l'efficienza del sistema Nazionale). Qual è l'efficacia della scuola italiana, dei diversi gradi dell'Istruzione in ambito matematico, scientifico, eccetera.. Oppure posso valutare per supportare decisori politici nelle politiche educative, ovvero le indagini internazionali Ora dell'OCSE.. Il ministro responsabile delle politiche scolastiche può utilizzare quei dati per prendere decisioni relative alle politiche educative, può prendere dei provvedimenti e quindi avviare, ad esempio, un piano per l'aggiornamento professionale dei docenti per tentare di innovare la didattica, ecc. Quindi la valutazione serve a supportare la presa di decisione dei politici, migliorare i risultati di apprendimento o selezionare gli allievi a livello di istituto scolastico a livello locale a livello nazionale addirittura a livello internazionale. Passando alla seconda domanda cosa valutiamo che cosa sottoponiamo a valutazione, facendo riferimento alle finalità, posso sottoporre a valutazione l'apprendimento di un allievo, di un gruppo.  L'apprendimento non è l'unico oggetto della valutazione, possiamo sottoporre ad essa l'insegnamento, la preparazione professionale degli insegnanti, la qualità dei programmi del curricolo, i materiali, i testi d'esame,  i metodi adottati, la singola scuola o l’intero sistema locale e nazionale, gli operatori scolastici nella loro molteplicità, sia gli insegnanti che i dirigenti scolastici, il personale amministrativo, ecc. Nel complesso mondo dell'educazione possiamo sottoporre a valutazione ciò che vogliamo, metodi e strumenti sono la risposta al come lo valuto e come valuto, quali metodi quali strumenti uso per valutare. Naturalmente la risposta è particolarmente complessa perché si possono utilizzare metodi e strumenti diversi a seconda degli oggetti della valutazione.  Si sottopongono ad analisi valutativa le prove strutturate e semistrutturate per la valutazione dell'apprendimento,  nelle varie forme di un questionario, di scale di direzione, liste di controllo, degli stessi descrittori e altre forme di rilevazione.  Ribadiamo che la valutazione è una sistematica raccolta di informazioni la cui modalità dipende dal contesto, dalle finalità, dall'oggi, quindi possiamo ricorrere ad un repertorio piuttosto vario di strumenti per la raccolta di queste informazioni. Generalmente si pensa alla valutazione come un atto conclusivo di un ciclo, di un processo, non è così.  Certo, l'esame arriva alla fine dell'anno, l'interrogazione arriva alla fine del quadrimestre, ma non sempre è così. C'è una valutazione che viene proposta e utilizzata all'inizio di un percorso, di un itinerario, di un ciclo. C'è una valutazione intermedia, cioè una valutazione che viene condotta durante lo svolgimento di un percorso, c'è una valutazione finale che viene condotta alla fine di un percorso. Infine c'è la valutazione differita nel tempo e meno nota, ma utilizzata.  Per esempio il consorzio Almalaurea conduce delle indagini per vedere qual è l'effetto dello studio universitario dopo un anno, 2 anni, 3 anni, quindi a distanza di tempo dalla conclusione di un determinato percorso formativo. Si possono fare delle rilevazioni per studiare gli impatti che questa formazione ha avuto non solo sui singoli fruitori ma anche sulla società.  Inoltre una volta definite le finalità, individuati gli oggetti della valutazione, i metodi e gli strumenti e anche i tempi della valutazione, chi sono i soggetti che la gestiscono? Innanzitutto la pensiamo al docente che valuta esami, interrogazioni,  prove, test.  Altri soggetti sono rilevanti all'interno del processo di valutazione: i dirigenti scolastici, per esempio, possono sottoporre a valutazione la prestazione professionale di un docente, di un collegio dei docenti,  addirittura altre figure come gli ispettori, i sistemi di valutazione scolastica in altri paesi. In altre nazioni c'è la figura dell'ispettore scolastico mandato dell'amministrazione centrale ad effettuare delle ispezioni e delle valutazioni.
Qual è il rapporto che esiste tra il processo di valutazione e il processo di formazione, dove e come si colloca all'interno del processo formativo la valutazione.  Definiamo il curricolo, concetto di straordinaria importanza nell'evoluzione delle Scienze dell'Educazione, nell'evoluzione di alcune aree del sapere e della pratica professionale, come per esempio, la progettazione e la valutazione. Il curricolo è un tentativo di rendere comunicabili i principi essenziali e le configurazioni concrete di una proposta educativa in modo da renderla disponibile all'analisi critica.  È impossibile una effettiva traduzione operativa anche se curricolo deriva dal latino curriculum che indica il rotolo, la pergamena,  è cioè qualcosa che ha uno sviluppo, che si svolge.  Ciò che si sviluppa, ciò che si svolge è l'azione dell'insegnamento, la capacità di pianificare,  di progettare e gestire l’azione educativa. Rendere comunicabile e rendere disponibile una proposta educativa all'analisi critica,  è uno dei principi della ricerca della Ricerca Scientifica.  Il disegno della ricerca, un rapporto finale di una ricerca, sono qualcosa che rendono accessibile all'analisi critica la costruzione di in modo tale che possa essere criticata,  fare riferimento al disegno della ricerca,  ma anche perché possa avere un effettiva traduzione operativa. È un piano per la realizzazione di una ricerca, quindi del processo, il curricolo è qualcosa che rende accessibile all'analisi critica un piano, un percorso formativo e la rende anche passibile di una effettiva traduzione. È ciò che rende possibile realizzare una proposta educativa. Possiamo far risalire la definizione di principi fondamentali per il curricolo a un'opera ritenuta fondamentale quella di Ralph Tyler I principi fondamentali per Il curricolo e l'insegnamento dove Tyler costruisce uno schema e individua 4 punti che caratterizzano il curricolo, 4 domande rispondendo alle quali si definisce la struttura di un curricolo. Tyler sviluppò questo schema nel secondo dopoguerra del secolo scorso, nel 1949 pubblicò questo testo mentre era direttore del dipartimento di educazione dell'università di Chicago. Come tutti gli studiosi e gli amministratori ebbe la necessità di gestire complessi processi di formazione e di istruzione. Indicò, all'epoca, le finalità educative che la scuola dovrebbe cercare di raggiungere. Innanzitutto cercò di chiarire ed esplicitare le finalità educative che la scuola dovrebbe raggiungere, quali esperienze educative verosimilmente adatte a raggiungere queste finalità sono disponibili (quindi definire quali esperienze educative e proposte educative, quali ambienti, quali condizioni adatte a raggiungere le finalità definite).  Come possono in concreto essere organizzate quest'esperienze nella operatività quotidiana. Nel nostro discorso sulla valutazione, in quale modo è possibile verificare che queste finalità siano state raggiunte? Alla fine del percorso ho individuato le finalità, ho individuato le esperienze adatte a raggiungere quelle finalità, ho individuato le modalità organizzative per realizzare concretamente le esperienze, alla fine devo predisporre le modalità e gli strumenti per verificare se effettivamente quelle finalità sono state raggiunte. Quindi la valutazione è l'elemento conclusivo di questa sequenza di 4 principi che servono a gestire il curriculum e l'insegnamento, così come sono state individuate da Tyler nel 1949.  In questa sequenza è chiara la connessione tra una fase e l'altra. Tyler con questa sua elaborazione esercita un'influenza straordinaria sulle pratiche, sullo sviluppo di tutto il pensiero, sulla riflessione del curricolo e avvicinò agli studi relativi al curricolo giovani studiosi che poi segneranno ricerca in questo settore. Tra questi cito soltanto due nomi: il primo Benjamin Bloom, il secondo di una studiosa estone che lavorò con Tyler e cioè Tappa che nel 62 mise appunto oltre 500 pagine descrittive di tutti i passi per la progettazione, la realizzazione e la valutazione dei curricoli scolastici.  I 7 punti fondamentali di questa progettazione sono: la diagnosi dei bisogni individuali, sono i bisogni educativi, i bisogni di formazione. Quindi una volta formulati gli obiettivi, si selezionano i contenuti, si organizzano i contenuti, si selezionano le esperienze di apprendimento.  Infine  si individua ciò che si deve valutare, e come e con quali strumenti è possibile farlo. Ci avviciniamo a quella che oggi è percepita come la struttura sequenza logica della progettazione educativa e didattica. Lo schema della valutazione è sempre presente e mostra una natura sequenziale, rappresenta il momento conclusivo, l'elaborazione, il curriculum, lo sviluppo di questo pensiero, di questa riflessione, soprattutto di strumenti operativi e delle pratiche relative al curricolo hanno avuto uno sviluppo anche in Europa. Uno schema dello School Council Working Paper presentato all'interno dell'esperienza del mondo scolastico del Regno Unito degli anni 70 introduce, a proposito di sequenzialità, l’elemento della circolarità, della ricorsività di un processo, che non finisce, che ha una sua continuità.  Il momento in cui si verifica se quegli obiettivi sono stati raggiunti o meno rappresenta un elemento nuovo rispetto agli schemi che abbiamo esaminato finora; l'effetto retroattivo, il cosiddetto feedback è il prodotto della valutazione. L'effetto retroattivo viene utilizzato per predisporre interventi di compensazione, di recupero, per fare in modo che quel 40% di studenti che non hanno raggiunto completamente obiettivo formativo possa colmare le sue lacune. Questa circolarità rende l'idea, valorizza il concetto di effetto retroattivo poichè una volta valutato, si utilizza il risultato della valutazione per riprogrammare, per riprogettare in un processo quasi senza fine. All'inizio la valutazione è stata vista come un elemento di una sequenza, col passare del tempo la valutazione comincia ad interagire anche con gli altri elementi del processo, ad assumere un ruolo sempre più centrale nel più ampio mondo della formazione, quindi in un contesto formativo anche extrascolastico,  la valutazione si colloca e viene analizzata in tutti i suoi effetti, immediati e meno immediati, lungo una dimensione temporale più lunga secondo il modello di Kirkpatrick. Un modello che ha avuto una grande influenza sugli studi e le pratiche successive,  la cui caratteristica è il non si fermarsi al risultato immediato, ma cercare di analizzare, nella complessità, l'articolazione dei risultati. Quindi c'è una prima immediata dimensione della valutazione,  che è quella di accertare, di rilevare informazioni sulle reazioni immediate, soggettive dei partecipanti; un secondo livello è quello dell'apprendimento, cioè questo percorso formativo quali trasformazioni ha prodotto nell’allievo in termini di conoscenze, abilità, capacità, competenze. Un livello successivo è quello del comportamento, dell’apprendimento dell'allievo durante il corso: quindi nuove conoscenze, nuove abilità, in che modo si sono trasferiti i nuovi comportamenti sul lavoro.  Questo modello è stato sviluppato soprattutto nell'ambito della formazione degli adulti e formazione aziendale professionale.  Come si sono trasformati i nuovi comportamenti in contesto operativo reale,  infine, in che modo questi nuovi comportamenti organizzativi sul lavoro in che modo e misura hanno prodotto dei benefici per l'organizzazione, per l'azienda, per la scuola. Secondo Kirkpatrick valutare i risultati di un'azione a diversi livelli è come gettare un sasso in una superficie d'acqua, si sviluppano una serie di cerchi concentrici che via via occupano spazi sempre più grandi man mano che ci si distanzia dal punto di caduta. C'è una reazione immediata che sono degli apprendimenti; essi vengono trasferiti in nuovi comportamenti. I comportamenti visti all'interno di un contesto organizzativo generano nuovo cambiamento organizzativo che comporta una maggiore articolazione.  Caratteristica di questo modello è la circolarità delle fasi e cioè quando si hanno determinati risultati di reazione  essi possono immediatamente condizionare nuovi obiettivi di reazione.  Passiamo alla descrizione delle azioni del processo valutativo, la validità e l'attendibilità delle prove valutative, la classificazione.  Iniziamo dalle azioni del processo valutativo,  ciascuna  più o meno strutturata, più o meno consapevole.  Alcune azioni hanno in comune la descrizione, la comparazione, la misurazione. Soltanto al termine di queste azioni si perviene alla formulazione del giudizio: la valutazione vera e propria.  Che cosa mi aspetto di vedere, di osservare? In base a ciò che io mi aspetto, valuto o sollecito l'allievo a darmi quella prestazione.  Subito dopo l'osservazione faccio riferimento a quello che mi aspettavo e cioè osservo se nel comportamento manifestato ritrovo gli elementi del comportamento che mi aspettavo. Devo avere le idee chiare di ciò che mi aspetto, delle mie attese.  La descrizione del comportamento che mi aspetto di osservare deve essere precisa, misurabile, osservabile, non ambigua proprio per ridurre al minimo le incertezze riguardo alla sua identificazione e interpretazione. La seconda azione è la comparazione cioè confronto le caratteristiche dell'oggetto sotto osservazione che servono all’allievo mentre esegue un determinato compito, risponde ad una determinata sollecitazione. Paragono quello che osservo con quello che mi aspettavo di osservare e quindi faccio riferimento al criterio predefinito, all'obiettivo predefinito, ad uno standard. Quello che osservo coincide, si avvicina, si sovrappone a quello che mi aspettavo di osservare, in che misura coincide con quello che mi aspettavo di osservare. Quindi descrivo e definisco l'obiettivo, ciò che mi aspetto di osservare, ciò che mi aspetto come conseguenza dell'azione educativa, dell'azione formativa quindi comparo la prestazione e l'allievo con quello che avevo definito in precedenza e, quindi, misuro.  La misurazione è riferita al conseguimento completo dell'obiettivo, è un'approssimazione della descrizione del risultato finale. Si procede alla misurazione,  cioè adottando una qualsiasi scala in quale misura  rilevo il conseguito l'obiettivo, secondo una scala ordinale in decimi, facendo riferimento a quelli attualmente in uso per misurare il grado di apprendimento, il grado di conseguimento dell'obiettivo. Non esiste valutazione senza obiettivo, senza uno standard predefinito, un criterio predefinito.  Quali sono gli strumenti possibili che possiamo utilizzare.  Naturalmente variano a seconda delle esigenze valutative, in un contesto educativo scolastico io posso avere la necessità di raccogliere informazioni sulla condizione socio culturale di una classe. Oppure posso raccogliere informazioni sull'andamento di un'azione, di un intervento, di un programma o un progetto.  Ancora posso avere la necessità di raccogliere informazioni sull'efficacia e l'efficienza di un istituto scolastico e allora avrò bisogno di altri strumenti.  Questi elementi più sono definiti e precisati più diminuisce l'influenza della soggettività.  Fortunatamente la soggettività  non potrà mai essere eliminata. Il problema della valutazione oggettiva è quello di contenere il più possibile questa soggettività.  Affrontiamo il concetto di feedback, retroazione,  la sua traduzione nel contesto operativo e la sua rilevanza nel processo di valutazione, nel modello del Mastery Learning e sugli obiettivi. Il concetto di feedback, eco-feedback, letteralmente retroalimentazione a retroazione, designa il processo per cui l'effetto risultante dall'azione di un sistema meccanismo di un circuito, di un organismo, di un programma educativo e di un curricolo, si riflette sul sistema stesso per variarne non correggere opportunamente il funzionamento. È l'effetto risultante da un'azione, il risultato di un'azione e la sua capacità di riflettersi sul sistema stesso. Il docente impegnato nel processo di insegnamento apprendimento, produce un risultato che torna a me, si riflette sul sistema stesso, torna a me, non mi fornisce delle informazioni che io posso utilizzare per correggere opportunamente la mia azione di insegnante. Questa la rappresentazione, il meccanismo di feedback, c'è un azione, delle risorse che vengono messe in gioco per produrre un processo, quello dell'insegnamento, l'insegnamento produce un risultato, questo risultato ha una retroazione. Sul processo, addirittura nella fase di predisposizione delle risorse per attivare l'insegnamento, che è la fase di input, c'è una retroazione, da output del suo feedback, ritorna sul processo. Nel caso dell’insegnamento, le prestazioni dell'insegnante sia nella fase di input c'è l'ingresso delle risorse (per esempio la programmazione didattica), il risultato di una determinata prova di valutazione torna, sia mentre l’insegnante svolge l’azione educativa durante il quadrimestre, sia sulla organizzazione didattica di quel quadrimestre, è possibile cambiare qualcosa durante il quadrimestre sia a livello di input, cioè di progetto, di pianificazione e di programmazione didattica iniziale, di un momento, del luogo dove definisco l'uso delle risorse, sia a livello ulteriore, proprio perché il concetto nasce all'interno della teoria dell'informazione, che poi dato vita ai processi di automazione e allo sviluppo dell'intelligenza artificiale. Ecco il feedback un esempio è quello dei tornelli della metropolitana, noi non possiamo avere accesso alle banchine della metropolitana se non introducendo il biglietto in un dispositivo meccanico, il tornello, con l'obliterazione del biglietto noi inseriamo il biglietto nel lettore quindi abbiamo un processo di lettura e di verifica, se il biglietto è valido, la macchina riceve l'indicazione di liberare il tornello, di aprire il varco, questo è il feedback. Io attivo un processo, ottengo informazione sulla base della quale condiziono il funzionamento successivo. Se introduco un biglietto scaduto, quindi non valido, la retroazione sarà che la macchina riceve l'informazione di non aprire il varco. La stragrande maggioranza dei meccanismi automatici funziona in base al concetto di feedback che, introdotto all'interno delle pratiche educative e didattiche, di conseguenza ha sviluppato il Mastery Learning,  tradotto apprendimento per la padronanza. Secondo questo modello l’insegnante ho propone una unità didattica agli studenti, al termine della quale, presenta un test di valutazione per bonificare il progresso degli studenti (valutazione formativa) che dimostra che la padronanza, rispetto a quel tema, quell'argomento, quella abilità o quella conoscenza, è stata raggiunta. Se l'esito della prova è positivo l’insegnante propone allo studente un attività di arricchimento, di consolidamento, poi passa all'unità successiva. Invece se l'esito della prova di valutazione è negativo,  cioè se lo studente dimostra di non aver raggiunto la padronanza rispetto a quella conoscenza, quella abilità, allora l’insegnante propone delle attività di correzione, compensazione, di tornare con altre esperienze e attività sullo stesso obiettivo affrontato dall'unità,  quindi propone un nuovo test di valutazione che risponde alla stessa domanda,  cioè la padronanza, rispetto a quella conoscenza. In questo modo c'è la possibilità di individualizzare la proposta,  di seguire percorsi differenziati se l'allievo, il gruppo supera la prova di valutazione, si passa all'unità successiva; se la prova non viene superata si propone la differenziazione del percorso, da attività di recupero e di compensazione, che aiuti lo studente a raggiungere la padronanza e, quindi, passare all'unità successiva.  Il feedback è fornito dalla prova di valutazione che, a seconda dell'esito,  segue una strada piuttosto che un’altra. In questo senso si è definito il modello del Mastery Learning che tendeva a superare una vecchia pratica, la valutazione utilizzata soltanto alla fine con funzione sommativa. Se l’insegnante propone una o più prove di valutazione alla fine di un percorso, può prendere atto della situazione senza modificarla, essendo fuori da un percorso, non può fare più niente. In questo caso si ricorre alla funzione formativa della valutazione,  cioè usare la valutazione durante il percorso in modo tale da poter utilizzare le informazioni, che vengono dalla valutazione, per poter intervenire, regolare, correggere e rimodulare il processo, ridefinendo l'obiettivo, scegliendo altri mezzi, altri metodi ma potendo intervenire per migliorare la finalità del Mastery Learning, aumenta la possibilità di coinvolgere il maggior numero di allievi nel raggiungimento degli obiettivi della valutazione con finalità formative. Durante il processo e mettendo in atto interventi di compensazione l’insegnante ha la possibilità di recuperare la percentuale di allievi che non hanno raggiunto la competenza, in tutto o in parte,  quindi diventa fondamentale l'obiettivo, che corrisponde alla prima fase del processo valutativo, cioè la descrizione di ciò che mi aspetto che lo studente sappia o sappia fare.  Quali sono i criteri per la definizione dell’obiettivo? Deve essere descritto in termini di comportamenti osservabili, ciò che deve sapere e saper fare l'allievo in conseguenza dell'azione formativa.  Va descritto in modo tale che poi possa essere osservato e misurato in modo altrettanto preciso. L'obiettivo non deve essere ambiguo ma  occorre descrivere quel comportamento, osservabile sotto specifiche condizioni di prestazione. Allo stesso modo devono essere definiti i criteri in base ai quali valutare il raggiungimento dell'obiettivo,  devono quindi essere esplicitati e la formulazione l'obiettivo, il compito, la condizione in cui deve essere eseguito il compito, è quello standard, cioè il livello di accettabilità, i criteri in base ai quali valutare il raggiungimento dell'obiettivo generale e degli obiettivi specifici,  entrare più nel dettaglio rispetto a quello generale, sarà in grado di individuare i valori al di sopra o al di sotto della media, individuare i periodi con i valori migliori e quindi con i valori peggiori,  stabilire l'andamento della distribuzione. L'espressione generale interpretare una serie di dati statistici nella pratica si articola nel calcolare la media e individuare i valori che stanno al di sopra e al di sotto della media.  Gli obiettivi generali sono utili nella programmazione ma non si possono valutare.  Per stimarli devo formulare la tassonomia degli obiettivi specifici, cioè la gerarchia, dal più semplice al più complesso, dal più facile al più difficile, dal più semplice al più complesso.  Torniamo alla classificazione delle prove di valutazione degli apprendimenti e, in particolare, approfondiremo la conoscenza di una di queste tipologie di prove: le prove strutturate, di cui vedremo vantaggi, limiti e anche pregiudizi. Recuperiamo la classificazione proposta da Vertecchi in base ai due valori che possono assumere, due delle caratteristiche delle prove,  cioè il tipo di stimolo (che può essere aperto o chiuso) e il tipo di risposta (che può essere a sua volta aperta o chiusa).  Rappresentate graficamente sul piano cartesiano le quattro tipologie,  nel dettaglio le prove a stimolo aperto e risposta aperta, quelle cioè nelle quali il valutatore, il docente, propone all'allievo uno stimolo di tipo generale, aperto, un'indicazione di una certa area di problemi, all'interno della quale lo studente deve orientarsi, organizzare una sua risposta, che sarà naturalmente aperta e decidere come organizzare la risposta.  L'altra tipologia è quella in cui lo stimolo della prova è chiuso,  quindi il docente sollecita in modo chiaro e definito lo studente a manifestare un certo tipo di apprendimento,  in cui la risposta che lo studente offre è aperta avendo la libertà di organizzarsi, di affrontare e argomentare un certo tipo di contenuto, individuando alcuni limiti, cioè non lasciando totalmente libero lo studente di affrontare il tema generale declinando in alcuni aspetti specifici delle prove, sia la struttura logica in una prova di valutazione, sia in particolare, le caratteristiche delle prove cosiddette strutturate, cioè le prove a stimolo chiuso e risposta chiusa,  avendo come consegna quella di non divagare liberamente. L'ultima tipologia, quella di prova con stimolo aperto risposta chiusa, è una tipologia teorica, cioè nella realtà pratica, nella didattica educativa di tutti i giorni, è un tipo di interazione, sollecitazione,  risposta tra insegnante-allievo che riguarda la valutazione apprendimenti. Si tratta di una tipologia che è caratterizzata da uno stimolo aperto indirizzato all'allievo ma la risposta non riguarda il possesso di certe conoscenze, abilità ma, più che altro, la tendenza alla compiacenza, più che altro una domanda retorica (Test di profitto).
In Italia l’approvazione dello Schema di Regolamento del Sistema Nazionale di Valutazione, in materia di istruzione e formazione ha sancito la rilevanza del rapporto tra valutazione interna e valutazione esterna, e miglioramento. Nella prospettiva dello Schema di Regolamento del Sistema Nazionale di Valutazione, la valutazione interna e quella esterna seguono un unico quadro di riferimento teorico. L’utilizzo di un corpus di criteri comuni per l'autovalutazione e per la valutazione esterna consente alle scuole di indirizzare le proprie energie verso aspetti che sono ritenuti importanti anche all'esterno, e al sistema di compiere le proprie rilevazioni e analisi in modo più rapido, potendo contare sul percorso già svolto dalla scuola e assumendone gli esiti.
Da un punto di vista normativo la Commissione europea, con la Raccomandazione del Parlamento europeo del 2011 sulla collaborazione europea per la valutazione della qualità dell’insegnamento scolastico, ha proposto alcune linee guida in merito a valutazione e alla autovalutazione e in base a questo raccomanda agli stati membri di promuovere il miglioramento delle qualità dell’insegnamento scolastico sostenendo ed eventualmente istituendo sistemi trasparenti di valutazione della qualità. Questo al fine di incoraggiare l’autovalutazione da parte degli istituti scolastici come metodo per fare delle scuole un luogo di apprendimento e di perfezionamento, associando autovalutazione e valutazione esterna sia di sviluppare la valutazione esterna allo scopo di fornire sostegno metodologico all’autovalutazione e fornire un’analisi esterna della scuola che incentivi un processo costante di miglioramento, non limitandosi solo al controllo amministrativo.
In quest’ambito di studio vi sono Paesi che possono vantare una tradizione di studio e pratiche ben consolidate. Utilizzando una schematizzazione dei modelli valutativi su base funzionale può essere individuato un primo modello avente come finalità la regolazione dei livelli di qualità desiderati con riferimento sia al funzionamento sia ai risultati, come per esempio nel caso di procedure di accreditamento e rendicontazione. In questo caso la valutazione serve per certificare il livello di qualità raggiunto e valutare la posizione della scuola rispetto a standard predefiniti. Un secondo obiettivo è rappresentato dall’accountability ovvero dall’esigenza di rendere trasparenti il funzionamento e la performance della scuola per sottoporle allo scrutinio di autorità centrali  o locali o di stakeholder esterni (genitori ecc) . L’accountability è ricondotta a considerazioni legate al dovere di rendicontazione e trasparenza fondamentali delle società democratiche.  La valutazione delle scuole può agire come meccanismo per promuovere il miglioramento. La restituzione dei risultati alle scuole può rappresentare lo stimolo per azioni correttive , promuovendo forme di apprendimento organizzativo. I modelli valutativi orientati all’accountability e al miglioramento fanno riferimento a logiche valutative diverse, i primi tendono a dare informazioni sull’esito complessivo delle performance di una scuola, assolvendo quindi a una funzione sommativa della valutazione; i secondi possono prendere in considerazione gli esiti dei singoli processi che portano alla realizzazione del risultato e possono assolvere ad una funzione formativa. Il Miglioramento è un filone di ricerca nell’ambito del school improvement, a sua volta collegato ai contributi provenienti dalla letteratura sulle school effectiveness, riguardo lo sviluppo di politiche e di iniziative per migliorare le scuole e la qualità educativa da esse fornito. Il termine miglioramento nella letteratura è comunemente usato in due modi: in senso comune per descrivere gli sforzi compiuti per rendere la scuola un posto migliore per gli studenti, gli insegnanti e l’intera comunità (Reynolds, 1996); in senso tecnico per descrivere i processi che la scuola intraprende in un ottica collaborativa con tutti i soggetti che ne fanno parte per innalzare i livelli di apprendimento degli studenti (Hopkins, Ainscow and West, 1994). Nell’alveo della letteratura sul “school improvement” vengono indagati i processi legati al miglioramento (per es. le condizioni organizzative, le modalità di lavoro didattico, la formazione del personale docente, la responsabilizzazione delle famiglie, ecc.) secondo un approccio bottom-up, che localizza il potere ed il controllo a livello di chi concretamente può agire i cambiamenti. L’obiettivo è quindi il miglioramento sia dei risultati degli studenti sia della capacità della scuola di cambiare. In quest’ottica risulta centrale il coinvolgimento di tutti gli attori dell’istituzione scolastica, compresi gli studenti e i genitori.
Gli studi sul miglioramento ci dicono che vi è un processo ciclico e iterativo tra autovalutazione, valutazione e miglioramento. Per cui ad una fase di implementazione del piano di miglioramento segue una percorso di autovalutazione e/o valutazione che può essere affrontato secondo un approccio multidimensionale. Per cui ad una fase di implementazione del piano di miglioramento segue una percorso di autovalutazione e/o valutazione secondo un approccio multidimensionale, che può essere affrontato secondo tre livelli:
-        In che modo la scuola utilizza un approccio intelligente per massimizzare la propria efficacia complessiva come comunità di apprendimento?
-        In che modo i piani di miglioramento a livello di scuola stanno rafforzando le modalità di gestione e stanno avendo un impatto diretto sulle classi, e soprattutto sui progressi e sui  risultati degli studenti?
-        In che modo i piani di miglioramento si focalizzano sia sui risultati che sulla qualità degli apprendimenti che si svolgono nelle classi?
La letteratura esistente e l’analisi delle esperienze straniere soprattutto in relazione a contesti  con una più forte tradizione in questo ambito (Inghilterra, Olanda, Paesi bassi, Stati Uniti, Svezia, Nuova Zelanda, nell’ultimo periodo in Germania) suggerisce che la valutazione ha impatti differenti. Per esempio uno dei fattori considerati importanti  è chiarezza sui criteri valutativi e gli indicatori che indicano la qualità della scuola, ovvero i criteri valutativi e gli standard che indicano una buona scuola; alcune condizioni sono associate per esempio alla relazione che si instaura fra valutatori e scuole, in quanto questa può incoraggiare le scuole ad avere una visione più aperta sui propri punti di forza e debolezza, e di conseguenza agire poi sulle raccomandazioni ricevute.
L’Ofsted ha dedicato numerosi approfondimenti allo stile comunicativo dei valutatori considerando che come dice Mac Beath i valutatori portano con se un mandato che non deve essere nascosto e che  determina la relazione anche comunicativa fra valutatori e scuola
Il processo valutativo deve coinvolgere tutte le componenti della comunità scolastica, così come i risultati della valutazione esterna dovrebbero essere condivisi con le parti interessate , insegnanti , genitori comunità locale che sono particolarmente sensibili ai risultati e questo porta a fare pressione per il miglioramento.
Allo stesso modo la letteratura evidenzia che la natura del feedback dato alle scuole può influenzare l’implementazione successiva del miglioramento. Il feedback per essere efficace:
-        fa un uso efficace delle informazioni raccolte, così come dei risultati della visita per sostenere la scuola si focalizza su un numero di obiettivi di miglioramento limitati è rilevante, chiaro, utile;
-        stimola la creazione di una comunità di apprendimento all’interno della scuola costruisce ponti con la comunità esterna (per esempio i genitori) sostiene una equipe di gestione che a proprio volta sia in grado di motivare e sostenere il raggiungimento dei risultati nel tempo.
Da un punto di vista normativo la Commissione europea con la Raccomandazione del parlamento europeo sulla collaborazione europea per la valutazione della qualità dell’insegnamento scolastico ha proposto alcune linee guida in merito a valutazione e alla autovalutazione e in base a questo raccomanda agli stati membri di promuovere il miglioramento delle qualità dell’insegnamento scolastico sostenendo ed eventualmente istituendo sistemi trasparenti di valutazione della qualità. Questo al fine di incoraggiare l’autovalutazione da parte degli istituti scolastici come metodo per fare delle scuole un luogo di apprendimento e di perfezionamento, associando autovalutazione e valutazione esterna sia di sviluppare la valutazione esterna allo scopo di fornire sostegno metodologico all’autovalutazione e fornire un’analisi esterna della scuola che incentivi un processo costante di miglioramento, non limitandosi solo al controllo amministrativo.

Bibliografia – Sitografia
Comoglio Mario, Insegnare e valutare competenze, atti del Seminario "Valutare e certificare le competenze" in La valutazione degli apprendimenti (3a ed.), MOOC a cura dell’Università di Modena e Reggio Emilia, responsabile scientifico Prof. Cecconi Luciano,  disponibile su https://learn.eduopen.org/
Poliandri Donatella – INVALSI, VERSO UN SISTEMA NAZIONALE DI VALUTAZIONE: INDICATORI DI RISULTATO E PROCESSI AUTOVALUTATIVI, Ufficio Scolastico Territoriale di Brescia, ANALISI DATI INVALSI E PROCESSI AUTOVALUTATIVI, Brescia, 21 novembre 2014.

METODOLOGIA DELLA RICERCA EDUCATIVA. BREVE STORIA DELLE PROVE STANDARDIZZATE FINO ALL’INVALSI

METODOLOGIA DELLA RICERCA EDUCATIVA.
BREVE STORIA DELLE PROVE STANDARDIZZATE FINO ALL’INVALSI
di Giuseppina D’Auria
gdauria@hotmail.com

Le prove standardizzate, in docimologia, nascono per raccogliere informazioni che possano essere confrontate, dal momento che seguono procedure costruite appositamente per valutare abilità, conoscenze e/o competenze di allievi all’interno di condizioni ben definite e controllate che riguardano costruzione, somministrazione e valutazione. Le prove sono svolte in modo identico per tutti i soggetti (tempi, spazi, modalità). Il rispetto delle procedure permette di avere dei valori e delle valutazioni quanto più comparabili possibile. Nel 1925 era iniziata un’esperienza di cooperazione internazionale da parte di un gruppo di studiosi che aveva dato vita all’International Bureau of Education (IBE), un istituto privato di diritto svizzero con sede a Ginevra. Gli istituti che si andavano progressivamente fondando nelle università europee (Stoccolma, Oslo, Parigi, Milano e Londra) e negli Stati Uniti (Pennsylvania) si ispiravano al modello dell’Istituto di Scienze dell’educazione fondato nel 1912 da Claparède a Ginevra. 
Nel 1929 l’esperienza dell’IBE si era aperta ai governi portandola a divenire – grazie anche ad un numero sempre crescente di Stati aderenti – la prima organizzazione internazionale nel campo della statistica in educazione. Conseguentemente, le prime tabelle comparative tra le nazioni iniziarono a comparire nel rapporto del 1937. 
Le due principali correnti di pensiero che avvertono l’esigenza  di adottare un’impostazione scientifica (…) sono la docimologia e il movimento della “Scuola Attiva”. La prima, sviluppata da Henri Piéron, si propone come la ricerca di un approccio scientifico alla definizione di criteri oggettivi inerenti la valutazione scolastica; la seconda attribuisce grande importanza al processo di scoperta e di costruzione del sapere da parte dell’allievo, e, di conseguenza, anch’essa si interroga su quali siano le basi su cui misurare questo nuovo modo di apprendere. 
Tra gli eventi principali della prima fase del confronto internazionale, vi è, nel 1927, proprio Locarno, il Congresso internazionale della Scuola Attiva che ha come tema il superamento di un sistema di valutazione giudicato arbitrario e si inserisce in un contesto sociale in cui i risultati 
scolastici hanno un’influenza molto maggiore di quella odierna sul futuro di un individuo. 
Le sfide che i sistemi educativi si pongono all’epoca, non sono però legate tanto alla definizione di standard minimi di apprendimento validi per tutti, quanto alla selezione, il più possibile obbiettiva, degli allievi più capaci e meritevoli di proseguire gli studi. 
Negli anni Trenta, dunque, si sviluppano le prime indagini comparate su vasta scala; probabilmente 
l’antesignano di queste ricerche è lo Scottish Mental Survey che, nel 1932, coinvolge 100.000 bambini di11 anni. Dal 1931 al 1938, inoltre, nell’ambito dell’International Examination Inquiry, vi sonoproficui scambi tra il Vecchio e il Nuovo Continente finalizzati a definire criteri validi e comuni di valutazione. 
Alla fine della seconda guerra mondiale l’esperienzadell’IBE confluì nell’United Nations Educational, Scientific and Cultural Organization (UNESCO), che divenne, a tutti gli effetti, uno dei principali referenti a livello mondiale per la statistica in educazione. 
Il secondo dopoguerra vede però, sotto il patrocinio dell’UNESCO, la rinascita e lo sviluppo della pedagogia comparata che, inizialmente, si concretizza con incontri annuali dei direttori dei principali laboratori di ricerca in educazione degli Stati occidentali.. 
Lo sviluppo delle attività in questo settore e l’estensione della collaborazione anche a ricercatori 
provenienti dalla Psicologia che avevano significative esperienze nell’uso dei test di intelligenza, portò nel1958 alla creazione di un network scientifico che aveva l’obiettivo di sviluppare progetti di ricerca internazionale in ambito scolastico: l’International Association for the Evaluation of Educational Achievement (IEA). 
La IEA si mosse anche nella direzione di omologare le tecniche e i metodi di ricerca, sviluppando attività di ricerca su base campionaria con l’obiettivo esplicito di mettere a confronto i diversi sistemi nazionali. Le attività dell’IEA, pur se basate su un principio di collaborazione scientifica, erano comunque condizionate dal clima politico legato alla Guerra Fredda “nella quale i sistemi educativi simbolizzavano le divergenze in politica internazionale”.
Primo studio: Pilot Twelve-Country Study (1960) Studenti 13enni, su cinque aree disciplinari. First International Mathematics Study (FIMS), che inaugura un fecondo filone di indagine sulla Matematica e le Scienze Naturali. Partecipanti: 12 paesi Studenti 13enni e pre-universitari. 
Per un trentennio, fino agli anni Novanta, l’IEA detiene di fatto il monopolio delle indagini internazionali, che crescono lentamente di numero e vedono un sempre maggiore numero di Paesi partecipanti. 
Dalla seconda metà degli anni Novanta, l’OCSE decide di entrare in azione e di coinvolgere maggiormente i governi nazionali nella preparazione di indagini internazionali più funzionali alle esigenze dei sistemi politici. Vede così la luce, nel 2000, la prima inchiesta PISA che assume una rilevanza preponderante rispetto alle iniziative analoghe dell’IEA. 
Le indagini dell’OCSE si caratterizzano per una maggiore regolarità nelle rilevazioni e per i notevoli progressi degli strumenti analitici. Dopo essersi concentrate sulle competenze prettamente scolastiche – ora vieppiù valutate da inchieste nazionali, rese possibili dal trasferimento di know-how – le rilevazioni PISA si stanno aprendo a competenze extracurricolari necessarie ad affrontare le sfide imposte dalle società contemporanee, come, ad esempio, quelle di natura finanziaria o comunicazionale. 
Con l’inizio degli anni Novanta, la qualità dei dati prodotti e le finalità dell’UNESCO furono messe 
in discussione: si iniziarono a proporre diverse entità che svolgevano ricerca in educazione su base quantitativa e fornivano raccomandazioni ai decisori. 
Le principali istituzioni attive in questo ambito erano la Banca Mondiale, l’Organization for Economic Cooperation and Development (OCSE), l’United Nations Children’s Fund (UNICEF), l’Office for Educational Research and Innovation (OEFRI) e l’Unione Europea (UE). 
Nel 2000 con la creazione del Programme for International Students Assessment (PISA), la leadership internazionale passò all’OCSE per ragioni politiche, pragmatiche e operative. 
Le prove INVALSI sono state avviate nell’anno scolastico 2007/08 e da allora si sono effettuate ogni anno coinvolgendo i livelli scolastici 2, 5, 8, 10. Per il livello 13, vale a dire quello che riguarda la maturità della scuola secondaria di secondo grado, si è in attesa di una decisione ministeriale. Un’impostazione quantitativa della valutazione (…) è abbastanza evidente la necessità di questo approccio. Meno automatica invece è stata la scelta del legislatore di non limitarsi al campionamento delle scuole ma di optare per la scelta censuaria,vale a dire di rivolgere le prove a tutte le scuole, costringendole a confrontarsi con risultati di altre scuole del paese. Si è pensato così di avviare la diffusione della cultura della valutazione. 
Questo processo non è stato indolore e, come era prevedibile, si sono registrate molte e infuocate 
polemiche. In Italia c’è una scarsa sensibilità ai dati quantitativi, ma è indubbio che l’accumulo di dati attendibili e sedimentati nel tempo consente di poter disporre di informazioni importanti per prendere decisioni relative al sistema scolastico.
Il fatto che prove di comprensione della lettura e di soluzione di problemi matematici attinenti alla vita quotidiana rappresentino per alcuni studenti difficoltà talvolta insormontabili in certe zone del 
nostro Paese è stato motivo di interventi compensativi così come è avvenuto mediante l’impiego di fondi PON nelle regioni meridionali. 
La resistenza che alcuni docenti oppongono alle prove INVALSI richiede qualche ulteriore riflessione. Queste prove, riferendosi a competenze fondamentali, necessarie per il proseguimento degli studi e/o per una partecipazione attiva alla vita sociale e politica, costituiscono in realtà un diritto di cittadinanza che gli studenti, soprattutto quelli più svantaggiati, devono riuscire ad acquisire.
Sottrarre gli studenti alla verifica di questa acquisizione significa anche nascondere una loro eventuale mancata acquisizione. È stato inoltre richiesto che le votazioni delle prove INVALSI del livello 8, che fanno attualmente media con i voti riportati nell’esame di stato, fossero svolte in un periodo diverso e fossero distinte dalle valutazioni dei docenti di classe pur essendo riportate in un unico certificato finale. 
Questa soluzione, che eviterebbe un terreno di scontro con i docenti che temono un’indebita invasione dell’INVALSI nei giudizi finali, sta percorrendo una via legislativa e dovrebbe arrivare a compimento. In tal modo potrebbe risultare più evidente la funzione di servizio alle scuole che l’Istituto vuole perseguire.
La frase “valutazione della qualità nella scuola dell’infanzia” contiene quattro termini densi di significato. Per comodità di analisi uniremo gli ultimi due (scuola e infanzia) indicando con ciò il 
nome del primo grado del nostro sistema dell’istruzione. Questo, tra l’altro, ci consente di concentrare l’attenzione sugli altri due termini (valutazione e qualità) In fondo, l’espressione “scuola dell’infanzia” presenta, rispetto agli altri due termini, un margine di ambiguità più ristretto (Cecconi L., 2002).
Certo, sappiamo bene che non esiste “una” scuola dell’infanzia ma una molteplicità di “scuole”, che 
differiscono l’una dall’altra per caratteristiche istituzionali (statale, pubblica territoriale, privata religiosa o laica), geografiche, pedagogiche e didattiche. Così come sappiamo bene che la specificazione “dell’infanzia” solo recentemente, e a fatica, ha iniziato a fare la sua comparsa nei testi ufficiali, sostituendo l’aggettivo, “materna”, che indicava (e in molti casi ancora indica) in modo inequivocabile il senso di una scelta e di una pratica sociale e pedagogica. Non ignoriamo, infine, che i recenti provvedimenti legislativi cambiando i riferimenti temporali della scuola dell’infanzia hanno mutato anche alcuni suoi connotati. Ciononostante esistono un’idea e una pratica piuttosto consolidate di ciò che si intende per scuola dell’infanzia mentre non si può dire altrettanto dell’idea e della pratica della valutazione della qualità (Cecconi L., 2002).
Di cosa parliamo? Le prove INVALSI. Dietro agli strumenti di valutazione e di autovalutazione attualmente disponibili esistono infatti, idee, finalità, soggetti e modalità precisi, che possono non essere adeguati al contesto in cui si opera e agli scopi valutativi che si vogliono perseguire. II primaria, Italiano, Prova di lettura (solo classi campione), Matematica.  V primaria, Inglese, Italiano, Matematica e questionario. III sec. primo grado, II sec. secondo grado Prove uguali per tutti servono a capire dove c’è qualcosa da migliorare. 
Costituzione Art. 3: È compito della Repubblica rimuovere gli ostacoli di ordine economico e sociale, che, limitando di fatto la libertà e l’eguaglianza dei cittadini, impediscono il pieno sviluppo della perdona umana e l’effettiva partecipazione di tutti i lavoratori all’organizzazione politica, economica e sociale del Paese. 
Dispersione scolastica. Il 15% degli studenti abbandona prima di aver conseguito il titolo di studio. 
La dispersione riguarda i figli di genitori che hanno al massimo il diploma di terza media in misura quattro volte più alta rispetto ai figli di genitori laureati. 
Appena 30 italiani su 100, fra i 16 e i 65 anni, possiedono livelli sufficienti di literacy e numeracy necessari per interagire in modo efficace in una società e un’economia avanzate. 
Cosa si impara? Conoscenze, Competenze, Sapere, Saper fare. L’INVALSI è nato proprio per misurare gli esiti di apprendimento di alcune competenze chiave, quindi per verificare e stimolare il necessario rinnovamento della scuola italiana. Questa misurazione può essere fatta solo attraverso prove oggettive uguali per tutti. Solo se tutti vengono misurati con lo stesso metro, i dati ottenuti permettono di leggere il fenomeno con la massima risoluzione, sono comparabili nello spazio e nel tempo, e sono veramente utili. Le prove non sono un esercizio di memoria ma di ragionamento. 
Le competenze: “Comprovata capacità di utilizzare conoscenze, abilità e capacità personali, sociali e/o metodologiche, in situazioni di lavoro o di studio e nello sviluppo professionale e personale”. (UE). Non c’è contrapposizione tra conoscenze e competenze. Le prime sono la base delle seconde. 
Le prove misurano alcune competenze essenziali per esempio: capire e utilizzare un testo scritto, utilizzare le conoscenze matematiche per affrontare un problema del mondo reale. Cosa si misura? 
Le prove non misurano tutto. Non servono a valutare né lo studente né l’insegnante e sono uno dei tanti elementi dell’autovalutazione di istituto. Spesso permettono di vedere quello che da soli è più difficile vedere. Le prove INVALSI non misurano tutto.
Alcune competenze importanti non sono valutabili con una prova standardizzata ma solo attraverso il contatto quotidiano che l’insegnante ha con i suoi allievi. Per questo le prove INVALSI non possono valutare globalmente uno studente, né possono monitorarne e guidarne il processo di apprendimento. Inoltre, alle prove standardizzate sfuggono tutte le variabili ambientali. Le prove standardizzate non possono valutare gli insegnanti perché questi oltre alle competenze misurate dalle prove devono insegnare molte altre competenze. È la valutazione degli insegnanti che deve farlo. 
I risultati delle prove indicano il livello di competenza raggiunto ma non possono spiegarne il perché. Solo gli insegnanti possono identificare i fattori che determinano ciascuna situazione d’apprendimento. Per questo le prove non possono dire come insegnare. Questa è una prerogativa degli insegnanti. Possono dire dove concentrare gli sforzi. 
Nel corso del tempo la normativa ha riconosciuto e ampliato la libertà di insegnamento. Maggiore autonomia delle scuole, maggiore libertà di insegnamento. Le prove INVALSI servono alla valutazione esterna la quale è il principale strumento per assicurare il diritto di tutti i ragazzi a ricevere dalla scuola pubblica le stesse possibilità. La valutazione formativa, attuata durante lo sviluppo di un determinato programma, ha lo scopo di produrre un miglioramento ed è condotta, nella maggior parte dei casi, da personale interno al programma oggetto di valutazione (Scriven, 1991). Tuttavia, come lo stesso Scriven precisa, una buona valutazione formativa può essere condotta tanto da personale interno quanto da personale esterno o, ancora meglio, da valutatori interni e da valutatori esterni in modo congiunto. 
La valutazione sommativa è effettuata, dopo la conclusione di un determinato programma, allo scopo di fornire informazioni utili ad un soggetto esterno (per esempio, enti finanziatori, istituti di 
sorveglianza o di valutazione, utenti potenziali) per prendere decisioni riguardanti il futuro del programma o dell’azione (generalizzazione del programma in altri contesti, aumento delle azioni di 
supporto, continuazione del supporto, modifiche del programma, continuazione a determinate condizioni, interruzione del programma). La valutazione sommativa, che non va confusa con la valutazione dei risultati (che può essere formativa e sommativa), può essere condotta tanto da valutatori interni quanto da valutatori esterni o da una combinazione degli uni e degli altri. Tuttavia, 
soprattutto per esigenze di credibilità e per evitare il rischio dell’autoreferenzialità, è bene che sia 
condotta da valutatori esterni.
Le prove: come sono fatte? Ogni domanda è il frutto di due anni di lavoro da parte di un gruppo di insegnanti e dirigenti scolastici con l’aiuto di esperti nazionali e internazionali. Ogni prova viene prima testata su migliaia di ragazzi (ogni anno 30.000) e analizzati statisticamente, per verificare precisione, equità e capacità di misurazione. Le domande non sono dei quiz! La misura è standardizzata. L’abilità di ogni ragazzo è misurata non in base ad una scala assoluta o ad criterio teorico (magari importati da un altro paese) ma rispetto alle abilità effettivamente presenti nella popolazione studentesca reale alla quale il ragazzo appartiene. L’ambiente di provenienza può influenzare i risultati delle prove. Di questo occorre tener conto quando si confrontano classi e scuole diverse. Per questo viene proposto il questionario sulle famiglie. Inoltre, i risultati delle prove vengono ricalcolati tenendo conto del contesto socioeconomico di provenienza. 
Grazie alla disponibilità dei risultati all’ingresso e all’uscita dai cicli scolastici oggi si può valutare meglio l’efficacia educativa delle scuole. Dall’a.s. 2015-16. Contributo dell’istituto scolastico al cambiamento del livello delle competenze dei ragazzi. 
Positivo, leggermente positivo, medio, leggermente negativo, negativo.  Si può confrontare l’effetto-scuola con i risultati delle prove INVALSI. 
Una scuola con esiti insoddisfacenti nelle prove INVALSI può in realtà aver lavorato molto bene, perché ha comunque alzato il livello delle competenze dei suoi ragazzi rispetto ad un livello di ingresso ancora più basso. 
Dal cartaceo al computer - II e V primaria: prova cartacea III sec. primo grado e II sec. secondo grado: prova al computer. Col cartaceo: 2,5 milioni di fascicoli in oltre 46.000 sedi scolastiche (22 TIR). 
-Diversi set di quesiti equivalenti 
-La banca dati e le analisi sui Big Data 
-Probabilità di rispondere correttamente alle altre domande presenti nella banca. 
-Scala di 5 livelli per ciascuna delle abilità misurate. 
La Certificazione individuale delle competenze come riconoscimento dei risultati delle prove. 
Italiano, matematica e inglese. 2018: ultimo anno secondaria inferiore 2019: ultimo anno secondaria superiore. Per gli altri gradi l’INVALSI comunica il numero degli studenti della classe che si è posizionato ad ogni livello. 
Le famiglie vanno informate per tempo per evitare che attribuiscano alle prove e alla certificazione una importanza che non hanno. Una percezione sbagliata potrebbe spingerle a chiedere un’esercitazione eccessiva e sterile su “fac-simile” delle prove INVALSI. 
È naturale che a scopi diversi corrispondano procedure e strumenti diversi. Per questo motivo gli strumenti della valutazione formativa non vanno confusi con quelli della valutazione sommativa. 
Gli strumenti di autovalutazione, per esempio, hanno lo scopo di mettere il soggetto che si auto-valuta nella condizione di individuare i propri punti deboli e di correggerli e/o di individuare le 
proprie potenzialità e di svilupparle. La valutazione formativa è caratterizzata proprio da questo suo 
legame con la dimensione operativa, con le azioni di miglioramento del contesto locale (allievo, aula, scuola), con la presa di consapevolezza da parte degli attori del processo delle dinamiche che 
condizionano l’efficacia e l’efficienza del processo stesso. 

Perché uno strumento di autovalutazione abbia una sua utilità sul piano formativo è indispensabile 
che le domande sul cosa, il perché, il chi e il come trovino una risposta e che tale risposta si dimostri compatibile con il contesto in cui si vuole usare lo strumento. Infatti, quale utilità può avere uno strumento di autovalutazione se l’idea di qualità a cui si ispira non è condivisa dalla comunità educativa della scuola che lo usa o da una parte importante di essa? Se essa non trova un 
pieno riscontro nella realtà sociale, pedagogica e organizzativa della scuola? Perché l’autovalutazione abbia un senso è necessario che questo senso sia costruito e condiviso dagli stessi 
soggetti che praticano l’autovalutazione. In altre parole è necessario che la definizione della qualità 
scaturisca da un processo dialogico, attivato all’interno della singola comunità educativa, che punti 
a definire localmente le ragioni e le caratteristiche della qualità, anche confrontandosi, perché no, 
con un’idea di qualità elaborata all’esterno di quella comunità. Occorre un dialogo all’interno della 
comunità tra i diversi soggetti, i diversi interessi e le diverse sensibilità pedagogiche e didattiche in 
essa presenti, ma occorre un dialogo anche tra le ragioni e i vincoli della qualità definita localmente 
e le ragioni e i vincoli di quella definita globalmente.
“Fiaccole da accendere” anziché “vasi da riempire” (Luciano Cecconi). 


Bibliografia  - Sitografia
Cecconi Luciano, La valutazione della qualità della scuola dell’infanzia. Qualità locale e qualità globale, in L’educatore, Anno XLIX, nn. 22 e 24, 2002.
Scriven Michael, Evaluation Thesaurus, Fourth Edition, Newbury Park, 1991.
Rete per l’infanzia della Commissione Europea, La qualità nei servizi per l’infanzia, Edizioni Junior, Bergamo, 1992.
http://archivio.invalsi.it/ricerche-nazionali/index.htm  

Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione 4.0 Internazionale