Què vol dir que la IA et prepara exàmens segons els teus criteris
De l’examen genèric a l’examen alineat
Un examen és útil quan mesura exactament allò que vols que l’alumnat demostri. La novetat és que una IA generativa pot crear proves ajustades al teu currículum, al teu estil i als nivells d’exigència que triïs. No parla d’“exàmens en abstracte”, sinó d’exàmens alineats amb els teus objectius, la teva rúbrica i la teva manera de donar feedback.
Això implica definir amb claredat què avalua (continguts i competències), com ho avalua (tipus d’ítems, temps, criteris), i a quin nivell (recordar, aplicar, raonar, crear). La IA no substitueix el criteri docent: l’accelera i l’ordena.
Tipus de criteris que pots configurar
Pots establir criteris per a diferents dimensions. Alguns dels més útils són: els continguts prioritaris, el pes competencial, la dificultat desitjada, els tipus de preguntes i el format de resposta. També hi pots afegir condicionants d’equitat i accessibilitat, com llenguatge planer, contextos no estereotipats i temps recomanat per ítem.
L’objectiu és evitar la improvisació. Quan la IA sap què vols, pot generar un primer esborrany d’examen amb coherència interna i distribució equilibrada de continguts i nivells cognitius.
Disseny previ: del pla d’avaluació al blueprint de l’examen
Objectius i evidències
Comença revisant la programació. Selecciona els resultats d’aprenentatge i defineix les evidències observables que esperes: explicar, resoldre, analitzar, argumentar, crear. A partir d’aquí, decideix quines preguntes recolliran millor aquestes evidències i quins pesos tindrà cada part.
Taula d’especificacions
El blueprint és la teva guia. Relaciona continguts, competències i nivells cognitius amb el nombre d’ítems i el pes de cada bloc. Això garanteix validezza de contingut i equilibri. La IA pot generar l’examen seguint aquesta taula com si fos una ordre de treball.
- Defineix els blocs: temes, competències i nivells cognitius.
- Estableix pesos i nombre d’ítems per bloc.
- Indica formats: resposta múltiple, resposta curta, problema, anàlisi de cas, redacció.
- Fixa criteris d’accessibilitat: llenguatge clar, longitud de textos, temps estimat per ítem.
- Afegeix limitacions: sense contextos estereotipats, sense dades inventades, justificació breu de la resposta correcta.
Banc d’ítems i variació
Un bon examen neix d’un banc d’ítems divers. La IA pot proposar sèries equivalents d’una mateixa competència amb gradació de dificultat i varietat de contextos. Guarda els ítems validats, marca’n el nivell i revisa’n el comportament a classe per afinar les versions futures.
Com demanar-ho a la IA: pautes i paràmetres que funcionen
Especificar el que importa
El més important és donar instruccions concretes. Si el que busques és aplicació i raonament, indica-ho. Si vols textos breus i no ambigus, també. Un bon encàrrec pot incloure informació curricular, restriccions de llengua i registre, i consignes per avaluar.
- Nivell educatiu i context d’aula: grup heterogeni, necessitats específiques, temps total.
- Objectius i resultats: què s’ha d’evidenciar i a quin nivell cognitiu.
- Blueprint resumit: pesos, nombre de preguntes, formats i longituds desitjades.
- Criteris d’equitat i accessibilitat: llenguatge planer, exemples no estereotipats, alternatives text a imatges.
- Qualitat d’ítems: una sola resposta correcta, distractors plausibles, justificació del corrector.
Tipus d’ítems i control de dificultat
Demana varietat: selecció múltiple amb distractors potents, resposta curta amb límit de paraules, problemes numèrics amb passos intermedis, casos per analitzar i preguntes obertes amb rúbrica. Per escalar la dificultat, indica percentatges aproximats de nivell baix, mitjà i alt i sol·licita la justificació de la dificultat de cada ítem.
Consignes clares per a l’alumnat
Pots fer que la IA redacti consignes coherents, amb verbs d’acció clars i indicacions de temps i puntuació. Revisa que no hi hagi ambigüitats i que cada tasca es pugui resoldre amb la informació disponible, sense sorpreses.
Qualitat, ètica i seguretat: criteris per a exàmens fiables
Validesa i fiabilitat
Un examen és bo si mesura allò que pretén. Revisa que cada ítem estigui alineat amb el resultat d’aprenentatge i que el conjunt tingui coherència interna. Evita ítems trivials o massa similars. Demana a la IA una taula de rastreig que indiqui què mesura cada pregunta i amb quin pes.
La fiabilitat es reforça amb ítems clars, criteris de correcció previs i una distribució equilibrada de dificultats. Si és possible, prova la bateria amb un grup pilot o en format formatiu, i ajusta les parts que generin confusió o temps excessiu.
Equitat i accessibilitat
Garanteix que les preguntes no penalitzin col·lectius per factors no acadèmics. Evita contextos que reforcin estereotips o que requereixin coneixements culturals aliens a l’objectiu. Demana versions amb lectura fàcil, glossaris breus o alternatives visuals i text per a tasques que ho requereixin.
Si generes materials multimodals, sol·licita la descripció textual de gràfics i imatges. Revisa longituds de textos i temps estimats. Ofereix adaptacions raonables per a l’alumnat que ho necessiti.
Privacitat i integritat
No introdueixis dades personals de l’alumnat. Emprar la IA per generar exàmens requereix prudència: conserva el control sobre els ítems, evita difusions innecessàries i genera variacions per minimitzar còpies. Recorda que la revisió humana és indispensable abans d’administrar la prova.
Correcció, feedback i ús a l’aula
Rúbriques i criteris de puntuació
Per a preguntes obertes, demana a la IA una rúbrica clara amb descriptors de qualitat i exemples de respostes. Simplifica la rúbrica a pocs nivells i punts clau. Indica pesos per criteri i preveu espais per a comentaris personalitzats. Per a proves objectives, sol·licita el full de solucions i la justificació de cada resposta correcta.
Automatització de la correcció
La IA pot ajudar a una primera correcció, especialment en respostes curtes i en rúbriques tancades. Estableix marges de tolerància i exemples d’acceptació de sinònims o errors no significatius. Mantén una validació docent final en respostes obertes per garantir la justícia i el context.
Informes i decisions pedagògiques
Un examen serveix per aprendre a ensenyar millor. Demana a la IA un informe amb anàlisi per competències, ítems amb més errors, temps estimat i orientacions de millora. Utilitza aquests resultats per reenganxar l’alumnat amb activitats de reforç o d’ampliació, i per ajustar la teva programació.
- Estableix una rutina: blueprint, generació, revisió, pilotatge, administració, anàlisi.
- Entrega feedback orientat a accions: què mantenir, què millorar i com fer-ho.
- Reutilitza i millora el banc d’ítems: etiqueta dificultat, competència i rendiment.
- Preveu variacions equivalents per a reavaluació i pràctica dirigida.
- Combina moments formatius amb sumatius per afavorir aprenentatges sostinguts.
Exemples d’ús a l’aula
En Matemàtiques, pots fixar un 50% d’ítems d’aplicació i un 30% de raonament amb problemes contextualitzats i dades realistes. En Ciències, demana casos d’indagació amb gràfics a interpretar i justificació del procediment. En Llengua, combina comprensió, gramàtica en context i una redacció curta amb rúbrica de coherència, lèxic i correcció.
En tutories, utilitza proves diagnòstiques breus per detectar necessitats i ajustar ajudes. En projectes, crea proves de transferència on l’alumnat hagi d’aplicar coneixements a situacions noves, amb criteris de creativitat i rigor ben definits.
Guia ràpida per passar de la teoria a la pràctica
Passos operatius
Primera setmana, defineix el blueprint i crea un banc inicial d’ítems amb tres nivells de dificultat. Segona setmana, demana a la IA un esborrany d’examen alineat amb el blueprint i edita’l amb el teu criteri. Tercera setmana, prova alguns ítems en activitats formatives i recull dades de temps i dificultat percebuda. Quarta setmana, administra l’examen, corregeix amb rúbrica i genera un informe d’aprenentatge.
Consells de manteniment
Revisa periòdicament la qualitat dels ítems. Elimina els que generen confusió o tenen redactats ambigus i reforça els que discriminen bé entre nivells. Mantén el banc versionat i etiquetat per unitat, competència i nivell. Programa sessions de coavaluació docent per compartir bones pràctiques i blindar criteris comuns.
Mirada pedagògica
Quan definim criteris clars i fem servir la IA per aterrar-los en exàmens coherents, l’avaluació es torna previsible i justa. L’alumnat sap què s’espera, tu tens evidències més netes, i el temps de correcció disminueix. La tecnologia suma quan organitza el que ja sabem fer bé: planificar, calibrar i acompanyar.
Comença amb un blueprint senzill, genera tres versions d’un mateix examen i tria la millor després de provar-ne fragments a classe. Poques passes, impacte immediat i més espai per allò que cap IA pot fer per nosaltres: mirar l’alumnat als ulls i ajudar-lo a avançar.