Supervisor Cognitive Load Theory v1.0.
Volledige webpublicatie van SCLT: een complete uitbreiding van Cognitive Load Theory voor AI-agent supervisie met volledig framework, validatieontwerp, instrumenteisen en strategische uitvoering.
Internal working brief · Geschikt voor adviesrondes · Versie 1.0 (april 2026) · Eindhoven
Executive summary
SCLT stelt dat klassieke CLT het cognitieve werk van AI-supervisie onvoldoende modelleert. Supervisors leren niet primair een domein; ze kalibreren vertrouwen, samplen outputs, integreren heterogene resultaten en nemen interventiebeslissingen onder onzekerheid.
- SCLT behoudt CLT's werkgeheugenbeperkingen en element interactivity als basis.
- SCLT herformuleert klassieke categorieen en voegt supervisor-specifieke loads toe.
- SCLT definieert een factorial validatie-experiment en een uitgebreide NASA-TLX-S.
- Waarde: vooral academische geloofwaardigheid en IP-ankering van de Bandwidth Gap-these.
1. Theoretisch framework
1.1 CLT-basis en transfergrenzen
SCLT neemt de post-2019 CLT-kern over: beperkt werkgeheugen, additieve loaddynamiek en element interactivity. Twee punten transferen niet schoon naar supervisie: schema-acquisitie als hoofddoel en germane load als aparte praktische categorie.
1.2 Variabele-transferkaart
Werkgeheugen en element interactivity transferen direct. Intrinsic en extraneous load worden geherformuleerd als task intrinsic en interface extraneous in supervisiecontext. Germane load wordt vervangen door operationele constructen.
1.3 Nieuwe supervisor-specifieke loadcategorieen
- Trust Calibration Load (TCL): cognitieve kosten van updates in betrouwbaarheid per agent.
- Oversight Load (OL): cognitieve kosten van sampling en evaluatie van outputs.
- Integration Load (IL): cognitieve kosten van het samenvoegen van heterogene outputs.
- Intervention Decision Load (IDL): cognitieve kosten van ingrijpingsbeslissingen.
1.4 Niet-verhoogde extra categorieen
Contextswitching, provenance tracking en authority load worden als componenten/modifiers gemodelleerd binnen TCL, OL, IL en IDL om het model compact te houden.
1.5 Formele relatie
SCLT wordt in de bron geformuleerd als additieve combinatie van klassieke en nieuwe loadtypes onder de begrenzing van werkgeheugencapaciteit.
Bronvorm: SCL(t) = TIL + IEL + TCL(N, sigma_R, nu) + OL(s, c, e) + IL(h, d) + IDL(alpha, k, gamma).
1.6 Unieke voorspellingen
SCLT voorspelt een inverted-U tussen prestatie en aantal agents, foutclustering rond trust-transities en een vaardigheidstraject waarbij calibratievaardigheid stijgt terwijl hands-on domeinvaardigheid kan afnemen.
1.7 Ankermodel
De bron beschrijft een enkel ankerdiagram met begrensd werkgeheugen, zes loadstromen, prestatiecurve en feedbackloops vanuit interventie-uitkomsten en saturatie.
Terug naar boven2. Integratie van precedentliteratuur
De bron positioneert SCLT als complementair aan Multiple Resource Theory, Levels of Automation en Situation Awareness, terwijl het de ontbrekende cognitieve-kostenmechaniek expliciet maakt.
- Neemt delen van supervisory control over, maar voegt meetbare loadmechaniek toe.
- Vult bestaande resource/automation frameworks aan op ander analyseniveau.
- Herkadert in plaats van ontkent moderne CLT-aanpassingen rond germane load.
- Schaalt single-decision human-AI werk op naar portfolio-level agent-supervisie.
3. Validatie-experiment
3.1 Paradigma
Binnenproefpersoon 2x2x2x2 design op reliability variance, vereiste sampling rate, outputheterogeniteit en taakambiguiteit. Deelnemers superviseren vier-agent crews door alle 16 condities.
3.2-3.3 Domein en manipulaties
Document review/synthese is gekozen omdat dit representatief is voor actuele agent-workflows en experimentele controle op heterogeniteit en afhankelijkheid ondersteunt.
3.4 Afhankelijke maten
- Prestatie: expertbeoordeelde kwaliteit, foutprofielen, doorlooptijd.
- Subjectieve load: NASA-TLX-S met 10 subschalen.
- Kalibratie: trust ratings per agent en Brier-scores.
- Gedrag: sampling rate, interventieratio, beslislatentie.
- Optionele fysiologie: HRV en pupillometrie.
3.5 Analyseplan
Mixed-effects modellen met interactietests plus mediatieanalyse waarbij elke manipulatie aan haar beoogde loadconstruct wordt gekoppeld.
3.6 Preregistratie en open science
Hypothesen en analyses worden vooraf geregistreerd; materialen, geanonimiseerde data en code worden na afloop openbaar gemaakt.
Terug naar boven4. Instrumenteisen
4.1 NASA-TLX-S
De bron behoudt de zes TLX-kernsubschalen en voegt vier supervisor-specifieke subschalen toe die direct op TCL, OL, IL en IDL mappen.
- Trust Calibration Demand.
- Oversight Demand.
- Integration Demand.
- Intervention Decision Demand.
4.2 Validatiecyclus
Instrumentdraft, cognitieve interviewpilot, iteratie, hoofdstudie, confirmatory factor analysis en daarna publicatie van v1. Doel-fit in bron: CFI > .95, RMSEA < .06, SRMR < .08.
Terug naar boven5. Deelnemerspopulatie en N
Doelgroep: kenniswerkers met aantoonbaar AI-toolgebruik in technische, analytische en creatieve domeinen.
- Aanbevolen N=80 voor mediatie- en discriminant-validiteitsdoelen.
- In-lab subset n=20 voor fysiologische convergentie.
- Grotere N voor moderatoranalyses wordt naar vervolgstudies verschoven.
6. Publicatiestrategie
De bron werkt met een tweepapierstrategie: eerst theorie, daarna empirische validatie.
- Theoriepaper doel: Educational Psychology Review.
- Empirisch paper doel: Journal of Experimental Psychology: Applied.
- Cross-citation met Bandwidth Gap, supervisor-instrument en babysitting-tax studies.
- Open science: OSF, open instrument, open code/data, PsyArXiv-preprint.
7. Strategische positionering
De bron beschrijft gefaseerde netwerkopbouw richting CLT- en human-factors-gemeenschappen, met extension framing en feedback-first benadering.
- Prioritaire outreach naar actieve CLT-samenwerkingsnetwerken in Nederland.
- Dual-endorser strategie om eenzijdige gatekeeping te beperken.
- PhD-pad als optioneel, pas na traction van het theoretische paper.
8. Tijdlijn en budget
De bron bevat een 24-maandenplanning: frameworkfase, theoriesubmissie, pilot/instrumentiteratie, hoofdexperiment, analyse en empirische submissie.
- Lean: circa €80k-€120k.
- Standard (aanbevolen): circa €180k-€250k.
- Premium: circa €350k-€500k.
Daarnaast bevat de bron WBSO- en Innovation Box-richtlijnen voor NL-substance en IP-documentatie.
Terug naar boven9. Risico's en open vragen
9.1 Theoretische risico's
Mogelijke overlapkritiek met supervisory-control en MRT wordt geadresseerd met mechanistische onderscheidbaarheid en voorspellingsspecificiteit.
9.2 Empirische risico's
Kernrisico's: onvoldoende discriminant validity, kleinere effecten dan verwacht, en overclaim op basis van een enkel experiment. Mitigatie via pilotiteratie en vervolgreeks.
9.3 Strategische risico's
Gatekeeping, endorsement-onzekerheid en credential-risico worden afgevangen via open artifacts en parallelle relatiestrategie.
9.4 Open ontwerpvragen
- Germane load schrappen of herframen als langzame calibratieschema-opbouw.
- Verhouding IDL tot SA level-3 projectieconstructen.
- Single-resource versus multi-resource capaciteitsmodel.
- Beste baseline: solo, single-agent of human-team supervision.
- Operationalisatie van trust-calibration accuracy in ambigue taken.
10. Sequencing en coördinatie
SCLT is geprogrammeerd als Year-2 capstone, gekoppeld aan eerder instrument- en babysitting-tax werk. De bron vereist één gedeelde NASA-TLX-S identiteitslijn over werkstromen heen.
Terug naar boven11. Eindaanbeveling
Voer SCLT uit op standard tier over 24 maanden, dien theorie eerst in, valideer met N=80 en co-ontwikkelde NASA-TLX-S, en dien daarna de empirische paper in. Positioneer SCLT als onderzoeksruggengraat, niet als korte-termijn omzetmotor.
Terug naar bovenSelected references
Kernreferenties in de bron: Sweller (1988), Sweller et al. (1998; 2019), Wickens (2008), Endsley (1995), Parasuraman et al. (2000), Sheridan (1992), Mosier & Skitka (1996), Bansal et al. (2019), Lai et al. (2021), Vereschak et al. (2021), Fritz & MacKinnon (2007).
Volledige reference-uitbreiding blijft onderdeel van de paper-draftset volgens de bron.
Terug naar boven