Historische inleiding: statistiek, van Woorden naar Waarden (Ida Stamhuis)

1 februari 2010

Statistiek, een vak van woorden

Dat de statistiek een wetenschap was, waarin woorden het centrale bestanddeel vormen, dat kunnen wij ons nu nauwelijks voorstellen. Toch is het zo geweest; in Nederland nog aan het begin van de vorige eeuw. Dat blijkt onder meer uit de titel van een uit het Duits vertaald boek, dat verscheen in 1807 en ging over een nieuw vakgebied. De titel was Theorie der Statistiek of Staats-kunde. Statistiek was toen blijkbaar identiek aan staatskunde. Het was een vakgebied dat gewijd was aan kennis over een staat. En het betrof hier kennis in een brede zin. Deze kennis was hoofdzakelijk kwalitatief en bestond dus uit woorden. Slechts een klein gedeellte was kwantitatief en betrof waarden.

Het vakgebied waar we het nu over hebben was in Duitsland al in de zeventiende eeuw aan de universiteiten ontstaan en in de achttiende eeuw was er de naam statistiek aan verbonden. Duitsland was in die tijd nog geen staatkundige eenheid; het vormde een lappendeken van staten en staatjes. Er ontstond een behoefte om de informatie over zo’n staat op een systematische manier te rangschikken, zodat ook een vergelijking van staten mogelijk werd. De 18e-eeuwse Göttingse hoogleraar Gottfried Achenwall werd later wel de ‘vader van de statistiek’ genoemd. Deze Achenwall behandelde van elke staat onder meer de geschiedenis, het klimaat, de bevolking, de wetgeving, de stand van de wetenschap, de industrie, de handel en de militaire macht. Het ging er volgens hem om hoe gelukking of ongelukkig een staat was. Alle factoren die daaraan bijdroegen of eraan afbreuk deden, moesten op systematische wijze worden besproken. Ook de liefde en de haat die de onderdanen voor hun regering voelden, behoorden daartoe. Het succes van dit nieuwe vak hing samen met het ontstaan van een moderner staatsbestuur, waaronder een groei van de bureaucratie en een formalisering van het bestuur. De behoefte groeide aan een opleiding, waarin toekomstige politici en ambtenaren relevante kennis kregen onderwezen. Daaraan moest de statistiek een bijdrage leveren. Mogelijk werd het nieuwe vakgebied ‘statistiek’ genoemd, omdat er in de zeventiende eeuw in Italië een traditie had bestaan, genaamd ‘Ragione di Stato’, ofwel ‘het vakgebied van de staat’. Een man die zich met staatszaken bezighield heette een ‘statera’. Het kan ook zijn dat het woord is afgeleid van het Latijnse woord ‘status’, dat toestand betekent, maar ook staat kan aanduiden.

Onderwijs in de statistiek, een nieuw initiatief

Deze Duitse statistiek kreeg ook in Nederland haar aanhangers en beoefenaren. Bijvoorbeeld ging Adriaan Kluit (1735-1807), hoogleraar te Leiden in de oudheidkunde en de geschiedenis, in 1802 op eigen initiatief statistiekcolleges geven. Waarom? Aan de oudheidkunde en de geschiedenis zou hij toch wel zijn handen vol hebben en was statistiek niet iets heel anders? Het antwoord is tweeërlei. Hij had niet veel te doen, want hij was uit zijn ambt ontzet, aangezien hij een aanhanger van Oranje was en in 1795 deze groep de macht aan de patriotten had moeten overdragen. Kluit gebruikte de vrijgekomen tijd om zich in de statistiek te verdiepen. Hij had voor deze vernieuwende aktiviteit ook een inhoudelijk argument. Hij was van mening dat statistiek en geschiedenis veel met elkaar te maken hadden: statistiek noemde hij ook wel ‘stilstaande geschiedenis’ en geschiedenis ‘doorgaande statistiek’. Hij noemde het nieuwe vak trouwens zowel statistiek als staathuishoudkunde. Staathuishoudkunde is een ander woord voor economie. Betekent dit dan dat Kluits statistiek later economie is gaan heten? Nee, dat kan je zo niet zeggen: de statistiek van rond 1800 is een voorloper van de latere statistiek, maar ook van economie en van sociologie. De breedheid van het vak kan afgelezen worden aan de vele namen, die het aanvankelijk had: statistiek, stilstaande geschiedenis, staatskunde en staathuishoudkunde.

Die breedheid weerspiegelt zich ook in de opvattingen van Kluit over de inhoud. Volgens de Leidse hoogleraar bevatte de statistiek de kennis die nodig zou zijn om de “waare kragten”, ofwel de macht en de welvaart van een land, te leren kennen. Daartoe moest men de inwendige staatsgesteldheid of het huishoudelijke van een staat bestuderen. Kende men deze dan had men een indruk waartoe een bepaald volk in staat was, zowel op zichzelf als in vergelijking met buitenlandse mogendheden. De mogelijke vergelijking met andere landen speelde een belangrijke rol.

Kluit onderscheidde twee aspecten aan de huishouding van een staat, namelijk het ‘natuurlijke’ en het ‘zedelijke’. Onder de natuurlijke gesteldheid van een land verstond hij ongeveer hetzelfde als wij: haar ligging, grenzen en naburen, grootte en klimaat. Voorts vroeg hij zich af welke nuttige gevolgen de natuurlijke gesteldheid had. Het ‘zedelijke’ was voor hem een veel ruimer begrip dan voor ons: hij behandelde bij dat aspect allereerst de bewoners van het land, onder andere in staatkundig opzicht, maar ook hun aantal en hun karakter. Ook hun middelen van bestaan en hun welstand rekende hij tot het ‘zedelijke’. Deze konden worden behandeld aan de hand van een bespreking van visserij, akkerbouw, veeteelt, handwerk, koophandel en geldzaken. Als tweede onderdeel van het ‘zedelijke’ beschouwde Kluit de regering, zowel in het verleden als in het heden. Een belangrijke vraag was in hoeverre de regering de rust, de veiligheid, de vrijheid en de welvaart van haar volk had kunnen verzekeren, en in hoeverre ze had gezorgd voor het behoud en de vermeerdering van het aantal inwoners en de vergroting van de nationale vlijt. Ook behandelde hij de defensie. In Kluits college kwamen vele onderwerpen aan de orde. Hij trachtte Nederland zo volledig mogelijk in kaart te brengen. Aan de koophandel van de Oost-Indische Compagnie, bijvoorbeeld, wijdde hij 90 bladzijden en aan de inkomsten en uitgaven van de staat zo’n 150.

Zowel economische, antropologische, sociologische als geografische onderwerpen kwamen bij Kluits bespreking van een staat aan bod. Het doel was na te gaan in hoeverre ze betekenis hadden voor de macht en de welvaart van een land. Traditioneel was de aandacht bijna altijd beperkt geweest tot juridische en staatkundige aspecten. De statistiek was een belangrijke vernieuwing in vergelijking met het verleden, want zij wilde zich op de feiten richten die inzicht gaven in de uitwerking van bepaalde maatregelen, zodat duidelijk werd welke maatregelen het meest noodzakelijk waren. In dat licht waren demografische, landbouwkundige en economische gegevens van groter belang dan de staatkundige inrichting van een land.

Hoewel Kluit zich meestal tot feitelijke beschrijvingen beperkte, lukte dat niet altijd. Soms kwamen er ook ideologisch geladen uitspraken om de hoek kijken. Enkele kenmerken van de Nederlandse samenleving vond hij er op achteruitgegaan, zoals: “De gewoonte dat de Moeders haar kinderen zelfs voeden en behandelen, die hier doorgaans zeer lang aanhield, is thans zoo algemeen niet meer”. Maar tot zijn tevredenheid kon hij daarnaast opmerken dat er “nergens zoo weinig onechte kinderen zijn dan hier; de Echteband heiliger is dan elders en de liefde tusschen ouders en kinderen nergens grooter.”

Theorie der probabiliteit van’t leven

Voor Kluit was de statistiek dus voornamelijk een vakgebied dat uit woorden bestond, maar dat betekende niet dat hij geen waarden wilde gebruiken. Als het voor een bepaald onderwerp van pas kwam, maakte hij graag gebruik van getalsmatige informatie. Zijn beschouwingen over het bepalen van het bevolkingsaantal zijn het meest kwantitatief. Hij was bijzonder in dergelijke getallen geïnteresseerd. In die tijd waren velen van mening dat het bevolkingsaantal een maat was voor de welvaart en de macht van het betreffende gebied. Echter bevolkingsregisters werden niet bijgehouden en volkstellingen werden pas in de loop van de negentiende eeuw systematisch georganiseerd. In Nederland zou de eerste volkstelling in 1829 worden gehouden. De omvang van de bevolking was dus onbekend. Maar er was wel een indirekte methode om daarvan op de hoogte te geraken. Maar dan had je in Kluits woorden de “theorie der probabiliteit van’t leven” nodig. Deze theorie leerde dat er een vaste verhouding tussen het bevolkingsaantal en het jaarlijkse sterfteaantal bestaat. En in tegenstelling tot het bevolkingsaantal werd het jaarlijkse sterfteaantal wel bijgehouden. In de stad zou die verhouding ongeveer 1 op 25 zijn en op het platteland 1 op 40. En zo kon je dan toch een globaal idee van het bevolkingsaantal krijgen. Het is niet vanzelfsprekend dat de ideeën van Kluit nu nog bekend zijn. Hij heeft geen boek geschreven waarin hij zijn opvattingen uiteen heeft gezet. Deze informatie is op andere wijze voor ons bewaard gebleven. In de Leidse universiteitsbibliotheek worden Kluits collegeaantekeningen bewaard en bovendien enkele diktaten van studenten die zijn colleges hebben gevolgd. En omdat het indertijd gebruik was, dat de student bijna letterlijk opschreef wat de docent te berde bracht, vormen deze diktaten een betrouwbare informatiebron. Kluit werd na 1802 spoedig in zijn oude rechten hersteld. In 1806 had zijn statistiekonderwijs zoveel erkenning verworven dat het officieel aan zijn leeropdracht werd toegevoegd. Lang heeft Kluit trouwens niet van deze erkenning kunnen genieten. Op 12 januari 1807 werd Leiden getroffen door een grote ramp: in het centrum van Leiden ontplofte een met kruit geladen schip. Kluits huis was één van de vele die toen instortten en hijzelf behoorde tot de dodelijke slachtoffers. Maar zijn initiatief bleef doorwerken. In 1815 bepaalde de centrale overheid dat de Leidse universiteit verplicht was om colleges in de statistiek aan te bieden. Kennis van dit vakgebied was verplicht om het doctoraal examen aan de juridische faculteit af te kunnen leggen.

Tabellenknechten en tabellenfabrikanten

Zo was aan het begin van de negentiende eeuw in Nederland statistiek een vak dat hoofdzakelijk uit woorden bestond en waarin waarden een ondergeschikte rol speelden. Toch doemden de waarden aan de horizon op en er waren personen die probeerden waarden in dit nieuwe vakgebied een steeds belangrijker positie te verschaffen. Dat kan tussen de regels door gelezen worden in de omschrijving van statistiek in de eerste druk van het Woordenboek voor Kunsten en Wetenschappen van G. Nieuwenhuis uit 1826. Daar vinden we namelijk onder het hoofd ‘statistiek’:

“Statenkunde, statenbeschrijving, uit staatkundige oogpunten beschouwd. Zij bepaalt zich tot wezenlijk voorhanden zijnde staten en niet tot denkbeeldige, en draagt dus den tegenwoordigen toestand van eenen staat voor, zoo als die in zijne gesteldheid, vereeniging en de werkzaamheden zijner krachten gegrond is. Hierdoor is zij een uitmuntend voorbeeld voor de Staatkunde, en een leerrijk oefenschool voor den staatsman; alleen moet zij in geen bloot tabellenwerk en getalregisters ontaarden.” Het was volgens de auteur nog wel vanzelfsprekend dat statistiek uit woorden bestond, maar daarnaast was het blijkbaar noodzakelijk geworden voor het gevaar te waarschuwen dat waarden, zoals te vinden in tabellen en getalregisters, deze voorkeurspositie zouden overnemen! Er was in dit nieuwe vakgebied dus blijkbaar iets aan de hand met betrekking tot de verhouding tussen woorden en waarden. Deze reactie had ermee te maken dat er een ontwikkeling in Duitsland gaande was die aan het eind van de achttiende eeeuw was begonnen en in het begin van de negentiende eeuw in een ordinaire ruzie was ontaard. Aan het eind van de achttiende eeuw waren daar de overheidsarchieven steeds toegankelijker geworden en was er veel meer informatie boven water gekomen waarvan een aanzienlijk deel getalsmatig was en dus uit waarden bestond. Sommigen statistici gingen de verzamelde gegevens, om ze goed te kunnen vergelijken, per land ordenen in tabellen. In het laatste kwart van de achttiende eeuw verscheen er nogal wat van dergelijke literatuur. Door het ordenen in tabellen kreeg men een overzicht van een bepaald land en kon men in één oogopslag meerdere landen met elkaar vergelijken. U kunt zich misschien indenken dat door deze benadering logischerwijze meer nadruk op díe onderwerpen kwam te liggen die in getallen waren weer te geven. Hiertegen kwam de oorspronkelijke ‘Göttingse School’ in het geweer. De aanhangers van deze school voelden zich hoog verheven boven een puur cijfermatige benadering. Volgens hen was de werkelijk belangrijke informatie niet in cijfers weer te geven. Zij spraken dan ook van “Tabellenstatistici” of zelfs snerend van “Tabellenknechten” en “Tabellenfabrikanten”. In de Göttinger gelehrte Anzeigen van 1806 lezen we: “Naar onze mening is het de misbruik van de tabellenmethode welke alles tot getallen wil reduceren, waardoor deze studie niet alleen van alle geest wordt geroofd, maar ook nog praktische gevolgen van geheel andere aard heeft. (…..) Voor een nationale geest, voor vrijheidsliefde, voor het genie en het karkter van grote en kleine mannen aan de top bestaan er geen kolommen. Dergelijke dingen worden dan ook niet aan de orde gesteld.” Dit verschil van inzicht ontaardde in een ordinaire ruzie, waarbij niet serieus werd ingegaan op elkaars argumenten. De ‘tabellenstatistici’ hoorden met verachting het gejammer, dat de statistische literatuur werd bedorven door het onderzoek naar de grootte en het bevolkingsaantal van staten. Ze beschouwden de ideeën van hun tegenstanders als hersenschimmen die zich vast en zeker verbreidden in landen waar aristocraten regeerden die het liefst in het geheel geen statistische informatie openbaar gemaakt wilden zien. Getuige een uitspraak in dezelfde Göttinger gelehrte Anzeigen is het waarschijnlijk dat de hierdoor ontstane controverse tot gevolg had dat een meer kwantitatieve benadering nog lange tijd weerstand ondervond. Deze uitspraak luidde: “Tot een dom knoeiwerk is de statistiek geworden alleen door de schuld van de politieke rekenkundigen. Deze stompzinnige mensen meenden en verbreidden de illusie, dat men de krachten van een staat al kent, wanneer men alleen maar het getal vierkante mijlen van het gebied weet, zijn menigte aan mensen, zijn (relatieve) bevolking, het nationale inkomen en bovendien nog het lieve vee!” Door deze controverse kwam de Duitse statistiek in een crisis terecht. De hoogleraar in de filosofie en geschiedenis te Göttingen A.F. Lüder (1760-1819), die op statistisch gebied al enkele werken op zijn naam had staan, keerde zich in 1812 in zijn Kritik der Statistik und der Politik tegen het gehele vak. De statistiek noch de politiek, zo zei hij, hadden de belangrijke veranderingen aan het begin van de negentiende eeuw op politiek en economisch gebied kunnen verklaren. Lüder baarde veel opzien met deze publikatie omdat zijn kritiek van binnenuit, uit de statistische wereld zelf, kwam. Veel statistici keerden zich tegen hem en daarom reageerde hij met een volgende publikatie: Kritische Geschichte der Statistik (1817). De geschiedenis toonde volgens hem aan dat zijn visie op de statistiek de juiste was. Hij had nog enige clementie met statistici die zich op getallen baseerden. Dezen hadden immers gezorgd voor een betere inrichting van weduwenfondsen en dergelijke. Lüder keerde zich vooral tegen die statistici die zich hoog verheven voelden boven een getalsmatige benadering en die volgens hem daardoor bestaande gegevens negeerden, zich in speculaties verloren en hun aandacht van de hoofdzaken lieten afleiden. Daarentegen had hij op een andere plaats kritiek op de statistici, die alleen voor echt wilden aannemen wat te meten en te tellen was. Hoewel Lüder een geïsoleerde positie in de statistische wereld innam, illustreert zijn optreden dat de Duitse statistiek zich aan het begin van de negentiende eeuw in een kritieke fase bevond.

Statistiek vanuit wiskundige hoek: Quetelet

Al zou de weerstand tegen een dominantie van getallen en van wiskunde in de statistiek nog lang blijven bestaan, uiteindelijk zou deze ontwikkeling toch niet te keren zijn. Een krachtige impuls in deze richting kwam van iemand die uit een geheel andere traditie kwam dan de oorspronkelijke ststistici. Wij doelen op de Belgische Lambert Adolphe Jaques Quetelet (1796-1874). Was Kluit een alfa-wetenschapper, Quetelet was een wiskundige en dat verschil in achtergrond zou een rol spelen in hun uiteenlopende ideeën over de inhoud en de betekenis van statistiek.

Quetelet hield zich aanvankelijk, evenals Kluit, helemaal niet met statistiek bezig. Hij was gepromoveerd in de analytische meetkunde en begon zich daarna voor astronomie te interesseren. Hij wilde een observatorium in Brussel oprichten om astronomische waarnemingen te kunnen doen en kreeg in 1823 van de Nederlandse regering toestemming om in verband daarmeee een studiereis naar Parijs te maken. De Nederlandse regering moest daarvoor toen toestemming geven, omdat België van 1813 tot 1830 bij ons land hoorde. In Parijs kwam Quetelet in aanraking met een heel nieuwe wereld en deze Parijse reis heeft een grote invloed op hem uitgeoefend. De beroemde wiskundigen Laplace, Poisson en Fourier zaten daar. Dezen hielden zich bezig met waarschijnlijkheidsrekening die hoofdzakelijk als foutentheorie in de astronomie werd gebruikt. Maar er waren daar toch ook al ontwikkelingen om de waarschijnlijkheidsrekening op geheel andere problemen toe te passen. Men had gemerkt dat in allerlei grote aantallen gegevens regelmatigheden kunnen worden ontdekt, die in verband kunnen worden gebracht met begrippen uit de waarschijnlijkheidsrekening. Bijvoorbeeld worden er gemiddeld iets meer jongens dan meisjes geboren, zodat gezegd kan worden dat de kans op de geboorte van een jongen iets groter is dan een half en van een meisje iets kleiner. Ook probeerde men er op grond van feitenmateriaal achter te komen, in welk geval iemand die van moord wordt beschuldigd een grotere kans had om vrijgesproken te worden: wanneer diens zaak behandeld werd door een rechtbank zònder of door een rechtbank mèt jury.

‘Neiging tot misdaad’

Toen Quetelet van deze reis terugkwam, is hij zich met kansrekening en de mogelijke toepassingen gaan bezighouden. hij gaf er een college over voor een breed publiek, waaruit een boekje voortkwam, dat (vertaald) getiteld was: Bevattelijk onderrigt in de kansrekening of de Leer der Waarschijnlijkheden. Hij verzamelde gegevens die met het zedelijk peil van een land in verband kunnen worden gebracht: aantallen vondelingen en verwaarloosde kinderen, gegevens over rijkswerkinrichtingen, rijksgevangenissen, feiten afkomstig van rechtbanken en armenzorg. Quetelet was namelijk erg geïnteresseerd in gegevens over de ‘mate van criminaliteit’ van een bevolking. Deze belangstelling hing samen met zijn visie dat de ‘morele kwaliteit’ van een samenleving omgekeerd evenredig is met het aantal misdaden dat wordt gepleegd. Dat betekent dat men, als men inzicht in het morele gehalte van een samenleving wil verkrijgen, zich in principe tot de bestudering van de criminaliteit kan beperken. En daarover waren ten tijde van Quetelet statistische gegevens te verkrijgen. Quetelet liet zien dat het aantal moorden dat in een bepaald land wordt geregistreerd, elk jaar ongeveer gelijk is, en dat daarvan zelfs het aantal moorden dat op een bepaalde wijze wordt gepleegd, bijvoorbeeld door wurging, elk jaar vrijwel constant is. Hij interpreteerde dit met de veronderstelling dat binnen een groep mensen in een bepaald land een neiging tot misdaad, een ‘penchant au crime’, bestaat, die afhankelijk is van de leeftijd en het geslacht en die voor elke leeftijd kan worden bepaald door van een leeftijdsgroep het aantal personen dat een misdaad heeft gepleegd, te delen door het totaal aantal mensen van die groep. Dit levert dan een getal op dat hij als de ‘neiging tot misdaad’ van een willekeurige persoon van die leeftijd beschouwde. U kunt zich, denk ik, niet voorstellen, welke grote indruk het bestaan van een dergelijke wetmatigheid op de mensen uit die tijd heeft gemaakt. Hoe kan een verschijnsel als moord een wetmatigheid vertonen, namelijk dat er elk jaar vrijwel evenveel gepleegd worden? Moordenaars voeren toch geen overleg met elkaar over het te plegen aantal? Wat men nog veel onbegrijpelijker vond is, dat Quetelet ook liet zien, dat er elk jaar evenveel zelfmoorden worden gepleegd. Als toch iets door de vrije wil van de mens bepaald wordt, dan is dat toch wel de beslissing of men de hand aan zichzelf zal slaan, of niet.

Internationale statistische congressen

Quetelet verzamelde voor zijn studies statistische gegevens uit een groot aantal landen en merkte dat deze gegevens meestal niet of nauwelijks vergelijkbaar waren. Ze waren volgens verschillende criteria en categorieën verzameld en ingedeeld. Dit was voor hem de reden om het voortouw te nemen bij het organiseren van internationale statistische congressen, waarvan de eerste onder zijn voorzitterschap werd gehouden te Brussel in 1854. Er zijn acht van deze congressen geweest waarvan ook één in Den Haag, in 1869. Deze internationale statistische congressen waren groots opgezet. Vele landen stuurden hun vertegenwoordigers, zowel uit de ambtelijke als uit de wetenschappelijke wereld. Tijdens zo’n bijeenkomst trachtte men eenheid te brengen in het verzamelen van gegevens in en over de diverse landen met het doel landen met elkaar te vergelijken, wat een oud ideaal uit de Duitse traditie was. Mede door Quetelets betrokkenheid bij deze congressen stond hij in contact met statistici die werkten in navolging van deze traditie. Quetelet probeerde te bereiken, dat deze mensen hun beschouwingen meer op betrouwbaar getallenmateriaal en zo mogelijk op waarschijnlijkheidsrekening zouden gaan baseren, en niet op “vage hypothesen en systemen zonder fundament”. Zo heeft hij getracht van de statistiek een betrouwbare wetenschap te maken.

De normale verdeling

Quetelet noemde de foutenwet, die pas later de normale verdeling zou worden genoemd, ook wel de wet van de toevallige oorzaken. De waarde van een grootheid werd volgens hem bepaald door constante en toevallige oorzaken. De toevallige oorzaken die op een grootheid werken, hadden tot gevolg dat de waarden van deze grootheid waren onderworpen aan de foutenwet. De invloed van de toevallige oorzaken kon worden opgeheven door het bepalen van een groot aantal mogelijke waarden van die grootheid en deze waarden te middelen. Met de constante oorzaken was het anders gesteld, deze waren verantwoordelijk voor een vaste bijdrage aan de waarde van een grootheid. Ze konden alleen bestudeerd worden als de invloed van toevallige oorzaken was geminimaliseerd. Constante oorzaken waren bijvoorbeeld het geslacht of de leeftijd van een persoon. Verder onderscheidde Quetelet nog de variabele oorzaken, die met name voor periodieke variatie zorgden. Het bleek bijvoorbeeld dat het sterftecijfer aan periodieke variatie onderhevig was; deze was elk jaar het hoogst in februari en maart en het laagst in juni tot augustus.

In 1835 verscheen Quetelets belangrijkste werk Sur l’homme et le développement de ses facultés. —Essai de physique sociale. Hierin presenteerde hij vele statistische gegevens over zowel fysieke als morele kwaliteiten van de mens en liet zien dat veel van deze gegevens rond hun gemiddelde waren verdeeld volgens de foutenwet uit de astronomie, ofwel de normale verdeling. Hij was de eerste die deze foutenwet gebruikte voor de variabiliteit in de natuur, waardoor de wet een veel bredere toepassing en betekenis kreeg dan alleen de kansverdeling van meetfouten, waarvoor hij tot dan toe in de sterrenkunde werd gebruikt. Ook de natuurlijke variabiliteit bleek te zijn onderworpen aan deze kansverdeling. Quetelet dacht dat alle in de natuur optredende waarden van een of andere grootheid de curve van de normale verdeling volgen. Wanneer een verzameling gegevens niet volgens deze curve was verdeeld, hoorden ze niet bij elkaar en waren het geen waarden van dezelfde grootheid. En andersom, wanneer gegevens van een aantal individuen waren verdeeld volgens de normale curve, dan waren die gegevens homogeen. De betreffende individuen konden dan als één groep worden beschouwd.

De gemiddelde mens

Quetelet had de beschikking over meetresultaten van de borstomvang van een aantal Schotse soldaten. Deze grootheid was volgens Quetelet gemodelleerd volgens de ideale borstomvang van de Schotse soldaat, die de waarde van het gemiddelde van de gemeten borstomvangen had. Dit in analogie met de astronomie waar men het gemiddelde beschouwde als de beste benadering van de werkelijke waarde van de gemeten grootheid. Voor Quetelet bestond er dus ook voor de borstomvang van een Schotse soldaat zoiets als een werkelijke waarde. Hij definieerde de gemiddelde mens ofwel l’homme moyen als de mens waarbij alle te onderscheiden grootheden een gemiddelde waarde hadden. Deze beschouwde hij als het ideaaltype mens. Omdat hij deze mens als het zwaartepunt van de maatschappij beschouwde, zou die het onderwerp van studie moeten zijn in een nieuwe wetenschap die hij sociale fysica noemde. Kennis van de gemiddelde mens zou inzicht in de mensheid en de maatschappij opleveren. De sociale fysica, die dus de gemiddelde mens als studieobject zou hebben was in essentie een statistisch georiënteerde wetenschap, want het onderwerp van studie, de gemiddelde mens, was een statistisch bepaald begrip.

Hoewel Quetelet niet ontkende dat ook aandacht moest worden besteed aan hetgeen afwijkt van het gemiddelde, heeft hij dat niet zelf gedaan. Om zijn idee van gemiddelde mens duidelijk te maken vergeleek hij deze wel eens met een beeld. De mensen die werkelijk bestaan beschouwde hij als copieën van dit beeld. Deze copieën vertonen natuurlijk afwijkingen van het origineel dat de ideale vorm bezit. Door op deze manier te redeneren, zette hij het middelmatige van een mens op een voetstuk en bagatelliseerde hij het bijzondere. De normale verdeling en het gemiddelde kregen zowel een normatieve als een esthetische lading. U kunt zich waarschijnlijk wel voorstellen, dat, ondanks de vele bewondering die Quetelet ten deel is gevallen, dit aspect van zijn opvattingen ook veel kritiek heeft ondervonden. Zo schreef de hoogleraar in de statistiek Anthony Beaujon in 1884 spottend het volgende over Quetelets gemiddelde mens: “die zich in eene beroemdheid verheugt welke menig werkelijk sterveling hem zou kunnen benijden, en wel juist omdat hij, zoo wij hem in vleesch en been konden ontmoeten, niets aan zich hebben zou, dat hem beroemd of berucht kon maken.” Beaujon vond dat Quetelet als statisticus buiten zijn boekje was gegaan door de gemiddelde mens als volmaakt te beschouwen.

De twee werelden

Al heel lang is men er zich van bewust dat er twee werelden zijn, waartussen een kloof bestaat die bijkans onoverbrugbaar schijnt: de alfa- en de bèta-wereld. Het bijzondere van Quetelet was dat hij als bèta-wetenschapper zich interesseerde voor statistiek of ‘statenkunde’, wat toen, zoals we bij Kluit hebben gezien, nog een alfa-domein was. Op deze wijze wist hij een brug tussen beide werelden te slaan. In Nederland is dit voorbeeld echter niet nagevolgd. Er is in Nederland in de negentiende eeuw één wiskundige geweest, die zich voor statistiek en waarschijnlijkheidsrekening interesseerde en daar met Quetelet over correspondeerde. Deze hoogleraar te Delft, Rehuel Lobatto, die een wiskundige in hart en nieren was, respecteerde Quetelet in hoge mate. Hij schreef Quetelet eens, dat hij hem juist zo bewonderde omdat Quetelet met evenveel succes zeer verschillende mogelijke toepassingen van de exacte wetenschappen behandelde. Daarbij dacht hij met name aan het werk dat Quetelet aan de ‘morele’ statistiek had gedaan. Het is duidelijk dat Lobatto aanvoelde dat Quetelet iets kon, waartoe hij zichzelf niet in staat achtte: het aanbrengen van een brug tussen de alfa- en de bèta-wereld.

Quetelet wist door zijn veel exactere achtergrond dan de andere statistici de statistiek nieuwe impulsen te geven. Bij Quetelet was de overgang van woorden naar waarden gemaakt. De ontwikkeling was zelfs nog verder gegaan; kansrekening speelde een centrale rol spelen bij het samenvatten en interpreteren van kwantitatieve gegevens. Het centrale concept daarbij was de normale verdeling. Dat wil niet zeggen dat dat voor iedereen ten tijde van Quetelet het geval was. In Nederland zou het voorlopig nog anders zijn. In de Vereeniging voor de Statistiek, die in 1857 zou ontstaan, stonden de opvattingen over statistiek nog lang in de Duitse traditie.

‘Aliis Exterendum’, om door anderen geoogst te worden

In Engeland was eerder dan in Nederland sprake van een statistische organisatie, namelijk reeds in 1834. Daarbij was Quetelet betrokken geweest. Het begon in 1831. In dat jaar werd de ‘British Association for the Advancement of Science’ opgericht. Deze organisatie wilde Engelse natuurwetenschappers jaarlijks in de belangrijkste provinciesteden bij elkaar brengen om van gedachten te wisselen over recente natuurwetenschappelijke ontwikkelingen. In 1833 hield ze haar derde bijeenkomst in Cambridge. Quetelet was uitgenodigd om als officiële Belgische afgevaardigde aan het congres deel te nemen. Hij wilde een lezing geven over de resultaten van zijn statistische onderzoekingen van zelfmoord en misdaad, maar in geen van de secties van de vereniging paste dit onderwerp. Er waren op het congres wel verschillende geleerden geïnteresseerd in Quetelets onderwerp, waaronder Malthus en de wiskundige Charles Babbage. Deze kwamen op een avond bijeen om naar Quetelet te luisteren en richtten toen een statistische sectie op. De voorzitter van de British Association stelde een drietal voorwaarden aan de nieuwe sectie. Zij moest zich verre houden van de “akelige wereld van de politiek”, verder moest de nieuwe sectie zich beperken tot “feitelijke aangelegenheden (…) met numerieke resultaten”, terwijl de “hogere generalisaties” van politieke economie en politieke filosofie waren verboden.

Degenen die waren betrokken bij de oprichting van de nieuwe sectie van de British Association, waren bijna allen afkomstig uit Londen. Bij hen ontstond al gauw de behoefte aan een Londense vereniging. Babbage nam, samen met enkele anderen, het initiatief en in 1834 werd de London Statistical Society opgericht. Op de eerste bijeenkomst werd het volgende uitgesproken: “accurate kennis van de maatschappelijke omstandigheden en vooruitzichten (…..) is een doel van groot nationaal belang dat niet kan worden verkregen zonder een zorgvuldige verzameling en classificatie van Statistische feiten.” De statistiek moest dus de maatschappij als haar onderwerp van studie beschouwen en daartoe statistische feiten verzamelen. De statistiek werd niet gedefinieerd door haar methode, maar door het onderwerp waarmee ze zich bezighield. Als motto van de vereniging werd gekozen “Aliis Exterendum”, hetgeen betekent: om door anderen geoogst te worden. Met dit motto wilde men tot uitdrukking brengen dat men vond dat statistiek zich diende te beperken tot het verzamelen van feiten en zich niet behoorde te wagen aan interpretatie en aan theoretisering. Deze bepaling kwam voort uit de vrees dat de vereniging zou worden gebruikt om politieke opvattingen te propageren. Men was er zich blijkbaar wel van bewust dat statistiek maar al te makkelijk gebruikt kan worden om iemands al of niet verborgen eigen doeleinden na te streven. In 1838 werd begonnen met het uitgeven van een eigen tijdschrift, de Journal of the Statistical Society of London. Uit de onderwerpen die werden behandeld op de bijeenkomsten van de vereniging blijkt, dat men een grote belangstelling had voor economisch-statistische onderwerpen, en dat er bovendien grote aandacht bestond voor sterfte- en gezondheidsstatistiek. Dat statistiek uit getallen behoorde te zijn opgebouwd, achtte men op een bepaald moment wel vanzelfsprekend, echter de rol van de wiskunde bleeft vooralsnog beperkt. Dit wordt onder meer geïllustreerd door een lijst van onderwerpen die voor de toekomst van de statistiek wenselijk zouden zijn, opgesteld in 1869 door W. Newmarch, de toenmalige voorzitter van de vereniging. Onderzoek naar de wiskunde en de logica van statistische bewijsvoering kwam op de achttiende en laatste plaats. In Engeland verstond men toen blijkbaar onder statistiek hetgeen wij nu met beschrijvende statistiek aanduiden.

Wiskunde, een vak dat alleen inzet vergt

Iemand die als een representant van deze opvatting van statistiek kan worden beschouwd is Florence Nightingale (1820-1910). U weet misschien wel dat deze Engelse dame wordt gekarakteriseerd als: The Lady with the Lamp, die de gewonde soldaten bij nacht en ontij liefdevol verzorgde: “In that place of misery, a lady with a lamp I see”. Maar dat ze ook wel a passionate statistician is genoemd, dat zal voor velen van u toch waarschijnlijk nieuw zijn. Om dat laatste gaat het ons, maar om enig inzicht te hebben waarom ze statistiek zo belangrijk vond en waarom haar statistische bijdragen in die tijd indruk maakten, zullen we nagaan hoe ze zo bekend geworden is.

Ze was de tweede en laatste dochter van de zeer bemiddelde Fanny en William Nightingale, die behoorden tot de hoogste Engelse kringen. Omdat vader William geen goede huisonderwijzer kon vinden, besloot hij zijn twee dochters zelf onderwijs te geven. Ze kregen behalve meerdere talen en andere vakken ook enige wiskunde onderwezen. Florence ontwikkelde een passie voor het verzamelen van feiten, met name intrigeerden haar cijfermatige gegevens. Toen ze twintig jaar was, wilde ze zich verder in de wiskunde verdiepen dan haar vader haar kon leren. Haar motivatie voor de keuze van wiskunde is trouwens niet zo vleiend voor dit vakgebied: “Ik denk dat ik meer succesvol zal zijn in een vak dat alleen inzet vergt dan in een vak dat een snel begrip verlangt.” Echter, van een meisje van haar leeftijd en stand werden andere dingen verwacht: huiselijke plichten, zoals het afleggen van bezoeken, het leren converseren, het schikken van bloemen en het deelnemen aan feestelijke bijeenkomsten, kortom, het zich voorbereiden op het huwelijk. Ze moest het daardoor grotendeels van zelfstudie hebben. Ze studeerde in de vroege ochtenduren, wanneer haar nog geen huiselijke plichten werden opgelegd. Enkele jaren eerder was het haar duidelijk geworden dat ze niet voor een ‘gewoon’ getrouwd bestaan bestemd was. Ze formuleerde het zelf als volgt: “Op 7 Februari, 1837, sprak God tot mij en riep mij tot Zijn dienst”. In de loop van de jaren raakte ze er van overtuigd, dat haar bestemming lag in het verlichten van het lijden van de ellendigen in de wereld. Ze wilde verpleegster worden, maar daarvoor vond ze al helemaal geen gehoor bij haar ouders. Verpleegsters hadden toen een slechte naam. Er gingen vele jaren voorbij, jaren waarin ze zich zeer ongelukkig voelde. Studeren kon ze wel. Ze voorzag zich van de benodigde literatuur en verdiepte zich in het ziekenhuiswezen. Ze deed in deze periode zoveel kennis op, dat ze daar later nog veelvuldig van kon profiteren. In 1853 nam ze het iniatief tot het ontwerpen van een vragenlijst voor een aantal ziekenhuizen in Europa betreffende hun statistische gegevens over ziekte en sterfte. Deze stuurde ze rond en ze verwerkte en analyseerde de ontvangen gegevens, waardoor haar kennis over de omstandigheden in ziekenhuizen nog groter werd. Het einde van het gedwongen verblijf bij haar ouders kwam nu in zicht. Ze was intussen 33 jaar. In 1853 werd ze via een invloedrijke vriendin uitgenodigd om directrice te worden van een ziekenhuis voor dames. Ze had eindelijk een meer bevredigende taak in haar leven gevonden.

Sterfte door besmettelijke ziekten

Toen brak de oorlog in de Krim uit, waarbij de Engelsen en de Fransen de kant van de Turken kozen tegenover de Russen. Enkele Engelse legereenheden werden naar de Krim gestuurd. Voor het eerst in de geschiedenis ging er een oorlogscorrespondent mee. Die wist met zijn regelmatig verschijnende artikelen in de Times de publieke opinie in Engeland danig te beïnvloeden. Via hem vernam men over de slechte omstandigheden aan het front. De sterfte onder de soldaten was zeer groot, omdat er geen behoorlijke medische verzorging was en omdat de logistiek zich op een bedenkelijk laag peil bevond. De discussies in het Lagerhuis laaiden hoog op en de minister van oorlog kreeg de opdracht een groep verpleegsters te sturen. Hij vroeg toen Florence om deze missie te organiseren en te leiden en voorzag haar van verregaande bevoegdheden.

Ze kreeg met moeite op korte termijn een groep van 38 verpleegsters bij elkaar en vertrok naar Scutari, nabij Constantinopel, waar de ziekenhuisbarakken van het Engelse leger zich bevonden. De periode die ze toen tegemoetging, heeft een diepgaande en beslissende indruk op haar gemaakt. Ze kwam in een verschrikkelijke situatie terecht. De gewonden misten zelfs de meest noodzakelijke verzorging. De barakken waren over- en overvol en steeds werden er patiënten aangevoerd. Er heersten besmettelijke ziekten. De sterfte was enorm. Om anderen te overtuigen van de noodzaak van bepaalde veranderingen en ook voor zichzelf om inzicht in de situatie te krijgen, maakt ze gebruik van statistische gegevens die ze zelf verzamelde. Op basis daarvan kon ze naderhand met behulp van figuur 1 laten zien dat de sterfte in de militaire hospitalen grotendeels werd veroorzaakt door besmettelijke ziekten als cholera en typhus. Nadat ze hygiënische maatregelen had genomen, daalde de sterfte enorm, hetgeen ze overtuigend illustreerde met behulp van figuur 2. Toen de oorlog afgelopen was, ging ze terug naar Engeland. Ze was uitgeput en ziek en zou haar verdere leven invalide blijven. Ze voelde zich echter geroepen om zich voor de Britse soldaat te blijven inzetten. Hierbij maakte ze gebruik van haar kontakten en vriendschappen met invloedrijke politici, want ze heeft nooit een officiële (betaalde) functie gehad. Dat was voor een vrouw van haar stand in die tijd niet weggelegd. Ze wist daarentegen grote invloed uit te oefenen op informele wijze, door de vele kontakten die ze voor een deel al in haar jeugd had opgebouwd en verder door de publieke opinie rond haar persoon. Zelfs de koningin heeft ze meerdere keren ontmoet en Florence Nightingale wist ook haar voor de zaak te winnen. Ze wist gedaan te krijgen dat er in 1857 een commissie werd ingesteld die de hele kwestie van de medische hulp aan soldaten zou onderzoeken. En al was ze geen lid, ze was zeer direkt betrokken bij het werk ervan. Ze leverde materiaal bij de samenstelling van de rapporten. Echter, in 1860 stierf haar dierbare vriend, de minister van oorlog. Haar invloed binnen het ministerie van oorlog werd aanzienlijk minder. Ze is zich toen met andere kwesties gaan bezighouden en is uiteindelijk teruggekeerd naar het thema waarmee het allemaal begonnen was: het ijveren voor de instelling van een gewaardeerd verpleegstersberoep. In dat kader heeft ze een opleidingsschool voor verpleegsters in het leven geroepen.

Statistiek, de belangrijkste wetenschap

Een belangrijk middel waarvan ze gebruik maakte was dus de statistiek. In een verslag van het Internationale Statistische Congres in 1860 te Londen, geschreven door de Nederlandse prof. Quack, is het volgende te lezen:

“De tweede sectie (…) behandelde de gezondheidsstatistiek. (…). Onder de ingekomen stukken bevond zich ook een brief (…), geschreven door Florence Nightingale. (…) Zij wees op den invloed van een goed sanitair régime bij de troepen. Alles, wat de gezondheid bevorderde, moest volgens haar overal worden opgemerkt en waargenomen (…). Men moest ten allen tijde en overal met cijfers aantoonen, dat de uitgaven ter verbetering en voorkoming van zulke toestanden zooveel minder zijn dan de uitgaven, die door de ziekten en misdaden zelf veroorzaakt worden. – Die brief van de edele vrouw, de heldin der zelf-opofferende liefde, wekte (…) een waar enthousiasme op, en de naam van Florence Nightingale werd door al die statistici (…) met een hulde en vereering begroet, als wilde de met cijfers bedekte negentiende eeuw aantoonen, dat, waar de vrouw in haar edelste verschijning tot die droge tabellen naderde, er bij haar tred een waas van poëzie, een zoete geur zelfs over muffe cijfers werd uitgegoten. Het spreekt vanzelf dat Florence’s voorstellen door het congres werden aangenomen en aanbevolen.” De schrijver karakteriseerde de eeuw waarin hij leefde als “De met cijfers bedekte negentiende eeuw”. In de negentiende eeuw was er een heilig geloof in de kracht van getallen. Dit geloof in getallen zien we ook bij Florence Nightingale. Omdat ook anderen zich in die tijd graag door dergelijke redeneringen lieten overtuigen, had haar statistische argumentatie een grote overtuigingskracht. In dat opzicht was ze dus een echt kind van haar tijd en heeft ze gebruik gemaakt van de middelen die in die tijd het meest effektief waren. Wel onderscheidde ze zich van een belangrijke Engelse statisticus uit die tijd, genaamd William Farr, met wie ze trouwens veel heeft samengewerkt. Hij vond van statistische gegevens; “hoe droger hoe beter” en “Statistiek moet het droogste zijn van alles wat gedoceerd wordt”. Zìj was er daarentegen steeds op uit om die statistische gegevens zo ‘niet-droog’ mogelijk te presenteren. Ze wilde dat een groter publiek dan alleen wetenschappers met één oogopslag konden zien, wat ze met haar statistische gegevens wilde aantonen. Bij haar was statistiek echt een middel, geen doel; het doel was bijv. het bereiken van verbeteringen in de medische voorzieningen van soldaten. Vandaar dat zij zich heeft ingespannen om deze statistische gegevens zo inzichtelijk mogelijk grafisch te presenteren, waarbij ze dus ook van verschillende kleuren gebruik heeft gemaakt. Daarmee was ze voor die tijd vernieuwend bezig. Statistiek was voor haar echter nog meer dan een belangrijk instrument. Ze gelóófde in statistiek. Ze zei dat statistiek “de belangrijkste wetenschap is van de hele wereld; want van haar hangt af de praktische toepassing van elke andere wetenschap: het is de enige wetenschap die essentieel is voor elk politiek en sociaal bestuur, elk onderwijs, en elke organisatie gebaseerd op ervaring, want alleen dit vak levert exacte resultaten van onze ervaring op.” Verder geloofde ze dat statistiek de morele wetten in de maatschappij kon blootleggen. In deze opvattingen is de invloed van Quetelet waar te nemen. Florence Nightingale bewonderde hem zeer en heeft uitgebreid met hem gecorrespondeerd. Voor haar had het zoeken naar dergelijke wetten bovendien een religieus aspekt. Op deze wijze kon je immers het Plan van de Opperste Wijsheid en Goedheid ontdekken.

Francis Galton: whenever you can, count

Voor Florence Nightingale was statistiek dus ongeveer wat wij nu onder beschrijvende statistiek verstaan, waarbij ze op innoverende wijze van grafische voorstellingen gebruik maakte. De overgang van woorden naar waarden had zich voltrokken. En dat was voor haar doeleinden bevredigend. Toch gold het niet alleen voor het getal dat daarvan de opmars niet te stuiten was, hetzelfde zou uiteindelijk ook met de kansrekening gebeuren. Quetelet had de eerste pogingen gedaan. Die sloegen echter voorlopig nog niet bij de toenmalige statistische wereld aan. Al bewonderden de statistici hem hogelijk, veel navolging in zijn pogingen de statistiek te ‘probabiliseren’ had hij in die kringen niet. In Francis Galton (1822-1911) zou hij wel een waardige opvolger krijgen. Door diens bijdragen zou er een nieuw vakgebied onstaan, waarin wij naderhand het begin van de mathematische statistiek zijn gaan zien.

Galton heeft nooit een betaalde baan gehad. Dat was niet nodig want hij kwam uit een rijke familie van zakenmensen en bankiers. Hij moet een opvallend jongetje zijn geweest, want er wordt van hem gezegd dat hij al kon lezen toen hij tweeënhalf jaar oud was en verder dat hij wel een IQ van 200 gehad moet hebben. Hij was geen wiskundige, maar had wel een wiskundig georiënteerde geest. En hij was geobsedeerd door getalsmatige informatie, waarschijnlijk nog meer dan Florence Nightingale. Eén van zijn lijfspreuken was “whenever you can, count”. Zo liet hij allerlei metingen aan de mens doen, van hoofdomvang tot oogkleur. Ook rekende hij van iemand die een lezing hield wel eens een zogenaamde vervelingscoëfficient uit. Hij baseerde dat getal dan op het gedrag van de toehoorders tijdens zo’n lezing. Hij was ook in de schoonheid van de vrouw geïnteresseerd. Zo schijnt hij altijd een plankje bij zich gehad te hebben, waarop hij de score van de schoonheid van de vrouwen die hij tegenkwam, kon aangeven. Op grond daarvan was hij tot de conclusie gekomen dat in Engeland de Londense vrouwen het mooist en de vrouwen van Aberdeen het lelijkst waren. Galton bouwde voort op het werk van Quetelet. Quetelet had laten zien dat de foutenkromme uit de astronomie ook kon worden gebruikt om biologische variatie te beschrijven. Op deze wijze had de foutenkromme een veel groter toepassingsgebied gekregen. Echter de visie van Quetelet op deze kromme was daardoor niet wezenlijk veranderd. Hij beschouwde immers ‘de gemiddelde mens’ als het zwaartepunt van de samenleving, alles wat niet de gemiddelde waarde had moest als een afwijking van het ideale worden beschouwd. Galton nam kennis van het werk van Quetelet en was enthousiast over diens toepassing van kanstheorie en diens bredere gebruik van de foutenkromme. Ook Galton merkte op dat vele menselijke eigenschappen volgens de Gauss-kromme verdeeld zijn. Echter hij was het geheel oneens met de interpretatie ervan. Hij schreef daarover: “De belangrijkste doelen van de foutenkromme van Gauss waren, in een bepaalde betekenis, precies tegengesteld aan waarop ik ze toepaste. Zij waren bestemd om zich van fouten te ontdoen, of de invloed ervan binnen de perken te houden. Echter, deze fouten of afwijkingen waren nu juist de dingen, die ik wilde bewaren en meer van wilde weten.” Galton beperkte de toepassing van de normale verdeling niet tot biologische menselijke gegevens. Lang voordat IQ-testen waren ontwikkeld, was Galton al tot de conclusie gekomen dat intelligentie de normale verdeling moest volgen. Hij bracht dat in 1869 als volgt onder woorden: “Dit is waar ik heen wil – dat analogie laat zien dat er bij de bewoners van de Britse eilanden een tamelijk constant gemiddeld mentaal vermogen moet zijn, en dat afwijkingen van dit gemiddelde – omhoog in de richting van genialiteit en omlaag naar domheid – aan de wet gehoorzamen die de afwijkingen van alle echte gemiddelden regeert.” Zijn grote belangstelling voor intelligentie ging gepaard met, in onze hedendaagse ogen controversiële, standpunten. Zo was hij van mening dat Engelse vrouwen één standaarddeviatie dommer waren dan Engelse mannen, negers twee standaarddeviaties en Australische inboorlingen zelfs drie. De suggestie kan nu gewekt zijn, dat Galton vond dat hij behoorde tot de meest intelligente mensen die ooit hadden bestaan. Dat is niet helemaal waar; hij beschouwde de intelligentie van de burgers van het illustere oude Athene als, zoals hij schreef: “vrijwel twee standaarddeviaties hoger dan de onze – dat is ongeveer evenveel als ons ras zich boven dat van de Afrikaanse neger bevindt.” In die tijd was de mening vrij algemeen, dat het blanke Europese ras superieur was. Wat dat betreft was het niet schokkend wat hij beweerde. Het bijzondere van Galton was de wijze waarop hij de (voor)oordelen uit die tijd onder woorden bracht: in statistische termen. Dat was toen wèl nieuw. En omdat hij leefde in de ‘met cijfers bedekte negentiende eeuw’ ging er van een dergelijke formulering een grote kracht uit.

Regressie en correlatie

Evenals voor Florence Nightingale was zijn interesse voor de statistiek een gevolg van belangstelling voor iets anders. Zijn primaire belangstelling ging uit naar evolutie en erfelijkheid. Hij was onder de indruk van de ideeën van zijn oom, Charles Darwin, die in 1859 de evolutietheorie had geformuleerd. Hij was daardoor geheel overtuigd dat het huidige planten-en dierenrijk (inclusief de mens) door evolutie was ontstaan. Galton dacht erover na hoe de evolutie kon zijn verlopen en welke erfelijkheidswetten daaraan ten grondslag zouden hebben gelegen. Darwin had de natuurlijke selectie als noodzakelijke voorwaarde van de evolutie aangewezen. Galton was dit geheel met hem eens, maar vond dat deze natuurlijke selectie bij de mens niet meer voldoende functioneerde. Hij was daarom een voorstander van eugenetische maatregelen van rasverbetering: Intelligente ouders zouden meer kinderen moeten krijgen dan zwakbegaafden. Hij had een duidelijk standpunt in de diskussie die nog altijd voortduurt van ‘nature versus nurture’. Hij was van mening dat erfelijkheid een veel bepalender rol speelde bij de vorming van een bepaalde eigenschap dan opvoeding en opleiding en probeerde aan de hand van getallen zijn standpunt in het nature-nurture debat te onderbouwen.

Galton vond het dus belangrijk om zijn overtuigingen met empirisch materiaal te onderbouwen. Maar hoe kwam hij aan die gegevens? Het ging hem om gegevens van menselijke verschijnselen, maar aanvankelijk zag hij geen kans om die te verzamelen. Daarom nam hij zijn toevlucht tot lathyruszaden. Ook die konden kennis over erfelijkheid opleveren. Hij maakte groepjes van zaden met hetzelfde gewicht, dus zowel relatief lichte als relatief zware zaden. Deze stuurde hij naar verschillende vrienden met het verzoek ze te zaaien, er weer zaad van te winnen en dat nieuwe zaad dan weer naar hem terug te sturen. En zo geschiedde. Galton woog al die zaden van de nakomelingen en hij merkte op dat, gemiddeld genomen, de zaden van de zeer lichte ouderzaden dan wel niet zo licht waren dan die van de ouders, maar wel lichter dan het gemiddelde van alle zaden. Voor de zwaardere zaden gold dat het nageslacht zaden opleverde die zwaarder waren dan het gemiddelde van het totaal, maar wel lichter dan de ouderzaden. Dit verschijnsel zou later regressie naar het gemiddelde genoemd worden. Toen hij later dit verschijnsel ook bij de lengte van mensen opmerkte, moest hij er wel rekening mee houden dat mensen twee ouders hebben. Daartoe definieerde hij de ‘mid-parental height’: het gemiddelde van de lengte van de vader en 1.08 keer de lengte van de moeder. Ook bij deze grootheid trad regressie naar het gemiddelde op: de kinderen van heel kleine ouders waren wel klein, maar in het algemeen niet zo klein als hun ouders (zie fig. 3). Galton had een mooi plan bedacht om aan deze menselijke gegevens te komen. Op de Internationale Gezondheids Tentoonstelling, die in 1884 in South Kensington werd gehouden, had Galton een laboratorium ingericht. Tegen een kleine vergoeding konden de bezoekers van alles aan zich laten meten: lengte, gewicht, gehoor, gezicht, gevoel voor kleuren, ademhalingskracht, spanwijdte van de armen enz.. Meer dan 9000 mensen wist hij tot meedoen te bewegen. Een enorme dataverzameling leverde dat op, waaraan hij veel van zijn ideeën kon toetsen. Verder verkreeg Galton veel informatie over familiestambomen door prijzen uit te loven voor degenen die ze het best hadden bijgehouden. Ook zelf had hij al vele gegevens verzameld, met name over belangrijke Engelse families, waarin veel (volgens hem) eminente mensen voorkwamen. Omdat hij in erfelijkheid was geïnteresseerd en vooral in de erfelijkheid van mentale kenmerken ging hij na in hoeverre bij eminente mannen die eminentie ook bij de zonen, de vaders, de broers en bij verdere mannelijke familieleden voorkwam. Het resulaat was dat, wanneer je 100 eminente mannen had opgespoord, hiervan er 26 ook een eminente vader moesten hebben gehad, 23 een eminente broer hadden en 36 een eminente zoon (zie fig. 4). Dat vrouwen ook eminent kunnen zijn is blijkbaar nooit in Galtons hoofd opgekomen; schoonheid was wel een kenmerk die vrouwen konden bezitten, eminentie niet. U kunt zich misschien wel voorstellen dat een interesse in de erfelijkheid van menselijke kenmerken, samen met een grote behoefte om verschijnselen in getallen weer te geven tot het zoeken naar een of andere correlatiemaat kan leiden. Nu heeft Galton zelf niet de ons bekende definitie van de correlatiecoëfficient gegeven, maar het idee van correlatie is wel van hem afkomstig. Al was Galton niet in staat deze concepten wiskundig te formuleren, de statistiek was intussen zo gekwantificeerd en gemodelleerd dat dit zijn leerling Karl Pearson wel lukte. Deze was behalve een eugeneticus ook een knap wiskundige. Pearson heeft de ideeën van zijn ’eminente’ leermeester geformaliseerd en in wiskundige taal gegoten. Hij richtte in 1901 het tijdschrift Biometrika op. In de inhoud van dit tijdschrift herkennen wij het begin van de mathematische statistiek. Maar dan zijn we in de twintigste eeuw aangeland. Slotopmerking: we hebben gezien dat professor Quack in 1876 zijn eeuw karakteriseerde als “de met cijfers bedekte negentiende eeuw”. Quack was niet de enige die de negentiende eeuw op een dergelijke wijze heeft gekarakteriseerd. Aan het einde van de eeuw was er een geleerde, een zekere J.T. Merz, die een uitgebreide geschiedenis schreef van het Europese denken in die eeuw. Hierin is een lang hoofdstuk opgenomen met de titel “Over de statistische kijk op de natuur”. Hierin zegt hij “in feite mogen we onze eeuw -in onderscheid met eerdere eeuwen- karakteriseren als de eeuw van de statistiek”. In de negentiende eeuw ging er daarom van statistische argumentaties een grote overtuigingskracht uit. Deze karakterisering van de negentiende eeuw wordt door de snelle ontwikkeling van de mathematische statistiek in de twintigste eeuw maar al te makkelijk over het hoofd gezien.

VERANTWOORDING

Bij het schrijven van dit artikel is onder meer gebruik gemaakt van reeds bestaande teksten, in het bijzonder van de teksten die als de nummers 8 en 9 in de literatuurlijst zijn opgenomen.

LITERATUUR
    1. I.B. Cohen, “Florence Nightingale”, Scientific American 250 (3) (March 1984), blz. 98-107.
    2. M. Diamond and M. Stone,”Nightingale on Quetelet” (Part 1), Journal of the Royal Statistical Society A 144, (1981), blz. 66-79.
    3. G. Gigerenzer et al, The empire of chance. How probability changed science and everyday life (Cambridge, Cambridge University Press, 1989).
    4. I. Hacking, The taming of chance, (Cambridge: Cambridge University Press, 1990).
    5. D.A. MacKenzie, Statistics in Britain 1865-1930, The social construction of scientific knowledge (Edinburgh: Edinburgh University Press, 1981), blz. 51-72.
    6. T. M. Porter, The rise of statistical thinking, 1820-1900 (Princeton, Princeton University Press, 1986).
    7. R. Rubens, “Florence Nightingale, grondlegster van de verpleegkunde. Haar verbondenheid met Quetelet en het wetenschappelijk denken”, Geschiedenis der geneeskunde 1 (1) (Oktober, 1993), blz. 56-64.
    8. I. H. Stamhuis, ‘Cijfers en aequaties’ en ‘kennis der staatskrachten’. Statistiek in Nederland in de negentiende eeuw (Amsterdam: Rodopi, 1989).
    9. I. H. Stamhuis, 1995/6, “‘De met cijfers bedekte negentiende eeuw’ Deel 1: Adriaan Kluit, eerste Nederlandse hoogleraar in de statistiek”, Euclides. Vakblad voor de Wiskundeleraar 71, blz. 80-84. Deel 2: Adolphe Quetelet, bepleiter van de statistische middelmaat”, Euclides.71, blz. 110-115. Deel 3: Florence Nightingale: statistiek de belangrijkste wetenschap”, Euclides 71, blz. 182-187. Deel 4: Francis Galton: geen statistische middelmaat, maar superioriteit”, Euclides 71, blz. 218-222.
    10. I. H. Stamhuis en A. de Knecht-van Eekelen (red.), ‘De met cijfers bedekte negentiende eeuw’. Toepassing van statistiek en waarschijnlijkheidsrekening in Nederland en Vlaanderen tussen 1840 en 1920. Themanummer van Gewina. Tijdschrift voor de geschiedenis der geneeskunde, natuurwetenschappen, wiskunde en techniek. (Rotterdam: Erasmus Publishing, 1992).
    11. C. Woodham-Smith, Florence Nightingale, 1820-1910. (Constable, London, 1951).