De opkomst van een nieuw soort weten
Over de ontluikende kenniscultuur van het geactiveerde woord.
Beste allemaal,
Hoe we dingen leren en te weten komen over onze wereld is historisch nogal veranderd en diep verweven met de cultuur waar we als mensen onderdeel van zijn en waren. In de wereld van het gesproken woord gingen we in gesprek met onszelf of met elkaar om de werkelijkheid te onderzoeken. Denk bijvoorbeeld aan het Socratische gesprek.
In de wereld van het geschreven woord gingen we onze eigen gedachten en die van andere lezen. En toen we boeken gingen drukken kon een steeds grotere kennisgemeenschap op elkaars ideeën voortbouwen, en ontstond de zoektocht naar een universele taal en methode om het universum mee te onderzoeken: Wiskunde en de wetenschappelijke methode.
Nu het geactiveerde woord (de code die onze gadgets tot leven wekt) een steeds grotere rol krijgt, lijkt het erop alsof daarmee wederom een nieuwe kenniscultuur aan het ontstaan is. Een kenniscultuur waarmee we compleet nieuwe vragen kunnen stellen over de aard van ons bestaan.
Vandaag verken ik de contouren van deze kenniscultuur en waarom deze nu opkomt.
De opkomst van een nieuw soort weten
Christiaan stuurde me deze week een artikel uit de MIT Technology Review met de ronkende titel: ‘Large language models can do jaw-dropping things. But nobody knows exactly why’, en vroeg me het eens te lezen. ‘Want,’ zei hij, ‘als wat daar geschreven wordt waar is, dan klopt ons idee dat generatieve AI’s simpelweg complexe statistische systemen zijn niet helemaal.’
Volgens AI-onderzoekers is er namelijk iets vreemds aan de hand met de Large Language Models (LLM’s - De enorme taalmodellen waar o.a. ChatGPT op draait en die zijn getraind op de inhoud van het halve internet). Het artikel vertelt hoe twee AI-onderzoekers, Yuri Burda en Harri Edwards (beiden werkzaam bij OpenAI), een AI trainden op iets relatief simpels: het optellen van twee cijfers. Wat hun verbaasde was de leercurve van het AI-model: heel lang kon de AI er niks van, totdat het plotseling ‘snapte’ hoe het moest. Een fenomeen dat Burda en Edwards grokking zijn gaan noemen.
Dit is een vreemd leerproces, het is niet hoe een deep learning model zich zou moeten gedragen. Of althans, de statistische wiskunde waarop de ontwikkeling van generatieve AI is gebaseerd voorspelt dit gedrag niet. Met andere woorden, deze modellen zijn zo enorm groot en complex geworden (we hebben het over triljoenen parameters), dat de bestaande wiskunde en wetenschap tekortschieten in het verklaren, en daarmee voorspellen wat er gebeurt in deze AI-modellen.
Het zwartedoosprobleem van AI zit dus nog iets dieper dan gedacht. We kunnen niet alleen niet herleiden hoe een generatief AI-systeem tot een resultaat komt, we snappen ook niet hoe het precies iets leert. Want het is nog steeds een mysterie hoe een LLM ‘snapt’ of ‘weet’ wat taal is. Hiermee bedoelen we niet dat het foutloos kan nadenken of mooi kan schrijven, maar vooral dat het zonder voorkennis van symboliek, metaforen of grammatica toch de meta-structuur of essentie van taligheid uit een oceaan aan teksten kan destilleren.
De manier waarop AI-onderzoekers nu te werk gaan, is dat ze deze enorme AI-modellen benaderen alsof het exotische natuurfenomenen zijn die ze wetenschappelijk pogen te doorgronden. Maar daarvoor hebben ze ook een nieuwe gereedschapskist nodig, een nieuw soort wetenschap.
Zo quote het MIT-artikel Boaz Barak, een computerwetenschapper aan Harvard:
Many people in the field often compare it to physics at the beginning of the 20th century. We have a lot of experimental results that we don’t completely understand, and often when you do an experiment it surprises you.
Een nieuw soort wetenschap
Deze uitspraak deed me denken aan het boek A New Kind of Science uit 02002 van wis- en natuurkundige Stephen Wolfram, die vooral bekend is van zijn geavanceerde wiskundige programmeertaal Mathematica en zoek- en rekenmachine Wolfram Alpha. Zoals de titel van het boek al doet vermoeden, ziet hij een nieuw soort wetenschap voor zich. Een wetenschap die niet is gebaseerd op experimenten in een lab, maar op het draaien en bestuderen van wiskundige experimenten in een computer.
Een bekend voorbeeld van hoe hele simpele wiskundige regels enorme complexiteit kunnen creëeren zijn cellular automata, waarin een wiskundige regel steeds bepaalt welke staat een cel (pixel) heeft en welke invloed die heeft op de buurcellen. Klassieke wiskunde kan cellulaire automata niet goed voorspellen. De enige manier om erachter te komen hoe een bepaalde toestand eruit zal zien, is door het experiment gewoon te draaien.
Hieronder zie je een paar voorbeelden met wat uitleg over hoe een cellulaire automaat precies werkt.
Bepaalde rekenkundige processen zoals cellulaire automata en daarmee ook allerlei processen in de natuur, zoals ecosystemen en het weer, kunnen niet worden gereduceerd tot een elegante wiskundige formule, zoals in de klassieke natuurkunde (bijvoorbeeld E = mc2). Dit fenomeen wordt wel computational irruducibility genoemd.
Echter, hieronder zit een nog veel fundamentelere gedachte: het idee dat het universum zelf een enorm multidimensioneel cellulair automaat is, een enorme rekenmachine, oftewel computer. Dit klinkt wellicht nogal kil, Matrix-achtig en nihilistisch, maar het heeft historische wortels in een soort spiritueel-filosofische zoektocht naar de taal van God, en daarmee de taal waarmee de wereld geschapen zou zijn.
Zo geloofde wiskundige en filosoof Leibniz, die de binaire calculus – het rekenen met slechts 0’en en 1’en – uitvond, dat zijn binaire taal de manifestatie was van het christelijke creatio ex nihilo, het idee dat alles uit niks is geschapen. Leibniz was daarnaast ook gefascineerd door het verre China en hij vond bevestiging van zijn idee dat een binair systeem wel een universele taal moest zijn, toen hij via een Jezuïtische missionaris de I Ching in handen kreeg. Een oeroud handboek waarmee je door onderbroken (yin) en doorlopende strepen (yang) op verschillende manieren te combineren de waarheid zou kunnen zeggen.
Wanneer we de pop-culturele verbeeldingen van een rekenend universum, zoals in The Matrix, achter ons laten, zien we dat ook in de natuurwetenschappen de fundamentele paradigma’s de laatste honderd jaar nogal zijn verschoven. Het lijkt er steeds meer op dat het universum zich niet gedraagt als een ingenieus mechaniek dat zich laat beschrijven door een set elegante wiskundige formules, maar dat het universum in essentie met elkaar verstrengelde en interacterende informatie is.
Maar voordat we in deze rabbit hole verdwijnen, terug naar onze AI-wetenschappers.
Je zou kunnen zeggen dat de enorme LLM’s die met een relatief simpel proces zijn getraind tot enorme complexiteit hebben geleid. Niet ongelijk cellulaire automata. Een complexiteit waarin patronen besloten liggen die blijkbaar zoiets ongrijpbaars als taligheid hebben weten te vatten.
Het lijkt erop dat we aan de vooravond van een nieuw soort wetenschap staan.
Een derde kenniscultuur?
Heen-en-weer-append kwamen Chris en ik tot de conclusie dat alle ontwikkelingen in AI eigenlijk vooral duidelijk maken dat concepten zoals ‘intelligentie’, ‘intuïtie’ en ‘bewustzijn’, concepten die op een of andere manier onze denkwereld beschrijven, erg onduidelijk zijn. Wetenschappelijk gezien zijn het ongrijpbare en soms zelfs onmeetbare fenomenen. Althans, met de kennis die we nu hebben.
Voor de nieuwe wetenschap zoals Stephen Wolfram hem voor zich ziet, is de computer in zekere zin een nieuw soort laboratorium. Zoals natuur- en scheikundigen met telescopen en microscopen dieper in onze realiteit kijken en het gedrag van deze realiteit pogen te beschrijven met wiskunde, zo is de computer zelf een nieuw soort gereedschap dat met de opkomst van kunstmatige intelligentie iets kan zeggen over wat ‘denken’ en ‘taal’ en ‘intelligentie’ eigenlijk is.
Misschien kunnen we spreken van de opkomst van een derde wetenschap of kenniscultuur, naast de twee die C.P. Snow in 01959 in zijn beroemde essay ‘The Two Cultures’ zo kenmerkend schetste: de wiskundige cultuur van de natuurwetenschappen en de intellectuele cultuur van de humanitas. In het essay beklaagt Snow zich erover dat er vaak onbegrip is tussen deze twee culturen, die elk een belangrijke plek in onze moderne samenleving vervullen en dat dat een gevaar voor onze samenleving is.
We schreven er lang geleden al eens over:
Maar dit is niet het complete plaatje. Met de opkomst van de moderne samenleving werd ook het zaadje geplant voor een derde cultuur. Wanneer we onze huidige samenleving vergelijken met de Middeleeuwen, dan is de schaal en de complexiteit van de kunstmatige wereld die de moderne mens om zich heen heeft opgetrokken werkelijk duizelingwekkend.
Onze hoogtechnologische moderne wereld is gebouwd, ontworpen en wordt beheerd met allerhande wereldwijde systemen die van elkaar afhankelijk zijn. Een soort natuurfenomeen dat zijn eigen kenniscultuur heeft ontwikkeld. Een kenniscultuur die vooral wordt beheerst door ontwerpers, nerds, technici, computerprogrammeurs en ingenieurs.
Deze bouwers en ontwerpers van de kunstmatige wereld hebben andere culturele waarden en praktijken dan natuurwetenschappers of filosofen. Ze leren door te doen en ontdekken hoe iets werkt door te bouwen. Deze alternatieve kenniscultuur komt gestaag in beeld vanaf de tweede helft van de twintigste eeuw.
In 01932 schrijft de Britse filosoof en wiskundige Alfred North Whitehead:
There are three main roads along which we can proceed with good hope of advancing towards the best balance of intellect and character: these are the way of literary culture, the way of scientific culture, the way of technical culture. No one of these methods can be exclusively followed without grave loss of intellectual activity and of character.
Design researcher en academicus Nigel Cross benoemt in ‘Designerly Ways of Knowing’ (01982) ontwerpen als derde kenniscultuur. De inzichten uit dit essay zijn samengevat in het onderstaande schema:
En futuroloog en schrijver Kevin Kelly had een vooruitziende blik, hij schreef in 01998 het volgende:
Scientists would measure and test a mind; artists would contemplate and abstract it. Nerds would manufacture one. Creation, rather than creativity, is the preferred mode of action.
De kenniscultuur van het geactiveerde woord
De opkomst van deze derde kenniscultuur lijkt ook aardig goed te passen in ons World Tree Model dat de drie kennistradities van de Homo Nobiles, Economicus en Romanticus respectievelijk verbindt met drie informatietechnologieën: het gesproken geschreven en geactiveerde woord.
De Humanitas (of de Kunsten) is een kenniscultuur waar de zowel de beeldende, talige en podiumkunsten vallen alsook religie, filosofie en geschiednis. Kennistradities die zijn geworteld in de cultuur van het gesproken woord, van fysiek samenzijn, en waar kennisdeling en ontwikkeling verweven zijn met gelokaliseerde sociale structuren en praktijken. Deze kennis die in de humanitas gecultiveerd wordt richt zich dan ook vooral op de mensenwereld. De wereld als een theater, theatrum mundi, waarin het drama van de mensheid wordt onderzocht.
De Natuurwetenschappen, een kenniscultuur waartoe natuur- wis- en scheikunde behoren, een kennistraditie die ontstaat vanuit het geschreven woord en het idee dat de natuur, de schepping, geschreven is een wiskundige taal. Of zoals Galileo het verwoorde:
Het universum is een groots boek dat niet begrepen kan worden zonder de taal te leren en bekend te zijn met de karakters waaruit ze bestaat. Het is geschreven in de taal van wiskunde.
De natuurwetenschappen vloeit voor uit de natuurfilosofie en is geworteld in een geletterde cultuur waarin kennis los komt te staat van de mens: op papier, in boeken en onafhankelijk van tijd en plek. Universele objectieve waarheden over de buitenwereld, de materiële realiteit om ons heen die onafhankelijk verifieerbaar moeten zijn.
De Derde Kenniscultuur ontstaat vanuit het geactiveerde woord. Het woord dat is geschreven in een universele taal (0’en en 1’en) en dat wanneer het draait op een universele machine (een computer) alles kan zijn, zolang je het als een machine kan definiëren. Van typemachine tot (in theorie) een brein of zelfs het universum zelf.
Het geactiveerde woord is in essentie een simulatiemedium, waarin het onderscheidt tussen echt en namaak er voor veel praktische zaken niet meer toe doet, zolang het maar werkt. Zoals de digitale typemachine waarin ik nu typ prima werkt.
Deze kenniscultuur komt gelijk op met het steeds technologischer worden van onze samenleving. Vooral wanneer informatie en communicatie elektronische wordt. Denk aan morse code, telefoonlijnen, radio, verkeerslichten, etc. Muziek kan opeens klinken zonder muzikant, stemmen en beelden worden hoor- en zichtbaar over duizenden kilometers afstand.
Deze drie kennisculturen zijn alledrie onderdeel van onze samenleving, en alledrie zeer waardevol in hoe we naar onszelf kijken en de wereld om ons heen begrijpen. En uiteraard bestaan er tussen de drie culturen allerlei overlappen en wisselwerkingen.
De sociale wetenschappen engageren zich uitdrukkelijk met de menselijke conditie maar combineert dit met de kwantitatieve methodes uit de natuurwetenschappen.
Ontwerpers en andere toegepaste kunsten bewegen zich vooral op het snijvlak tussen de kunsten en de derde kenniscultuur. In die zin zijn ze de vormgevers van (letterlijk) de interface tussen de menselijke conditie en onze technologische wereld. Hier lijkt Cross z’n schema vooral goed op aan te sluiten.
En dan is er nog de Nerd-culture van Kevin Kelly. De computerprogrammeurs en andere technici, die goed geletterd zijn in de natuurwetenschappelijke taal en wiskunde, maar daarmee niet onderzoek doen, maar de fysieke wereld bouwen.
Zo bezien lijkt er met de recente sprong in schaal en complexiteit van het rekenkundige universum (zoals bij LLM’s) er een nieuw soort vorm van fundamentele kennisontwikkeling bij te komen. Eentje die de werkelijkheid op compleet nieuwe manieren zal bevragen, en wellicht in de nabije toekomst paradigma verschuivende inzichten zal brengen over wie we zijn, en wat onze plek in het universum is.
C’est ça voor deze week. Een heel fijn weekend gewenst en zoals altijd ben ik benieuwd naar jullie gedachten.
Veel liefs,
☯ Edwin
Aangaande het "emergent behaviour" van LLM's: Yann LeCun zegt er interessante dingen over. Hij is het niet met jullie eens dat er iets 'dieps' gebeurt. Het is nog steeds gewoon statistiek, alleen laten we ons voor de gek houden. We zien een schaap in de wolken. Zie: https://www.youtube.com/watch?v=5t1vTLU7s40