
Onderzoek van Apple laat zien dat AI nu nog niet zo intelligent is
Bedrijven als OpenAI en Google geven al een tijd hoog op over ‘de geavanceerde redeneercapaciteiten’ die naar de volgende grote stap zijn voor kunstmatige intelligentie moeten zorgen. Maar
een nieuwe studie van zes Apple ingenieurs toont aan dat die beweringen met een korrel zout genomen kunnen worden.
Want hoewel het op het eerste gezicht allemaal erg indrukwekkend lijkt, kunnen simpele veranderingen AI nog makkelijk van de wijs brengen.

Onderzoek van Apple laat zien dat AI nu nog niet zo intelligent is
De onderzoekers gebruikten onder andere de in taal geformuleerde standaardsommen waarmee in de VS getest wordt welk niveau leerlingen aankunnen. Als die vragen aan op Large Language Model (LLM) gebaseerde AI voorgelegd worden geven die in verreweg de meeste gevallen de juiste antwoorden. Mar wordt daar iets aan toegevoegd, dat voor ons duidelijk irrelevant is, dan kan AI daar nog makkelijk mee in de war gebracht worden.
Zo werd de aan het volgende vraag de schuingedrukte zin toegevoegd:
Oliver picks 44 kiwis on Friday. Then he picks 58 kiwis on Saturday. On Sunday, he picks double the
number of kiwis he did on Friday, but five of them were a bit smaller than average. How many kiwis does Oliver have?
Mensen zullen waarschijnlijk niet snel in de war worden gebracht door de bijzin met de vermelding dat vijf kiwi’s wat kleiner waren dan normaal, maar AI blijkt in veel gevallen nog veel moeite te hebben met dat soort toevoegingen.
De conclusie is dan ook dat op LLM gebaseerde AI nog niet logisch kan redeneren, terwijl de bedrijven die zulk AI gebruik het vaak doen voorkomen alsof dat al wel mogelijk is.
Want volgens het onderzoek vertoonden alle geteste modellen, van kleinere open-source versies zoals Llama tot modellen zoals OpenAI's GPT-4o, een aanzienlijke prestatievermindering wanneer ze werden geconfronteerd met schijnbaar inconsequente variaties in de invoergegevens. De onderzoekers suggereren dat AI misschien neurale netwerken moet combineren met traditionele, op symbolen gebaseerde redeneringen, neurosymbolische AI genaamd, om nauwkeuriger besluitvorming en probleemoplossend vermogen te verkrijgen.