ChatGPT van OpenAI faalt bij het beantwoorden

Het is inmiddels bijna 6 maanden geleden dat OpenAI's ChatGPT is uitgebracht. Sterker nog, het bedrijf heeft onlangs ChatGPT 4 gelanceerd. Deze technologie heeft de wereld nu naar een nieuw niveau gebracht.

ChatGPT is een taalmodel dat wordt aangedreven door AI en getraind is om een aantal activiteiten uit te voeren, waaronder het vertalen van talen, het samenvatten van informatie en het beantwoorden van vragen. De uitzonderlijke mogelijkheden van het model zijn veelvuldig opgemerkt en als gevolg daarvan beginnen veel mensen hun arbeidsperspectieven in twijfel te trekken.

Model GPT-4 voor taalverwerking kan worden gebruikt om enorme hoeveelheden gegevens te analyseren, waarna het inhoud kan genereren op basis van de bevindingen van de analyse. Bovendien kan de nieuwe technologie grote hoeveelheden tekst analyseren om consumenten informatie te geven over een specifiek gegevenspunt.

Er bestaat geen twijfel dat technologie nog lang zal blijven bestaan. Natuurlijk helpt het gebruikers op talloze manieren. Op ontelbare gelegenheden heeft het zijn vermogen getoond om alles te doen, van het schrijven van scripts tot het oplossen van de moeilijkste vraagstukken. Er is niets wat ChatGPT niet kan bereiken. Echter, er zijn ook enkele dingen die moeilijker zijn voor ChatGPT.

1. De door kunstmatige intelligentie aangedreven ChatGPT leed een tegenslag toen het niet slaagde voor het felbegeerde Joint Entrance Examination (JEE) in India. Het Joint Entrance Examination staat bekend om zijn moeilijkheidsgraad en trekt elk jaar duizenden studenten die geïnteresseerd zijn in toelating tot de meest prestigieuze ingenieursscholen in India. Het is een van de moeilijkste kwantitatieve examens die complexe diagrammen en getallen bevatten.

Studenten die geïnteresseerd zijn in het bijwonen van prestigieuze onderwijsinstellingen zoals IITs en NITs moeten eerst slagen voor het gezamenlijke toelatingsexamen. Volgens de berichten presteerde ChatGPT niet goed op het JEE Advanced-examen.

De resultaten van ChatGPT's prestatie in de test waren minder dan bevredigend, omdat het slechts 11 van het totale aantal vragen op het papier kon oplossen.

2. ChatGPT is in het verleden succesvol gebleken bij verschillende prominente en moeilijke tests. Indrukwekkend genoeg heeft ChatGPT alle 200 vragen van het Nationale Toelatingsexamen en Entree Examen voor Medische Universiteiten (NEET) geprobeerd en succesvol beantwoord. Dit examen vereist dat kandidaten 180 vragen van de in totaal 200 beantwoorden.

Ondanks dit heeft de ChatGPT alle 200 vragen geprobeerd te beantwoorden, en de resultaten van zijn prestaties waren 359 van de 800. Specifiek presteerde ChatGPT uitzonderlijk goed in het biologieonderdeel van de NEET-test, waarbij het nauwkeurigere antwoorden gaf op de gestelde vragen in dat gedeelte. De prestaties van ChatGPT in de NEET-test suggereren dat het de capaciteit heeft om uit te blinken in andere domeinen, ondanks het feit dat het niet geslaagd is voor het JEE Advanced-examen.

De nederlaag die ChatGPT ondervond tijdens de JEE Advanced-test toont de beperkingen aan die zelfs in de meest geavanceerde AI-modellen aanwezig zijn. Ook al heeft kunstmatige intelligentie het potentieel om veel verschillende sectoren te ontwrichten, het heeft nog een lange weg te gaan voordat het kan concurreren met menselijke intelligentie bij moeilijke taken.

De chatbot ChatGPT van OpenAI is opnieuw niet geslaagd voor een competitief onderzoek.

3. ChatGPT heeft op verzoek van Analytics India Magazine (AIM) het examen van de Union Public Service Commission (UPSC) afgelegd. Het UPSC-examen wordt beschouwd als een van de moeilijkste concurrentie-examens ter wereld. Elk jaar doen meer dan 10 lakh (1,000,000) aspiranten mee aan het UPSC-examen, maar slechts 5% van hen slaagt.

AIM heeft ChatGPT voorzien van 100 vragen uit de UPSC Prelims 2022.

De chatbot presteerde slecht op het UPSC Prelims 2022-examen en behaalde slechts 54 van de 100 op Vraagpapier 1 (Set A), terwijl de vereiste score 87,54 was. Dit betekent dat ChatGPT niet is geslaagd voor de UPSC-test.

De vragen waren gebaseerd op onderwerpen in Indische algemene wetenschap, geschiedenis, geografie, economie, ecologie en actuele gebeurtenissen. De chatbot presteerde goed bij vragen over locaties en economieën, maar faalde jammerlijk bij het beantwoorden van historische gebeurtenissen die plaatsvonden vóór het jaar 2021.

Het feit dat de gegevensset van ChatGPT alleen tot 2021 reikt, is waarschijnlijk de beslissende factor in het onvermogen van de AI-bot om alle vragen van het examen correct te beantwoorden.

4. Daarnaast waren de CLAT-examenuitslagen voor ChatGPT eveneens bovengemiddeld. Tijdens het CLAT UG-examen slaagde de AI-tool er slechts in om 50,83 procent van de vragen nauwkeurig op te lossen. ChatGPT was niet succesvol in de categorieën logica en kwantitatieve vragen. Het presteerde echter buitengewoon goed in de categorieën Engels en Actuele Zaken. Als het ging om vragen op basis van concepten, had deze tool het erg moeilijk.

Uitgebracht in november 2022, doet ChatGPT het heel goed in de Verenigde Staten. Deze Artificial Intelligence-technologie is succesvol geweest in het behalen van de United States Medical Licensing Test (USMLE) en verschillende MBA-examens in de VS. Daarnaast is het succesvol geweest in het behalen van de Google Coding Interviews voor Level 3 Engineers.

Veterinaire professionals waren onlangs verrast toen ChatGPT in staat was om de aandoening van een hond correct te diagnosticeren en het leven van het dier te redden.

Veel landen, hebben echter tegenstrijdige standpunten ingenomen over ChatGPT en zijn bereid om krachtige maatregelen te nemen tegen deze nieuwe innovatie. Onlangs is de technologie verboden in twee belangrijke landen, waaronder Duitsland en Italië. Deze landen beweren dat OpenAI's ChatGPT niet over de benodigde veiligheidsmaatregelen beschikt om te voorkomen dat minderjarigen worden blootgesteld aan beledigend materiaal, zoals een leeftijdsverificatiesysteem.

Ulrich Kelber, de Duitse gegevensbeschermingscommissaris, heeft een waarschuwing afgegeven dat Chat-GPT mogelijk verboden kan worden in Duitsland vanwege zorgen over de veiligheid van gebruikersgegevens, vergelijkbaar met wat er in Italië is gebeurd.

Nou, laten we eens kijken hoe technologie aangedreven door Kunstmatige Intelligentie zich in de toekomst zal gedragen.

Bedankt voor het lezen! Blijf op de hoogte voor meer informatieve artikelen!

Top OpenAI's ChatGPT mislukt bij het beantwoorden

Gerelateerde Artikelen