![screenshot-2023-03-14-om-1-13-41-nm.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_13_41_pm_da5958b43b.jpg)
De geavanceerde mogelijkheden van ChatGPT, zoals bugfixen van code, het schrijven van een essay of het maken van een grap, hebben geleid tot zijn enorme populariteit. Ondanks zijn mogelijkheden was zijn assistentie tot nu toe beperkt tot tekst - maar dat gaat veranderen.
Op dinsdag onthulde OpenAI GPT-4, een groot multimodaal model dat zowel tekst- als afbeeldingsinvoer accepteert en tekst als uitvoer genereert.
Ook: Hoe je ChatGPT bronnen en citaten kunt laten geven
Het onderscheid tussen GPT-3.5 en GPT-4 zal "subtiel" zijn in informele gesprekken. Echter, het nieuwe model zal aanzienlijk capabeler zijn qua betrouwbaarheid, creativiteit en zelfs intelligentie.
Volgens OpenAI scoorde GPT-4 in de top 10% van een gesimuleerd staafexamen, terwijl GPT-3.5 ongeveer in de onderste 10% scoorde. GPT-4 presteerde ook beter dan GPT-3.5 in een reeks benchmarktests, zoals te zien is in de onderstaande grafiek.
![schermafbeelding-2023-03-14-om-1-40-32-nm.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_40_32_pm_c7577ae6e4.jpg)
Voor de context, ChatGPT draait op een taalmodel dat is afgestemd op een model uit de 3.5-serie, wat de chatbot beperkt tot tekstuitvoer.
De aankondiging van GPT-4 door OpenAI volgde op een toespraak van Andreas Braun, CTO van Microsoft Duitsland, vorige week. Hij zei dat GPT-4 binnenkort beschikbaar zou zijn en de mogelijkheid zou bieden voor het genereren van tekst-naar-video.
Ook: Hoe werkt ChatGPT?
"We zullen volgende week GPT-4 introduceren; daar zullen we multimodale modellen hebben die volledig verschillende mogelijkheden bieden -- bijvoorbeeld, video's," zei Braun volgens Heise, een Duitse nieuwsdienst bij het evenement.
Ondanks dat GPT-4 multimodaal is, waren de beweringen over een tekst-naar-video generator wat overdreven. Het model kan nog geen video produceren, maar het kan wel visuele invoer accepteren, wat een grote verandering is ten opzichte van het vorige model.
Een van de voorbeelden die OpenAI heeft gegeven om deze functie te demonstreren, laat zien hoe ChatGPT een afbeelding scant om erachter te komen wat er grappig is aan de foto, zoals aangegeven door de gebruiker.
![screenshot-2023-03-14-om-1-36-02-nm.jpg](https://static-lib.s3.amazonaws.com/cms/screenshot_2023_03_14_at_1_36_02_pm_af3a113b01.jpg)
Andere voorbeelden zijn onder andere het uploaden van een afbeelding van een grafiek en GPT-4 vragen om berekeningen uit te voeren, of het uploaden van een werkblad en het vragen om de vragen op te lossen.
Ook: 5 manieren waarop ChatGPT u kan helpen bij het schrijven van een essay
OpenAI zegt dat het de tekst-invoermogelijkheid van GPT-4 zal vrijgeven via ChatGPT en de API via een wachtlijst. Je zult nog even moeten wachten op de mogelijkheid om afbeeldingen in te voeren, omdat OpenAI samenwerkt met een enkele partner om dat te starten.
Als je teleurgesteld bent dat er geen tekst-naar-video generator beschikbaar is, maak je geen zorgen, het is geen compleet nieuw concept. Techreuzen zoals Meta en Google hebben al modellen in ontwikkeling. Meta heeft Make-A-Video en Google heeft Imagen Video, die beide gebruikmaken van AI om video te genereren op basis van gebruikersinvoer.