De spraakfunctie van ChatGPT laat je hardop praten met de chatbot in plaats van te typen. Je stelt een vraag met je stem, ChatGPT verwerkt die en spreekt het antwoord terug. De functie is sinds eind 2025 geïntegreerd in het normale chatscherm, zowel in de app als op desktop. In dit artikel lees je hoe je de spraakfunctie aanzet, wat het verschil is tussen de gratis en betaalde variant, en welke beperkingen je moet kennen voordat je erop vertrouwt.
Wat is de spraakfunctie van ChatGPT?
De spraakfunctie van ChatGPT is een manier om met de chatbot van OpenAI te communiceren via gesproken taal in plaats van getypte berichten. Je spreekt je vraag in, ChatGPT genereert een antwoord en spreekt dat terug met een synthetische stem. De functie werkt in meer dan veertig talen, waaronder Nederlands, en is beschikbaar voor alle ingelogde gebruikers op iOS, Android en desktop.
Tot eind 2025 startte je een spraakgesprek in een aparte modus met een blauw bolvormig scherm. Sinds 25 november 2025 is de spraakfunctie standaard geïntegreerd in het normale chatvenster. Je ziet je vragen en de antwoorden gewoon in je chatgeschiedenis verschijnen terwijl je praat, en je kunt eerdere berichten en afbeeldingen blijven raadplegen tijdens het gesprek.
Er is geen apart abonnement nodig om de spraakfunctie te gebruiken. Wel is er verschil tussen wat gratis gebruikers en betalende abonnees krijgen, vooral in dagelijkse gebruiksduur en in het taalmodel dat onder de motorkap draait. Daarover verderop meer.
Spraakfunctie aanzetten in de ChatGPT app
De spraakfunctie aanzetten in de ChatGPT app is een kwestie van een paar tikken. Belangrijk: zorg eerst dat je de meest recente versie van de app hebt geïnstalleerd. Oude versies tonen nog de losstaande spraakmodus en missen recent toegevoegde functies zoals live videoshare.
Open de ChatGPT app op je iPhone of Android-toestel en log in. Je ziet rechts naast het invoerveld een pictogram van een geluidsgolf. Tik daarop om een spraakgesprek te starten. De eerste keer vraagt de app om toegang tot je microfoon. Geef die toestemming, anders werkt de functie niet.
Bij je eerste gesprek kies je een stem. ChatGPT biedt verschillende opties zoals Ember, Juniper, Breeze en Cove, elk met een eigen toon en karakter. Je kunt later via Instellingen, Spraak van stem wisselen. Begin daarna gewoon met praten in het Nederlands. ChatGPT herkent de taal automatisch en antwoordt in dezelfde taal terug.
Wil je liever in een apart scherm praten zonder de chatgeschiedenis erbij, dan kun je dat aanzetten via Instellingen, Spraak, Aparte modus. Daar verschijnt het oude blauwe bolvormige scherm weer.
Spraakfunctie gebruiken in ChatGPT op desktop
De spraakfunctie van ChatGPT werkt op desktop sinds eind 2024 en is sinds november 2025 ook daar geïntegreerd in het hoofdscherm. Je hebt geen aparte applicatie of browserextensie nodig. Wel werkt het alleen op chatgpt.com in de browser of via de officiële desktop-app voor macOS en Windows.
Open chatgpt.com in een moderne browser zoals Chrome, Edge, Safari of Firefox. Log in op je account. Naast het invoerveld onderin staat hetzelfde geluidsgolf-pictogram als in de app. Klik daarop en geef de browser toestemming om je microfoon te gebruiken. Sommige browsers vragen die toestemming bij elke nieuwe sessie, andere onthouden het.
Wat ik in de periode dat ik ChatGPT intensief gebruikte vooral handig vond aan desktopgebruik, is de combinatie van praten en meelezen. Je dicteert een lange opdracht en ziet ondertussen de tekst verschijnen, zodat je direct kunt zien of ChatGPT je instructies juist heeft opgepakt. Voor langere taken werkt dat sneller dan typen, mits je articulatie strak is.
De microfoonkwaliteit van een laptop is over het algemeen voldoende voor herkenbare spraak, maar in een ruimte met achtergrondgeluid loont het om een headset of externe microfoon te gebruiken. Niet voor de geluidskwaliteit, maar omdat ChatGPT bij ruis vaker delen van je vraag mist of verkeerd transcribeert.
Verschil tussen Standard Voice en Advanced Voice Mode
Het verschil tussen Standard Voice en Advanced Voice Mode in ChatGPT zit in het onderliggende model en de gespreksbeleving. Standard Voice zet je gesproken vraag eerst om naar tekst, stuurt die tekst naar het taalmodel, en leest het antwoord daarna voor met een synthetische stem. Advanced Voice Mode draait op een multimodaal model, GPT-4o, dat geluid direct verwerkt en geluid direct teruggeeft. Daardoor reageert het sneller, herkent het toon en emotie, en kun je het onderbreken zoals in een gewoon gesprek.
Voor gratis gebruikers werkt de spraakfunctie op GPT-4o mini, een kleinere variant. De functionaliteit is vergelijkbaar met de premium versie, maar met een dagelijkse limiet van twee uur. Daarna moet je wachten tot de volgende dag. Plus- en Team-abonnees beginnen elk gesprek met GPT-4o en vallen pas terug op GPT-4o mini als ze hun dagbudget hebben opgemaakt. Pro-abonnees hebben in de praktijk vrijwel onbeperkt toegang tot GPT-4o voice.
In de praktijk merk je het verschil het sterkst bij snelle, natuurlijke gesprekken en bij talen die niet Engels zijn. Toen ik de Advanced Voice Mode na de release uitprobeerde, viel mij op dat het Nederlands soepeler klinkt en dat de chatbot een vraag halverwege kan oppakken zonder dat je eerst hoeft uit te praten. Voor wie de spraakfunctie incidenteel gebruikt voor een korte vraag is het verschil beperkt. Voor wie dagelijks lange dictaten of gesprekken voert, is het merkbaar.
De prijs van een ChatGPT-abonnement varieert per plan. Een actuele uitleg van wat je krijgt voor welk bedrag staat in het kennisbankartikel over What ChatGPT costs.
Beperkingen en aandachtspunten bij de spraakfunctie van ChatGPT
De spraakfunctie van ChatGPT brengt beperkingen mee die in geschreven gebruik minder opvallen. De belangrijkste: alles wat ChatGPT in tekstvorm fout doet, doet het in spraakvorm óók. Wie begrijpt how ChatGPT works, snapt ook waarom die controle nodig is. Het verschil met geschreven output is dat je in een spraakgesprek niet meeleest. Een fout in een gesproken antwoord glijdt sneller voorbij dan dezelfde fout in een chatvenster waar je woord voor woord langsgaat.
In de periode dat ik ChatGPT intensief gebruikte voor SEO-werk en contentproductie, kwam ik consistent tegen dat het model bronnen, citaten en cijfers verzint die plausibel klinken. In een geschreven gesprek viel dat op zodra ik op de bron klikte; in een spraakgesprek hoor je een naam of een percentage voorbijkomen en is de neiging om dat onbewust te accepteren een stuk groter. Voor wie de output gebruikt om beslissingen te onderbouwen of om iets onder eigen naam te publiceren, is dat een reëel risico.
Een tweede aandachtspunt zit in het samenvatten. Wanneer je ChatGPT vraagt om een document of een lange uitleg samen te vatten via spraak, krijg je een vlotte, overtuigende samenvatting terug. Die kan inhoudelijk afwijken van de bron op manieren die je in spraakvorm niet kunt verifiëren. Voor LearnLLM-cursisten geldt: behandel een gesproken samenvatting als een eerste indruk, niet als de feitelijke inhoud.
Daarnaast heeft de spraakfunctie praktische beperkingen. Achtergrondgeluid en onduidelijke articulatie verlagen de transcriptie-kwaliteit. Vakjargon en eigennamen worden geregeld verkeerd herkend. Het Nederlands van de uitgesproken antwoorden klinkt soms met een licht Amerikaans accent, wat in zakelijke context wennen is. En je kunt maar één spraakgesprek tegelijk voeren per account.
De manier om de spraakfunctie professioneel in te zetten, is door dezelfde controlepunten te gebruiken als bij geschreven AI-output: een belangrijke uitkomst lees je terug in de transcriptie, een feit verifieer je via een externe bron, en een tekst die naar buiten gaat eindigt altijd met menselijke eindredactie. In mijn eigen werkwijze is die laatste stap geen optie maar onderdeel van de workflow. Een goede uitleg van die werkwijze staat in de ChatGPT course From LearnLLM.
Spraakfunctie professioneel inzetten met de juiste werkwijze
De spraakfunctie professioneel inzetten betekent in de praktijk dat je hem gebruikt waar hij waarde toevoegt en wegblijft waar hij risico oplevert. Goede toepassingen: hardop denken tijdens een wandeling, een eerste opzet dicteren tijdens het rijden, een ingewikkeld concept laten uitleggen terwijl je iets anders doet met je handen, of een buitenlandse taal oefenen. Voor dat soort gebruik werkt spraak vaak prettiger dan typen.
Minder geschikt is de spraakfunctie voor taken waarbij feitelijke nauwkeurigheid telt: cijfers controleren, juridische teksten doornemen, of beleidsstukken samenvatten. Niet omdat de spraakfunctie technisch slechter is, maar omdat de combinatie van een vlotte gesproken stem en het ontbreken van visuele controle de drempel om iets te accepteren verlaagt. Het four-eyes principe uit de financiële sector is hier bruikbaar: niets de deur uit zonder een tweede controle. Dat principe geldt voor AI-output ook, en bij gesproken output extra. Een breder overzicht van wat je met ChatGPT kunt doen in je werk geeft houvast bij die afweging.
De LearnLLM-cursus over ChatGPT leert je hoe je de tool in je dagelijkse werk inzet zonder in te leveren op betrouwbaarheid. Je leert een herhaalbare workflow opbouwen, vaste controlepunten inrichten, en bewust kiezen wanneer spraak en wanneer tekst de betere modus is. Je rondt de cursus af met een werkdossier en een werkende workflow op basis van je eigen taken. Schrijf je in voor de e-learning Professioneel werken met ChatGPT en zet de spraakfunctie in als onderdeel van een verantwoorde aanpak.



