Ik heb nu voor verschillende partijen AI vertaaloplossingen gemaakt Een paar lessen die ik daaruit heb geleerd.


  1. Vertalen met AI werkt heel goed. Ik ging er altijd van uit dat AI vertalingen weliswaar vele malen sneller en goedkoper zijn dan menselijke vertalingen maar dat ze niet dat niveau halen. Daar ben ik nu niet meer zo zeker van. Ik krijg eigenlijk nooit feedback over verkeerde vertalingen. Het werkt gewoon heel goed.
  2. De te vertalen bestanden (Word, Excel, XLIFF, XML, Powerpoint etc.) bevatten vaak veel meer dan allen de rauwe te vertalen tekst. Het is dus aan te bevelen om die platte tekst er eerst uit te halen en die dan aan het AI model te voeren.
  3. Vertaalprompts werken het beste als de prompt niet te lang is. Daarom is het handig om de te vertalen tekst eerst op te splitsen in kleinere stukken en die een voor een aan de AI te voeren.
  4. Sommige zinnen of bijvoorbeeld titels komen meer dan eens voor in de tekst. Daarom is het handig om met caching te werken. Ik sla de vertalingen dan lokaal op om deze niet opnieuw te hoeven vertalen. Dit scheelt snelheid en kosten. Veel moderne AI modellen zoals die van OpenAI en Anthropic hebben ook een eigen caching systeem.
  5. Bij vertalingen binnen een specifiek domein kan een glossary handig zijn: een woordenlijst, gewoon in een Google sheet met vertalingen die specifiek zijn voor jouw branche.
  6. Vaak zijn de goedkope snelle AI modellen zoals Google’s Gemini Flash of Anthropic’s Claude Haiku al heel goed in vertalen. Maar voor complexe zaken is toch een van de zwaardere modellen nodig. Dit zie ik vooral bij tekst met ingewikkelde opmaak of als er parameters in de tekst staan.
    ”Einde van hoofdstuk {hoofdstuknummer}.” wil je niet vertalen met “End of chapter {chapter number}” maar je wil de parameter “hoofdstuknummer” laten staan in de tekst.
  7. AI vertalen is heel veel goedkoper. Een kleine berekening. Stel je hebt een tekst van 20.000 woorden. Een vertaalbureau rekent gemiddeld 13 cent per woord (bron: ChatGPT 😊). Dat komt dan op € 2.600.
    Een goed model (ik neem Claude 3 Sonnet als voorbeeld) kost $3 per miljoen woorden input en $15 per miljoen woorden output. Nu heb je wel wat extra input nodig omdat je de prompt en de glossary en zo ook mee moet geven maar stel dat dat dan op 40.000 woorden komt. Dan is de berekening 40.000 x $0,000003 + 20.000 x $0,000015 = €0,40.

    Dat is een factor 6.500 goedkoper!

Heb je ook geregeld vertaalwerk en wil je eens zien wat AI daar mee kan? Laat het me weten.


Vorige post: De ondergang van remote werk