Hoofdstuk 20. Machinevertaling

1. Introductie
2. Google Translate
3. OmegaT-gebruikers en Google Translate
4. Belazar
5. Apertium
6. Machinevertaling - probleemoplossing

1. Introductie

Tegengesteld aan de door de gebruiker gegenereerde vertaalgeheugens (zoals in het geval van OmegaT) gebruiken programma's voor machinevertaling (MT) op regels gebaseerde linguïstische programma's om een vertaling van de bron te maken zonder dat een vertaalgeheugen nodig is. Statistische leertechnieken, gebaseerd op bron- en doelteksten, worden gebruikt om een vertaalmodel te bouwen. Services voor machinevertalingen hebben goed en steeds betere resultaten behaald in research evaluaties.

Ga naar Opties > Machinevertaling... en activeer de gewenste service om een van de services voor machinevertaling te activeren. Onthoud dat zij allemaal op het web gebaseerd zijn: u zult online moeten zijn als u ze wilt gebruiken.

2. Google Translate

Google Translate is de service, die wordt aangeboden door Google, om zinnen, websites en complete teksten te vertalen tussen een nog steeds groeiend aantal talen. Op het moment van schrijven bevat de lijst meer dan 50 talen, van Albanees tot Jiddisch, inclusief natuurlijk alle grote talen.

De kwaliteit van de vertaling is aan de ene kant natuurlijk afhankelijk van het reservoir aan teksten in de doeltaal en de beschikbaarheid van hun meertalige versies, aan de andere kant ook van de kwaliteit van de gebouwde modellen. Het is haast wel zeker dat, hoewel de kwaliteit in sommige gevallen onvoldoende kan zijn, het uiteindelijk mettertijd beter zal worden en niet slechter.

3. OmegaT-gebruikers en Google Translate

De gebruiker van OmegaT is niet gedwongen om Google Translate te gebruiken. Indien het wordt gebruikt zal de beslissing van de gebruiker om de vertaling te accepteren, noch de uiteindelijke vertaling beschikbaar worden gemaakt voor Google. Het volgende venster geeft een voorbeeld weer van a) de Engelse bron b) Spaanse en c) Sloveense vertaling in Google Translate.

Figuur 20.1. Google Translate - voorbeeld

Google Translate - voorbeeld

De Spaanse vertaling is beter dan de Sloveense. Merk op dat interesar en navegar in het Spaans correct zijn vertaald als respectievelijk de werkwoorden interest en sail. In de Sloveense versie worden beide woorden vertaald als zelfstandige naamwoorden. Het is eigenlijk zeer waarschijnlijk dat de Spaanse vertaling, ten minste gedeeltelijk, is gebaseerd op de actuele vertaling van het boek.

Vanaf het moment dat de service is geactiveerd zal er een suggestie voor de vertaling verschijnen in het venster Machinevertaling voor elk nieuw bronsegment dat wordt geopend. Indien u de suggestie acceptabel vindt, druk op Ctrl+M om het doelgedeelte van het geopende segment te vervangen. In het segment hierboven, bijvoorbeeld, zou Ctrl+M de Spaanse versie overschrijven met de Sloveense suggestie.

Indien u niet wilt dat OmegaT uw bronsegmenten verstuurt naar Google om te worden vertaald, verwijdert u het vinkje vóór het menuitem Google Translate in Opties.

Onthoud dat er niets anders dan het bronsegment wordt verzonden naar de service van de machinevertaling. De online versie van Google Translate maakt het de gebruiker mogelijk om de suggestie te corrigeren en het gecorrigeerde segment in te sturen. Deze mogelijkheid is echter niet geïmplementeerd in OmegaT.

4. Belazar

Belazar is een programma voor machinevertaling voor een Russisch - Wit-Russisch taalpaar.

5. Apertium

Apertium is een gratis/open-bron platform voor machinevertaling, initieel gericht op gerelateerde taalparen, zoals CA, ES, GA, PT, OC en FR maar recent uitgebreid om ook minder gangbare taalparen (zoals Engels-Catalaans) te behandelen. Controleer op de website voor de laatste lijst van geïmplementeerde taalparen.

Het platform levert

  • een taal-onafhankelijk programma voor machinevertaling

  • om de linguïstische gegevens te beheren die nodig zijn om een systeem voor machinevertaling te bouwen voor een bepaald taalpaar en

  • linguïstische gegevens voor een groeiend aantal taalparen

Apertium gebruikt een oppervlakkig overdrachtprogramma voor machinevertaling die de invoer in gedeelten verwerkt, zoals in een lopende band: opmaak verwijderen, morfologische analyses, doorverwijzen van spraakgedeelten, oppervlakkige structurele overdracht, lexicografische overdracht, morfologische generatie, en opnieuw opmaken.

Het is mogelijk om Apertium te gebruiken om systemen voor machinevertalingen te bouwen voor een variëteit aan taalparen; voor dat doel gebruikt Apertium eenvoudige op XML gebaseerde standaard formaten om de benodigde linguïstische gegevens te coderen (ofwel met de hand of door het converteren van bestaande gegevens), die zijn gecompileerd met behulp van de verschafte programma's in de formaten voor hoge snelheid zoals die gebruikt worden door het programma.

6. Machinevertaling - probleemoplossing

Indien er niets verschijnt in het venster Machinevertaling, controleer dan het volgende:

  • Bent u online? U moet online zijn om een programma voor machinevertaling te kunnen gebruiken.

  • Wat is het taalpaar dat u nodig hebt? Controleer of de geselecteerde service het aanbiedt.