Skip to main content

Einleitung

Texte werden heute in den unterschiedlichsten Dateiformaten erstellt. Nicht jedes Dateiformat eignet sich jedoch gleich gut für die Übersetzung. Die Wahl des Dateiformats für die Übersetzung bietet ein weiteres Potenzial zur Einsparung von Übersetzungkosten. In diesem Kontext sollten ebenfalls die Häufigkeit der Übersetzung bestimmter Dokumentarten, die Anzahl der Zielsprachen, der Verwendungszweck (interne vs. externe Kommunikation) und das Layout der übersetzten Dokumente berücksichtigt werden.

PDF-Dokumente

PDF ist eines der am häufigsten verwendeten Formate in der Übersetzung. Auch wenn die meisten Übersetzungs-Tools heute PDF-Dateien verarbeiten können, ist die Bearbeitung oft mühsam und das Ergebnis nicht zufriedenstellend. Besonders gescannte PDF-Dateien ggf. mit handschriftlichen Notizen oder Kommentaren stellen hierbei eine besondere Herausforderung dar.

Jede PDF-Datei wird beim Import in ein Übersetzungs-Tool im Hintergrund in ein bearbeitbares Format (meist Word oder Text) konvertiert, da der Text in PDF-Dateien nicht direkt bearbeitbar ist. Je nach Ursprung der PDF-Datei und Qualität des verwendeten Konverters sind die Ergebnisse mehr oder weniger gut. Formatierungen gehen oft verloren, teilweise geht der Sinnzusammenhang zwischen Textteilen verloren, Kopf- und Fußzeilen werden mehrfach importiert etc. Die Folge: Es wird mehr Text übersetzt (und bezahlt). Das übersetzte Zieldokument muss nachträglich gelayoutet und wieder ins PDF-Format konvertiert werden. Es entsteht in den meisten Fällen Zusatzaufwand für die Dateivor- und -nachbereitung. 

Microsoft Office-Dateiformate

Word, Excel und PowerPoint sind immer noch die am häufigsten übersetzten Dateiformate. Die vielfältigen Bearbeitungsmöglichkeiten und die unterschiedlichen Verwendungsweisen von MS Office-Produkten haben jedoch zur Folge, dass Office-Formate oftmals in der Übersetzung Probleme machen und nicht immer korrekt automatisch verarbeitet werden.

Sollen Kommentare in Word- oder Excel-Dokumenten oder Sprechernotizen in PowerPoint-Präsentationen übersetzt werden? Wie soll mit noch nicht akzeptierten Änderungen in Word-Dokumenten verfahren werden? Wie mit eingebetteten Inhalten und Objekten? Können Dateien mit Makros übersetzt werden? Manuelle, oft inkonsistente Formatierungen führen dazu, dass das Layout und die Übersetzung angepackt werden müssen. Ein typisches Phänomen sind bei Office-Dokumenten gemischtsprachige Dokumente. „Bitte nur den englischen Text übersetzten.“ oder „Bitte nur die gelb markierten Passagen übersetzen.“ – aus Sicht des Autors einfach. Aber wie sollen die Übersetzungs-Tools des Sprachdienstleisters diese Passagen automatisch erkennen, die übrigen Passagen für die Übersetzung sperren und das z.B. wenn wie so oft die gelben Markierungen nicht präzise sind und Buchstaben und Wörter fehlen? Da bei Übersetzungsdienstleistern Übersetzungs-Tools verwendet werden, um automatisch Texte zu analysieren und Angebote zu erstellen, kann es auch vorkommen, dass diese Art von Dokumenten falsch vorbereitet und kalkuliert wird. Fällt dies zu Beginn auf, kann der Projektmanager beim Übersetzungsdienstleister eingreifen und das Dokument vorbereiten, was jedoch einen manuellen Zeitaufwand darstellt, der heute vor dem Hintergrund der immer kleineren Margen bei Wortpreisen bei immer mehr Dienstleistern als Projektmanagement, Dateivorbereitung oder Engineering in Rechnung gestellt wird.

Beispiel MS Word-Dokument mit Kommentaren und Änderungsnachverfolgung

Ein weiteres Problem mit Office-Dokumenten liegt in den Versionsunterschieden z.B. zwischen DOC- und DOCX-Dateien. Neue Features von z.B. Word werden zu Beginn oft nicht von Übersetzungs-Tools unterstützt; bestimmte Textteile dann nicht übersetzt. Hin und wieder kommt es auch vor, dass nach der Übersetzung Dokumente nicht im ursprünglichen Dateiformat gespeichert werden können oder übersetzte Office-Dokumente sich nicht mehr öffnen lassen. Definierte Standards wie Formatvorlagen und Leitfäden zur Erstellung von zu übersetzenden Office-Dokumenten wären ein Lösungsansatz. Die Realität in vielen Unternehmen sieht jedoch leider oft anders aus. Von daher sind Office-Dokumente nur bedingt als Format für die Übersetzung zu empfehlen.

Bilder, Grafiken und Zeichnungen

Bilder, Grafiken und Zeichnungen enthalten oft übersetzbare Texte. Sie sind bei der Übersetzung ebenfalls problematisch, da der Text oftmals nicht direkt bearbeitet werden kann. Viele Übersetzer bzw. Übersetzungsdienstleister verfügen nicht über die erforderliche Bearbeitungssoftware oder das erforderliche Know-How. Ob als JPG-, PNG-, GIF-Dateien oder eingebettet in Word-, Excel-, PowerPoint- oder anderen Dokumenten, Übersetzungs-Tools können den Text nicht für die Übersetzung erkennen und berücksichtigen ihn deshalb auch nicht bei der Wortzählung. Fällt dem Projektmanager oder Übersetzer nicht auf, dass der Text in Bildern übersetzt werden muss, hat oft am Ende der Kunde das Nachsehen. Die fehlenden Texte müssen dann nachträglich abgetippt und übersetzt werden. Fehlen die ursprünglichen offenen, bearbeitbaren Dateiformate (Adobe Photshop, Illustrator etc.) müssen die Übersetzungen dann oft in mühevoller Handarbeit in die Bilder eingepflegt werden. Das Ergebnis: Zeitverzögerung durch manuelle Arbeit bei der Dateivor- und -nachbereitung und Fremdsprachensatz. Die Lösung: Senden Sie möglichst offene Dateiformate in die Übersetzung, in denen Texte direkt bearbeitbar sind. Für Dateiformate wie PSD aus Adobe Photoshop, AI aus Adobe Illustrator oder DXF/DWG aus AutoCad existieren Lösungen, die einen Export und Import von Texten für die Übersetzung ermöglichen, sodass Sie die reinen Texte plus ein Bild als Kontext als Auftrag senden können.

Beispiel Adobe Photoshop-Dokument

Software, Websites und Datenbanken

Microsoft Excel

Egal, ob für die Übersetzung von Software, Websites oder Datenbanken, Entwickler lieben Microsoft Excel-Dateien! Und zwar weil sie denken, dass sie dem Übersetzer einen Gefallen tun. Denn Excel kann ja jeder. Egal aus welchen Quellen die zu übersetzenden Texte ursprünglich stammen, sie werden häufig ins Excel-Format und nach der Übersetzung wieder zurück in das ursprüngliche Format konvertiert. Dabei können die meisten Übersetzungs-Tools heute Software- oder Datenbankdateien direkt verarbeiten. Oft erfordert die Struktur der Excel-Dateien auf Seiten der Übersetzung noch eine Dateivor- und -nachbereitung (Ausblenden von Spalten oder Zeilen, Sperren von Texten oder Platzhaltern etc.). Ohne Dateivor- und -nachbereitung besteht das Risiko, dass nicht übersetzbare Texte (z.B. Software-IDs) übersetzt und berechnet werden. Dies kann später z.B. zu Problemen beim Import in die Software oder Datenbank führen.

Mark-up-Formate: HTML und XML

Texte in Formaten wie HTML und XML sind durch <tags> ausgezeichnet. HTML ist ein standardisiertes Dateiformat, das heute von allen gängigen Übersetzungs-Tools unterstützt wird. Die HTML-Tags geben dem Übersetzer Informationen darüber, was für eine Art Text übersetzt wird.

<h1> = Überschrift 1, <p> = Absatz, <a> = Hyperlink etc.

Während sich die Auszeichnung von HTML-Dokumenten an der Art der Dokumentstruktur bzw. der späteren Ausgabe orientiert, orientiert sich die Auszeichnung in XML-Dokumenten an der Art des Inhalts bzw. des Verwendungszwecks zur Auszeichnung einer Versionsnummer.

<version>1.2</version>

Bei der Wahl der Elemente eines XML-Dokuments ist der Autor frei. So existiert eine unendliche Menge von XML-Formaten. Wie HTML wird auch XML von allen gängigen Übersetzungs-Tools unterstützt. Allerdings muss für jedes XML-Format angegeben werden, welche Teile des XML-Dokuments übersetzbar sind und welche nicht. Für Übersetzungsdienstleister ist es jedoch oft schwierig, dies zu entscheiden. Dabei helfen können Auszeichnungen für nicht-übersetzbare Inhalte in Form von Elementen wie z.B. <notranslate> oder Attributen <version translate="“no“">. Eine weitere Möglichkeit der Verwendung von XML für die Übersetzung ist die Verwendung von Metadaten, wie z.B. die Angabe von Längenbeschränkungen, Kommentaren für Übersetzer etc. Deshalb ist XML ein beliebtes Format für die Übersetzung von Softwaretexten sowie Inhalten aus datenbankgestützten CMS-, PIM-, Katalogsystemen etc. Mittels Stylesheets kann dem Übersetzer während der Arbeit eine Vorschau des Dokuments im Ursprungsformat angezeigt werden, sodass auch der visuelle Kontext berücksichtigt werden kann. XML ist also ein Format, das sich aufgrund seiner Struktur gut für die Übersetzung eignet.

 

Beispiel Magento-XML mit Auszeichnungen für nicht-übersetzbare Inhalte

XLIFF: ein standardisiertes Austauschformat für die Übersetzung

XLIFF (XML Localization Interchange File Format) wurde als eine Antwort auf die stets zunehmende Anzahl von z.T. proprietären Dokumentformaten für den Austausch mit Übersetzungs-Tools entwickelt. Bei XLIFF handelt es sich um einen flexiblen, erweiterbaren Standard. XLIFF ist heute in den meisten Übersetzungs-Tools das interne Arbeitsformat. Es ist zweisprachig und ermöglicht somit auch den direkten Vergleich von Ausgangstext und Übersetzung. Idealerweise benötigt ein XLIFF-Dokument keinerlei Vorbereitung und kann sofort im Übersetzungs-Tool bearbeitet werden. Viele Hersteller von Software, CMS etc. bieten heute XLIFF als ein Format für die Übersetzung an. Allerdings wird der XLIFF-Standard nicht immer korrekt umgesetzt. Wo XLIFF drauf steht, ist nicht immer XLIFF drin.

Einsparpotenzial: mittel bis hoch

Methode: Offene Dateien als Bestandteil des Lieferumfangs definieren und in die Übersetzung schicken, Dateien konvertieren, Verwendung standardisierter Austauschformate für die Übersetzung. Sprechen Sie mit Ihrem Sprachdienstleister, bevor Sie sich irgendwie überlegen wie es laufen könnte: oft hat Ihre Agentur schon eine Lösung parat, die sich in anderen Projekten bewährt hat.

Aufwand: niedrig

Nun wissen Sie, wie wichtig die Auswahl des richtigen Formates bei der Anlage von Texten für die Übersetzung ist. Im nächsten Teil unserer Blog-Reihe erläutern wir Ihnen, wie Sie durch den Einsatz der passenden Übersetzungstechnologie Kosten bei der Übersetzung einsparen können.

Links


Loctimize GmbH
Daniel Zielinski
Försterstraße 19
66111 Saarbrücken
Deutschland

Tel.: +49 681 91038365
Fax: +49 681 91038367
E-Mail: zielinski(at)loctimize.com

Kontakt