Wer den PDF Konvertor von Wordbee nicht benutzt, muss andere PDF zu WORD Konverter nutzen.
Nun kann es sein, dass das konvertierte Ergebnis als Word nach dem Import in Wordbee zu diesem Ergebnis führt:
Diese vielen Tags machen eine Übersetzung und eine Kontrolle fast unmöglich. Der wordbee Support wurde gefragt, ob und wie man ein Word-Doc als TEXT ONLY importieren kann.
Wordbee schreibt dazu zurück:
There is an option called „OCR (Optical Character Recognition) noise reduction. Applies heuristics to remove typical superfluous formatting in OCR results.“ which reduce the tags involved by a Pdf to Word conversion, please see screenshot:
Manchmal klappt es selbst mit dieser Einstellung nicht und es ist nötig das PDF als Text Only zu speichern und dieses Textfile in Wordbee importieren.
Wie macht man es?
- PDF als Word speichern (mit einem Konverter oder am besten direkt im Adobe Acrobat (nicht Reader).
- Word als TEXT ONLY speichern
Nun muß man die Kodierung beachten, hier z.B. Tschechisch. Word hilft mit einem Hinweis:
So gespeichert würden die Umlaute fehlen. - Daher wird der Zeichensatz auf UTF-8 umgestellt :
- Das war es! Nun kann man den Text mit allen Umlauten in Wordbee importieren
Es gibt jedoch noch eine andere Möglichkeiten …
1. Text mit copy paste in Notepad einfügen:
2. Oder sämliche Formatierumg im Word-Dokument entfernen: