Wordbee: PDF als Word (Nur Text) speichern

Wer den PDF Konvertor von Wordbee nicht benutzt, muss andere PDF zu WORD Konverter nutzen.
Nun kann es sein, dass das konvertierte Ergebnis als Word nach dem Import in Wordbee zu diesem Ergebnis führt:
Snap_2014.12.16_21h40m19s_001_

Diese vielen Tags machen eine Übersetzung und eine Kontrolle fast unmöglich. Der wordbee Support wurde gefragt, ob und wie man ein Word-Doc als TEXT ONLY importieren kann.

Wordbee schreibt dazu zurück:
There is an option called „OCR (Optical Character Recognition) noise reduction. Applies heuristics to remove typical superfluous formatting in OCR results.“ which reduce the tags involved by a Pdf to Word conversion, please see screenshot:

Capture
Manchmal klappt es selbst mit dieser Einstellung nicht und es ist nötig das PDF als Text Only zu speichern und dieses Textfile in Wordbee importieren.

Wie macht man es?

  • PDF als Word speichern (mit einem Konverter oder am besten direkt im Adobe Acrobat (nicht Reader).
  • Word als TEXT ONLY speichern
    Snap_2014.12.16_21h50m16s_004_
    Nun muß man die Kodierung beachten, hier z.B. Tschechisch. Word hilft mit einem Hinweis:
    Snap_2014.12.16_21h49m07s_003_So gespeichert würden die Umlaute fehlen.
  • Daher wird der Zeichensatz auf UTF-8 umgestellt :Snap_2014.12.16_21h48m29s_002_
  • Das war es! Nun kann man den Text mit allen Umlauten in Wordbee importieren

Es gibt jedoch noch eine andere Möglichkeiten …

1. Text mit copy paste in Notepad einfügen:

2. Oder sämliche Formatierumg im Word-Dokument  entfernen:
Snap_2014.12.17_20h44m26s_004_