Tabellen

Die Erfassung des Textes in Tabellen erfolgt grundsätzlich vorlagengetreu im Unicode-Format (Kodierung in UTF-8) des zum Zeitpunkt der Erfassung gültigen Unicode-Standards. Die Schreibung von Zeichen, die nicht auf der Tastatur abgebildet sind, erfolgt entweder

  • als Unicode Hexadezimal-Entität oder
  • als Zeichen.

Eine Mischung von verschiedenen Unicode-Schreibungen ist zu vermeiden. Auf modernisierende Veränderungen ist zu verzichten, sowie Druckfehler sind zu übernehmen.

Ausnahmen und Abweichungen davon werden ausführlich in diesem Dokument besprochen.

Die Struktur der Tabelle wird als Attributwerte im Element TableRegion angegeben. Sie dazu die Dokumentation des PageXML-Formates.