Level 1

Diakritika werden nach Möglichkeit mittels der Unicode-Entitäten aus dem Combining Diacritical Marks Unicodeblock realisiert, z. B. das hochgestellte o über u bzw. U (ͦ, COMBINING LATIN SMALL LETTER O).

Bei der Nutzung von kombinierbaren Zeichen ist zuerst das Grundzeichen und danach "nahtlos" das Diakritikum zu schreiben (z.B. uͦ uͦ).

Die Schreibung für das c-Cedille (ç, U+00E7, LATIN SMALL LETTER C WITH CEDILLA), die e caudata (ę, ę, LATIN SMALL LETTER E WITH OGONEK) in der Bedeutung ae oder das e mit Trema (ë, ë, LATIN SMALL LETTER E WITH DIAERESIS) erfolgt nicht unter Nutzung er Combining Diacritical Marks.

Die Grundlage für die Transkription bildet der deutsche bzw. lateinische Zeichensatz. Zeichen anderer Alphabete (Griechisch, Kyrillisch, Hebräisch etc.) werden mittels ihrer entsprechenden Unicode-Entitäten realisiert. Gültig ist der Unicode-Standard zum Zeitpunkt der Erfassung. Die Unicode-Listen, die eine Vielzahl der Fälle abdecken, finden sich unter http://www.unicode.org/charts/.

Die wichtigsten Listen im Überblick: