UTF-8 (UCS Transformation Format 8-Bit) ist eine Zeichencodierung aus dem Jahr 1992, welche aus einer speziell kodierten 8-Bit-Folge besteht. 7-Bits werden dazu genutzt Zeichen darzustellen und das letzte Bit dient zur Verknüpfung weiterer Bytes. In der Standardvariante entspricht UTF-8 also dem ASCII-Code und kann 2^7 = 128 Zeichen darstellen.