UTF-8 – Eine Einführung

UTF-8 ist eine Zeichenkodierung, die nahezu alle Schriftzeichen der Welt in digitalen Texten darstellen kann. Sie wurde im Rahmen des Unicode-Standards entwickelt und kann alle 1.112.064 gültigen Unicode-Codepunkte mit ein bis vier Bytes pro Zeichen codieren. Stand 2025 sind mehr als 98 % aller Webseiten in UTF-8 kodiert. Dieser Blog-Artikel gibt eine Einführung in UTF-8 inklusive Abgrenzung zu andern Textkodierungen sowie ein paar praktische Tipps zum Abschluß.

Mehr lesen