Zeichensätze und -kodierung – Anwendungsentwickler-Podcast #32

This entry is part 1 of 14 in the series Lernzielkontrollen

In der zweiunddreißigsten Episode des Anwendungsentwickler-Podcasts gehe ich einige Fragen aus meiner Lernzielkontrolle zum Thema Zeichensätze und -kodierung durch.

Probeabo bei Audible (Affiliate)

Inhalt

  • Zeichensatz vs. Zeichencodierung
  • ASCII: 7 Bit, lateinische Buchstaben, Zahlen usw.
  • Wichtige Sonderzeichen: Line Feed (\n, Position 10), Carriage Return (\r, Position 13)
    • Windows-Zeilenumbrüche: \r\n, Linux: \n
  • zusätzliches Bit -> ISO 8859
  • ANSI vs. ASCII
  • Unicode vs. UTF-8
  • Häufige Fehler
    • Sonderzeichen werden als Fragezeichen dargestellt: Text ist in ISO 8859 codiert, wird aber als UTF-8 interpretiert
    • Sonderzeichen werden als zwei andere Zeichen dargestellt: Text ist in UTF-8 codiert, wird aber als ISO 8859 interpretiert

Literaturempfehlungen

Links

Lernzielkontrollen

HTML – Anwendungsentwickler-Podcast #33
Polyglot Clean Code Developer
About the Author
Ausbildungsleiter für Fachinformatiker:innen Anwendungsentwicklung, IHK-Prüfer und ehemaliger Hochschuldozent für Programmierung und Software-Engineering.

2 comments on “Zeichensätze und -kodierung – Anwendungsentwickler-Podcast #32

  1. Computerlinguist sagt:

    Bei dem Thema fehlt der Link auf die offizielle Unicode-Seite.
    Ist es zu aufwendig, vor dem Podcast mal schnell in BabelMap oder online nachzuschauen, welches Zeichen welchem Codepoint enspricht? (200: Dezimal È, Hexadezimal Ȁ; ü: Dezimal 252, Hexadezimal 00FC, Ü: Dezimal 220, Hexadezimal 00FC) Das Fragezeichen steht für Zeichen, die nicht im Zeichensatz vorhanden sind oder nicht druckbar sind (z. B. die Control-Zeichen am Anfang von ASCII). Das 2. Byte wird auch als Codepunkt interpretiert, genauso wie das erste, wenn das Programm die 2-Byte-Kodierung nicht erkennt.

  2. Stefan Macke sagt:

    Danke für die Ergänzungen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert