Wie würde folgender Satz “Das Wort Köln beinhaltet kein ß” als URL aussehen: Das+Wort+K%F6ln+beinhaltet+kein+%DF
. Diese und einige weitere Infos gibt es hier:
- HTML URL-encoding Reference – siehe oben.
- HTML 7-BIT ASCII Reference – was ergibt
~
? - HTML 4.01 Entities Reference – was ist
Ö
? - HTTP Status Messages – was bedeutet “500 Internal Server Error”?
Die Sonderzeichen könnte man aber auch anders codieren, wie man z. B. an folgender URL sieht: http://de.wikipedia.org/wiki/%C3%9F (%C3%9F ist das ß).
Oder, was ich persönlich wichtiger finde, in UTF(-8):
Unicode-Tabellen – Was sind Hex-Werte?
Der Simon
Obacht beim HTML-Entity-Kodieren von Textpassagen in Weblog-Artikeln: Es kann passieren, dass einem die RSS-Feeds ungültig/fehlerhaft werden, denn RSS ist XML und wird als solches von RSS-Readern geparst, wogegen Entities »nur« HTML sind*). Mir ist es schon öfter passiert, dass ich bloß ein
»
setzen wollte und schwupps, war der Feed tot und der Feedreader zeigte einen XML-Syntaxfehler an.*) Bevor ich das nicht genauer ergründet habe und eine andere Fehlerursache (Zeichensatz-Übertragung von HTML nach Feed o.ä.?), setze ich sicherheitshalber Sonderzeichen immer dezimal kodiert.
@Boris,
diese Erfahrung habe ich auch gemacht. Zumindest glaube ich das in den WordPress-Versionen (<1.5) öfters die Ursache dafür war das der Feed auf einmal nicht mehr funzte: weil z.B. ein
»
irgendwo auftauchte.