L'encodage par défaut utilisé pour les pages XHTML est l'UTF-8, et malheusement cet encodage des caractères (américain) ne prend pas en compte les caractères latins tels que les lettres accentuées (éèûï...), l'euro (€), ..., pour ne parler que de la langue française.
Un texte en français utilisant des lettres accentuées "brutes" ne sera pas lisible par d'autres internautes si le fichier HTML n'est pas encodé en ISO-8859-1 et/ou si le navigateur de l'internaute n'est pas configuré spécifiquement pour lire l'alphabet "occidental".
Pour qu'une page soit lisible par tous quelque soit la langue ou la configuration du navigateur, il est nécessaire de remplacer tous les caractères spéciaux par des entitées HTML.
Exemple pour les lettres accentuées de notre alphabet :
& |
lettre de base : a A e E i I o O u U c C |
accentuation : acute (aïgu) grave (grave) circ (circonflexe) uml (tréma) cedil (cédille) |
; |