[PHP] Rétro-compatibilité HTML 4 automatique pour un site en XHTML 1.1

Johan_et_Pirlouit

Grand Maître
(mise à jour du 11/02/2007)


Salut à toutes et à tous :hello:

Je m'excuse par avance de la longueur du topic, mais vous qui faites (du moins, je vous le souhaite) des jolis sites en XHTML 1.0 Strict ou XHTML 1.1, vous remarquez probablement que quelques navigateurs ont des difficultés avec... Je vais donc vous proposer un script PHP pour gérer cela, script conçu d'après quelques lectures de pages Web traitant du sujet ;).

La grosse difficulté vient du type mime du document reçu par le navigateur et ce qu'il est capable de recevoir.. En effet, alors que le HTML 4 se contente du type 'text/html', l'XHTML 1.1 de part sa nature impose normalement le 'application/xhtml+xml'..


1 - Petit rappel

■HTML : HyperText Markup Language, la dernière recommandation HTML 4.01 du W3C date du 24 décembre 1999 >> . (Traduction en français >> )
■XML : eXtensible Markup Language, la recommandation originale (1ère édition) date du 10 Février 1998 >> (Traduction en français >> )
■XHTML : eXtensible HyperText Markup Language, la première recommandation XHTML du W3C est du 26 Janvier 2000 >> . (Traduction en français >> )
■DTD : Document Type Declaration, en-tête indiquant le type de document envoyé au navigateur. Si la DTD est absente, le navigateur passe en mode de rendu "non-standard" et fait ce qu'il peut avec ce qu'il reçoit.. Les surprises sont parfois au rendez-vous :lol:..
■DOCTYPE : nom de la balise employée pour déclarer le type de document.

L'XHTML est en fait une ré-écriture du HTML selon les principes structurels du XML, pour en reprendre les principaux avantages : modularité, simplicité du code par la séparation contenant / contenu, le contenant étant défini par les feuilles de style (CSS, Cascaded Style Sheets). D'où une maintenace simplifiée des sites et des sites mieux adaptables aux différents médias de sortie (écrans, imprimantes, lecteurs vocaux, lecteurs texte, etc). De ce fait, nombre de balises et attributs du HTML 4 ne sont plus utilisés.

Versions du XHTML actuellement utilisées :
■1.0 Strict : version "pure" de l'XHTML.
■1.0 Transitional : version "de transition" acceptant les balises et attributs du HTML 4 dépréciés en XHTML. Ne doit sa présence que pour la migration des anciens sites écrits en HTML 4.
■1.0 Frameset : idem "Transitional" mais pour les sites avec des jeux de cadres, désormais bannis de l'XHTML (pb de référencement par les moteurs de recherche de toutes les pages contenues dans les cadres, résultant des pages orphelines).
■1.1 : évolution du 1.0 Strict par la suppression pure et simple de toutes les balises et attributs désormais inutiles, puisque remplacés par des attributs CSS.. La recommandation XHTML 1.1 du W3C est du 31 Mai 2001 >> . (Traduction en français >> )


2 - les navigateurs

Cependant, peu de navigateurs sont pleinement à jour en matière de standards du Web et ça peut se comprendre : intérêts de l'industrie qui ne vont pas forcément dans les mêmes directions et temps de développement des applications clientes (navigateurs, dans notre cas).

[Petite parenthèse à propos des intérêts de l'industrie : une nouvelle guerre du Web pourrait peut-être voir le jour, si les travaux du groupe de travail WHATWG, composé de Mozilla, Opera et Apple, se poursuivent:
■Geckozone (7 juin 2004, notez les les arguments anti-W3C ;)) : WHATWG : Mozilla, Opera et Safari unis pour préserver le web >>
■XMLfr (3 juin 2005, XTech 2005 : présentation) : Vers une nouvelle guerre du Web ? >>
■XMLfr (4 juin 2005, XTech 2005 : comparaison XHTML 2.0 / HTML 5) : XTech 2005 : deuxième jour >>
Bref, ce WHATWG ne va certainement pas pousser Microsoft à plus de respect des "normes" W3C, puisqu'il propose ni plus ni moins qu'une vulgaire évolution de l'HTML 4, simplement par l'ajout de fonctions toutes plus ou moins spécifiques et, donc, un alourdissant du vocabulaire dispo pour le code (direction inverse de celle préconisée par le W3C)..

Fin de la parenthèse, revenons à nos "moutons".]


Parmi les navigateurs manifestement compatibles XHTML 1.1, puisque reconnaissant le type mime 'application/xhtml+xml', on trouve Firefox toutes versions (tous les navigateurs basés sur Gecko, en fait : Camino, Epiphany, K-meleon, SeaMonkey, Netscape 7+, entre autres) et Opera depuis la version 7 (moteur "Presto")..

Pour ceux qui ne le sont pas, je peux citer IE 5.5 et avant ou les navigateurs basés sur KHTML comme Konqueror ou Safari.. Pour KHTML, ça se "lit" dans les specs du moteur : XHTML n'est pas cité une seule fois ! Idem chez Apple, alors que Safari utilise un KHTML "amélioré".. [edit] En réalité, KHTML "comprend" l'XHTML mais du moment qu'on reste en mode de compatibilité HTML : avec le type de document "text/html", donc..

Vient le cas d'IE 6 : il supporte l'XHTML Strict, mais pas le type mime 'application/xhtml+xml'. De plus, IE ne supporte pas le moindre caractère de code avant le DOCTYPE (X)HTML (aucun pb, en revanche, avec les fichiers 100% XML).. Embêtant pour l'XHTML 1.1 où le prologue XML doit figurer, justement à cet endroit.. Si IE "voit" le moindre bout de code avant le DOCTYPE, il bascule en mode de rendu "quirks", c'est à dire non-standard et voici que votre belle mise en page en prend un vieux coup ! Lorsque IE "voit" une déclaration XML en tête de code, il risque tout bêtement de vous envoyer le code source de la page comme étant du code XML !! J'en ai fait l'amère expérience il n'y a pas deux mois, lorsque je travaillais sur le code du site d'un de nos amis du forum : IE 5.5 et IE 6 unis dans la bêtise :kaola: !! Depuis, je me suis un peu plus renseigné, comme quoi : à toute évolution mésaventure est bonne..

Quant à IE 7, Ô douce surprise de nos "amis" de Redmond :sarcastic: : il supporte bien l'XHTML Strict, mais pas l'XHTML "natif" en 'application/xhtml+xml' ! Du moins, il ne se déclare pas en tant que navigateur le supportant.. On lui appliquera donc la même "sauce" que pour son prédécesseur IE 6, en envoyant de l'XHTML en 'text/html'.. De là à dire qu'IE 7 n'est qu'un IE 6 relooké avec quelques ch'tites améliorations de façade il n'y a qu'un pas que je me garderai bien de franchir.. Car, même s'il reste encore à IE à progresser, il y a tout de même une sérieuse évolution dans la gestion des spécifications CSS et donc dans le rendu global des pages.. Mais il est peu tard pour qu'il me fasse désormais abandonner FF..

Quelques infos de plus (sur Wikipedia, en anglais) : Comparison of layout engines (XHTML) >>


3 - Le script

Le but du script que je vous propose (je rappelle qu'il n'est pas de moi, je ne l'ai qu'un peu adapté) : adapter la DTD (voire carrément le code HTML) envoyée au navigateur du visiteur de votre site, quitte à envoyer du HTML 4.01 à la place de votre beau XHTML 1.1 !!

Les sources (deux pages très bien faites et bien documentées) :
■Développer avec les standards du Web (en français, propose un script du genre, mais très basique) >> .
■Serving up XHTML with the correct MIME type (en anglais, origine du script, avec les explications) >> .

Le script PHP :

Attention : pour que le script fonctionne, votre code doit être parfaitement valide XHTML 1.1 et vos balises parfaitement formées !
[cpp]<?php

// Valeurs par défaut..

$charset = "iso-8859-15"; // Ici le jeu "Occidental (Euro)" (Latin9).. Sinon, le jeu de caractères employé sur le site (chez moi, c'est de l'unicode utf-8)..
$mime = "text/html";
$ob = 0;


// Fonction de transcription du code du XHTML vers le HTML..

function fix_code($buffer) {
return (preg_replace("!\s*/>!", ">", $buffer)); // Typiquement : suppression des fermetures des balises simples : remplacement des ' />' par des '>'..
}


// Test du navigateur..

$navigator = $_SERVER['HTTP_USER_AGENT']; // "Lit" quel est le navigateur client..

if (stristr($_SERVER["HTTP_ACCEPT"],"application/xhtml+xml")) {
// Si navigateur annoncé OK, test de son q_rating..
if (preg_match("/application\/xhtml\+xml;q=([01]|0\.\d{1,3}|1\.0)/i", $_SERVER["HTTP_ACCEPT"], $matches)) {
$xhtml_q = $matches[1];
if (preg_match("/text\/html;q=q=([01]|0\.\d{1,3}|1\.0)/i", $_SERVER["HTTP_ACCEPT"], $matches)) {
$html_q = $matches[1];
if ((float)$xhtml_q >= (float)$html_q) {
$mime = "application/xhtml+xml"; // Cas du q_rating favorable..
}
} // Un q_rating défavorable laissera '$mime' à sa valeur par défaut..
}
else {
$mime = "application/xhtml+xml"; // Cas du q_rating absent..
}
}

// Cas des validateurs du World Wide Web Consortium (W3C) et du Web Design Group (WDG)..
// les adresses sont respectivement :
// - http://validator.w3.org/
// - http://www.htmlhelp.com/tools/validator/
if (stristr($navigator, "W3C_Validator") || stristr($navigator, "WDG_Validator")) {
$mime = "application/xhtml+xml";
}


// Détermination de la DTD..
// Page du W3C répertoriant les DTD valides >>

if ($mime == "application/xhtml+xml") { // Prolog pour les navigateurs ayant passé le test..
$prolog_type = '<?xml version="1.0" encoding="'.$charset.'" ?>'."\n";
$prolog_type .= '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">'."\n";
$prolog_type .= '<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">'."\n";
}

elseif ((eregi("((MSIE (6|7))|(KHTML))", $navigator)) && !eregi("Opera", $navigator)) { // Cas particuliers d'IE 6/7 et de Konqueror/Safari (XHTML est supporté, mais en restant en compatibilité HTML)..
ob_start();
$prolog_type = '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">'."\n";
$prolog_type .= '<'.'html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">'."\n";
}

else { // Prolog pour tous les autres navigateurs..
ob_start("fix_code"); // Conversion du code vers l'HTML 4 et mise en cache sur le serveur de la page ainsi convertie..
$ob = 1;
$prolog_type = '<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">'."\n";
$prolog_type .= '<html lang="fr">'."\n";
}


#############################################################
# Envoi des en-têtes HTTP #
# Affichage du XML et/ou DOCTYPE Prolog #
#############################################################


header("Content-Type: ".$mime."; charset=".$charset); // Envoie depuis le serveur l'en-tête HTTP correspondant au navigateur..
header("Vary: Accept"); // Indique aux systèmes de cache intermédiaires, tels que les serveurs de proxy, que le Content-Type dépend des capacités du client à recevoir le document..

echo $prolog_type."\n"; // Affichage du XML et/ou DOCTYPE Prolog correspondant au navigateur..

// Message facultatif à l'attention de celles et ceux qui s'intéressent au code source ;-)..
echo ' <!-- Site conçu en XHTML 1.1 ! Cependant, le type de document final que vous recevez peut varier selon les performances de votre navigateur, sans toutefois affecter l\'affichage du site.. -->'."\n";
echo ' <!-- L\'identifiant de votre navigateur est : '.$navigator.' ;-) -->'."\n\n";


#############################################################
# #
# Début de la page Web.. #
# #
#############################################################


if (isset($PageTitle)) {
$HeaderTitle = " / ".$PageTitle;
}
else { $HeaderTitle = ""; }

echo '<head>

<title>Mon site Web</title>

<meta http-equiv="Content-Type" content="'.$mime.'; charset='.$charset.'" />'."\n"; // En-tête HTTP pour le cas où le visiteur enregistre la page sur son ordi..
?>
</head>

<body>
Votre page Web
</body>

</html>
<?
if ($ob == 1) {
ob_flush(); // Envoie au navigateur la page mise en cache sur le serveur..
}
?>
[/cpp]

4 - Infos complémentaires

■Usage de la fonction PHP ob_start() employée pour transcrire le code en HTML 4.01 (manuel PHP, en français) >>
■Servir du XHTML 1.0 : article en français du W3C, avec explication des types mime, comparaison des modes de rendu "standard" contre "quirks" et déclaration XML >>


Quant à mon site perso, il fonctionne très bien avec ce système (je ne lui fais pas de pub, juste un exemple comme quoi ça fonctionne. Et d'ailleurs, je ne précise pas l'url : le forum propose un bouton pour ça ;)).. Non seulement il est valide XHTML 1.1 (sauf erreur de frappe ou de syntaxe oubliée de ma part), mais en plus le code source parle de lui-même selon les navigateurs :D...


Voili.. Si ce topic peut servir à quelqu'un.... Toutes les corrections / améliorations sont évidemment les bienvenues (il va de soi que j'ai certainement oublié quelque chose) ;)..


Edit du 25/04/06 : quelques corrections mineures, au niveau de la détection d'IE 6..

Edit du 10/12/06 : ajout de la prise en charge d'IE 7, pour lui envoyer le même prologue XHTML 1.0 Strict qu'IE 6 : en mode de compatibilité 'text/html'..

Edit du 11/02/07 : petite correction pour la prise en charge de l'XHTML en mode de compatibilité HTML par Konqueror et Safari..
:merci:
 

williamxbox

Habitué
Salut! Sympa ton topic! Mais est-il important de mettre les balises <meta etc...> dans un site?
Parce que je n'utilise pas! :??:

J'ai visité ton site perso, et j'ai vu une faute de frappe où alors je ne connais pas ce mot!
"...uelques années qui m’ont vu passer du statut d’intermittent du spectacle à celui de salarié en informatique indistrielle..."....

Le mot "Indistrielle" c'est pas plutôt "industrielle"?

 

Johan_et_Pirlouit

Grand Maître

Je suis toujours friand de corrections, car il n'est pas toujours facile de se relire ! On passe tellement de temps avec ses propres textes et documents qu'à la fin on ne voit même plus les erreurs.... Thanx ;) (EDIT : en corrigeant, je m'aperçois qu'il fallait aller la chercher, celle-là !! :D)


Sinon, les balises <meta> servent à plusieurs choses, comme par exemple :
■ Passer des infos au navigateurs à props d'une langue ou d'un jeu de caractère utilisé, surtout dans le cas où la page se retrouve sauvegardée en local (attribut 'http-equiv').
■ Définir un nom, une description et des mots clé, comme aussi des paramètres de furetage qui,eux, vont servir à l'indexation du site par les moteurs de recherche..
■ Des indications sur l'auteur, le copyright, les dates de création, de mise à jour, etc...

Un article traitant des balises <meta> : Les balises "Meta" >> (bien qu'il soit resté à l'ancienne heure désormais obsolète concernant le jeu de caractère pris en exemple, comme d'ailleurs la grande majorité des sites Web)..

:merci:
 

williamxbox

Habitué


Merci! donc je vais les mettres :sol:
 

marsien

Grand Maître
Salut :)

Merci à toi, J&P, pour ce super script !

Sur tes conseils, je l'ai incorporé dans un de mes sites. Outre le fait que ce soit vraiment simple à intégrer, ça marche nickel... même pour corriger un ou 2 bug de frappe dans le code ;)

Bref, maintenant c'est OK, sauf un truc que je ne comprends pas : un des mes scripts javascript ne veut plus fonctionner. Il marche très bien sans le script php de rétro-compatibilité. Les autres javascripts marchent quant à eux très bien, avec ou sans le script de rétro-compatibilité :heink:

Le script qui ne marche plus avait pour but de contrôler le remplissage de certains champs d'un formulaire. Le script
[cpp] function VerifForm()
{
if( (document.contact_formulaire.societe.value.length > 0) && (document.contact_formulaire.email.value.length > 0) && (document.contact_formulaire.message.value.length > 0) )
return true;
else
{
alert("Attention, les champs Société, E-mail et Message sont obligatoires");
return false;
}
}[/cpp]

et le lien vers le script au niveau du code html du formulaire :
[cpp]<form action="formail.php" method="post" name="contact_formulaire" onsubmit="return VerifForm();">[/cpp]

Je rappelle quand même que sans rien changer sauf la suppression du script php de rétro-compatibilité, mon javascript marche parfaitement.

Alors si quelqu'un a une explication...

Merci

PS : J&P, je te mail demain ;)
 

Johan_et_Pirlouit

Grand Maître
Un des soucis de JS avec XHTML (surtout en mode 'application/xhtml+xml') concerne l'orthographe des fonctions JS : XHTML demande que tous les attributs soient écrits en minuscules.. En furetant dans les articles du site du W3C à propos des différences entre HTML et XHTML (ou un sujet du genre), j'ai lu que ce soucis dans la syntaxe pouvait provoquer des "ratés" avec certains scripts (par contre, je ne sais plus quel est l'article en question : j'étais tombé dessus au cours d'une de mes longues nuits de recherches côté prog [:spamafote])..

Sinon, pour checker le "bon état d'un formulaire" au moment de l'envoi, préfère passer par PHP.. Un classique : tu travaille avec les variables postées (variables POST) et, si besoin, tu les places dans des variables de session (utile si ton formulaire et/ou les résultats sont chacun sur plusieurs pages).. Au moment de la soumission du formulaire, un script va vérifier si les valeurs requises sont présentes et conviennent.. Si c'est le cas, il envoie sur la page suivante, sinon, il recharge le formulaire en utilisant les variables de session (ou les variables POST, si une session n'est pas requise) et en indiquant, en tête de formulaire, les champs manquants pour que le visiteur s'y retrouve..

En ce moment, je bosse sur un formulaire avec 90 questions (chacune avec 2 boutons radio) et ce système fonctionne nickel : chaque question "oubliée" est signalée après la validation....

Le principe est celui de l'aiguillage obligatoire juste en amont du formulaire : si le formulaire n'est pas soumis (cas par défaut lors de l'arrivée sur la page), le formulaire seul est chargé et une session est éventuellement ouverte.. Lors de la soumission, une variable de soumission est passée dans l'url de l'action du form (genre '?option=envoi').. Une fois cette variable repérée par l'aiguillage, le script de validation est alors chargé et va décider du résultat de l'aiguillage : soit le formulaire avec les warnings qui vont bien, soit la page de résultat suivie de la fermeture de la session (si elle avait été précédemment ouverte)..

Voili.......

:merci:
 

Johan_et_Pirlouit

Grand Maître
Et puis une petite autre, histoire d'ouvrir à la gestion XHTML en mode de compatibilité HTML pour Konqueror et Safari (j'avais oublié :ange:)..

:merci:
 
Vous devez vous inscrire ou vous connecter pour répondre ici.
Derniers messages publiés
Statistiques globales
Discussions
730 134
Messages
6 718 055
Membres
1 586 393
Dernier membre
mathhh28
Partager cette page
Haut