url_nettoyer() laisse passer les caractères unicodes comme 🇫🇷 et l'url arbo ne fonctionne pas
Bonjour,
J’ai testé l’activation des URLs de type arbo sur une installation SPIP 4.4.6 à jour. Le fonctionnement global est correct, mais un problème apparaît avec les objets éditoriaux (articles, rubriques, etc.) dont le titre contient des caractères Unicode, notamment les drapeaux (ex. :
Exemple
-
Titre de l’article :
🇫🇷 Vive la France ! - URL gĂ©nĂ©rĂ©e : https://monsite.com/test-rubrique/article/🇫🇷-vive-la-france
- Résultat : URL non fonctionnelle (le serveur retourne une erreur 404 ou redirige mal).
Le caractère 🇫🇷).
En analysant le code, il semble que la fonction url_nettoyer() soit impliquée.
Les drapeaux (composés de deux Regional Indicator Symbols) ne sont pas gérés comme des caractères normaux : ils ne sont ni supprimés, ni translittérés, ni encodés en %F0%9F%87%AB%F0%9F%87%B7 (encodage UTF-8 valide en URL), mais échappés en entités HTML, ce qui est ne marche pas dans une URL.
Arrivez-vous à reproduire ce bug ? Y a-t-il une configuration que j’aurais mal paramétrée ?
Merci de votre aide