View: Nettoyer une page HTML de ces balises

  1. 9 months ago by spawnrider
    1. function html2txt($document){
    2.         $search = array('@<script[^>]*?>.*?</script>@si', // Strip out javascript
    3.         '@<style[^>]*?>.*?</style>@siU', // Strip style tags properly
    4.         '@<[?]php[^>].*?[?]>@si', //scripts php
    5.         '@<[?][^>].*?[?]>@si', //scripts php
    6.         '@<[\/\!]*?[^<>]*?>@si', // Strip out HTML tags
    7.         '@<![\s\S]*?--[ \t\n\r]*>@', // Strip multi-line comments including CDATA
    8.         );
    9.         $text = preg_replace($search, '', $document);
    10.         return $text;
    11. }

2 comments about "Nettoyer une page HTML de ces balises"

  1. Bonjour, Pourquoi ne pas utiliser la fonction "strip_tags()" native PHP, qui à ma connaissance fait la même chose ? Cordialement, -Nephiston-
    nephiston on November 19, 2007
  2. +1
    palleas on March 25, 2008