Passer au contenu principal

Que fait ce node ?

Supprime les éléments HTML indésirables (scripts, styles, publicités) du contenu.

Configuration

html
string
requis
Contenu HTML à nettoyer.
remove_scripts
boolean
défaut:"true"
Supprimer les balises script.
remove_styles
boolean
défaut:"true"
Supprimer les balises et attributs style.
remove_comments
boolean
défaut:"true"
Supprimer les commentaires HTML.
selectors_to_remove
array
Sélecteurs CSS à supprimer (ex. .ads, #sidebar).

Sortie

{
  "cleaned_html": "<div>Contenu nettoyé...</div>",
  "removed_elements": 15
}

Cas d’usage

Nettoyer le contenu scrapé avant un traitement par IA :