Passer au contenu principal

Que fait ce node ?

Extrait des balises HTML spécifiques et leur contenu depuis des documents HTML.

Configuration

html
string
requis
Contenu HTML.
tags
array
requis
Balises à extraire (ex. : ["h1", "h2", "a"]).
include_attributes
boolean
défaut:"true"
Inclure les attributs des balises dans la sortie.

Sortie

{
  "h1": ["Main Title"],
  "h2": ["Section 1", "Section 2"],
  "a": [
    {"text": "Link", "href": "https://..."}
  ]
}