Passer au contenu principal

Vue d’ensemble

Les nodes d’outils gèrent les opérations essentielles de vos workflows — appels d’API, transformation des données et combinaison d’informations.

Outils disponibles

Extraction de données

Transformation des données

Combinaison des données

Transformation des données

HTML Cleaner

Supprimer les éléments HTML indésirables :
  • Scripts et styles
  • Commentaires
  • Balises vides
  • Sélecteurs spécifiques

HTML to Markdown

Convertir le contenu web pour une utilisation avec l’IA :
Input: <h1>Title</h1><p>Paragraph</p>
Output: # Title\n\nParagraph
Les modèles d’IA fonctionnent mieux avec le Markdown qu’avec le HTML.

Find and Replace

Transformer le texte avec des motifs :
ModeExemple
SimpleRemplacer “foo” par “bar”
RegexRemplacer \d{4} par [YEAR]
MultipleEnchaîner plusieurs remplacements

JSON Path Extractor

Parcourir du JSON complexe :
// Input
{
  "results": [
    {"name": "Alice", "score": 95},
    {"name": "Bob", "score": 87}
  ]
}

// Path: $.results[0].name
// Output: "Alice"

// Path: $.results[*].score
// Output: [95, 87]

Patterns courants

Pipeline de données API

Bonnes pratiques

Web scraping

  • Respecter robots.txt et les limites de débit
  • Ajouter des délais entre les requêtes (2-3 secondes)
  • Gérer les erreurs proprement (404, timeout)
  • Mettre en cache les résultats lorsque c’est possible

Appels API

  • Utiliser l’authentification correctement
  • Gérer les limites de débit avec des nouvelles tentatives
  • Valider les réponses avant traitement
  • Journaliser les échecs pour le débogage

Étapes suivantes