Google Docs Reader

Le node Google Docs Reader récupère le contenu et les métadonnées d'un ou plusieurs documents Google Docs, avec sélection multi-documents, contrôle des onglets par document et trois formats de sortie.

À quoi sert le node Google Docs Reader ?

Le node Google Docs Reader se connecte à votre compte Google et lit le contenu et les métadonnées d’un ou plusieurs documents Google Docs. Il prend en charge la sélection multi-documents via Google Drive Picker, la sélection d’onglets par document et trois formats de sortie (JSON, plain text, Markdown).

Cas d’usage typiques :

Récupérer plusieurs rapports marketing pour une synthèse assistée par IA
Lire des briefs SEO ou des articles pour alimenter un pipeline d’analyse LLM
Extraire de la documentation technique pour des workflows de traduction automatisée
Récupérer le contenu d’onglets sélectionnés de documents volumineux pour limiter la consommation de tokens

Configuration rapide

Connectez votre intégration Google

Ouvrez les paramètres du node et sélectionnez votre intégration Google Docs dans la liste déroulante. Si Google n’est pas encore connecté, allez dans Settings > Integrations et authentifiez-vous avec le scope google_docs.

Sélectionnez les documents

Cliquez sur le Google Drive Picker pour parcourir votre Drive et sélectionner un ou plusieurs documents. Le Picker remplit automatiquement document_ids et document_names.

Choisissez un format de sortie

Réglez Output Type sur markdown (recommandé pour les LLM), plain_text ou json selon ce que le node suivant attend.

Configurez la sélection d’onglets (optionnel)

Laissez Read All Tabs activé pour lire tous les onglets, ou désactivez-le et choisissez des onglets spécifiques par document via la fenêtre de sélection. Utile pour les documents volumineux.

Connectez la sortie

Reliez la sortie document_data au node suivant — typiquement un Loop, un LLM ou un JSON Path Extractor.

Paramètres de configuration

Google Docs Reader output format and tab options example

Champs obligatoires

integration_id integration required

Intégration Google Docs — Sélectionnez la connexion Google à utiliser. L’intégration doit être authentifiée avec le scope google_docs et disposer d’un accès en lecture aux documents.

document_ids string[] required

Identifiants des documents — Liste des IDs des documents Google Docs à lire. Utilisez le Google Drive Picker intégré pour sélectionner un ou plusieurs documents. Accepte un tableau ou une chaîne séparée par des virgules pour la rétrocompatibilité.

Champs optionnels

document_names string[]

Noms des documents — Noms d’affichage des documents sélectionnés. Rempli automatiquement par le Picker. Utilisé dans la charge utile de sortie pour la lisibilité.

output_type select default: markdown

Format de sortie — Format du contenu extrait.

Valeur	Description
`json`	JSON structuré avec les métadonnées complètes du document
`plain_text`	Texte brut sans formatage
`markdown`	Contenu au format Markdown (recommandé pour le traitement LLM)

read_all_tabs boolean default: true

Lire tous les onglets — Lorsqu’il est activé, chaque onglet de chaque document est lu. Désactivez-le pour sélectionner des onglets spécifiques par document.

selected_tabs object default: {}

Onglets sélectionnés — Sélection d’onglets par document. Lorsque read_all_tabs est désactivé, utilisez la fenêtre de sélection pour choisir les onglets à lire pour chaque document. Stocké sous forme de map JSON associant les IDs de documents aux métadonnées des onglets.

Tip

Utilisez la sortie Markdown pour les nodes LLM en aval — elle préserve les titres, listes et liens tout en restant compacte et facile à interpréter pour le modèle.

Que produit le node en sortie ?

Le node renvoie une seule sortie contenant le contenu et les métadonnées de tous les documents sélectionnés.

document_data string

Chaîne JSON contenant un tableau de documents. Chaque entrée inclut document_id, title, url et un tableau tabs avec tab_id, tab_name et content formaté selon output_type.

Exemple de charge utile :

{
  "documents": [
    {
      "document_id": "1aBcDeFgHiJkLmNoPqRsTuVwXyZ",
      "title": "Rapport Marketing Q1",
      "tabs": [
        {
          "tab_id": "t.0",
          "tab_name": "Vue d'ensemble",
          "content": "# Rapport Marketing Q1\n\nCe trimestre a connu une augmentation de 25%..."
        }
      ],
      "url": "https://docs.google.com/document/d/1aBcDeFgHiJkLmNoPqRsTuVwXyZ"
    }
  ]
}

Référencez la sortie en aval avec {{Google_Docs_Reader_0.document_data}}.

Exemples d’utilisation

Exemple 1 : Synthétiser plusieurs rapports avec un LLM

Vous avez plusieurs rapports marketing trimestriels dans Google Docs et souhaitez recevoir une synthèse exécutive par email.

Configuration :

Intégration : Google Docs
Document IDs : 3 à 5 rapports sélectionnés via le Picker
Output Type : markdown
Read All Tabs : Activé

Branchez document_data sur un LLM avec le prompt : Résume chaque document en 3 points clés. Envoyez le résultat via un node Email Sender.

graph LR
    A[Google Docs Reader] --> B[LLM]
    B --> C[Email Sender]

Exemple 2 : Traduire les onglets sélectionnés d’un set de documentation

Vous maintenez un fichier de documentation multi-onglets et souhaitez traduire uniquement les onglets destinés aux utilisateurs.

Configuration :

Document IDs : le fichier de documentation
Output Type : markdown
Read All Tabs : Désactivé
Selected Tabs : uniquement les onglets publics

Reliez la sortie à un LLM traducteur et écrivez le résultat avec un node Google Docs Writer.

Exemple 3 : Extraction programmatique de métadonnées

Utilisez Output Type json pour accéder aux champs de métadonnées bruts. Branchez la sortie sur un JSON Path Extractor pour extraire les tableaux title et url à des fins d’indexation.

Problèmes courants

Aucun contenu retourné pour un document

Cause : L’intégration Google n’a pas d’accès en lecture, ou le scope google_docs est manquant.

Solution : Allez dans Settings > Integrations, reconnectez l’intégration Google avec le scope google_docs et vérifiez que le compte authentifié a accès au document.

Le contenu des onglets est manquant ou incomplet

Cause : read_all_tabs est désactivé et les onglets pertinents ne sont pas sélectionnés, ou certains onglets exigent des permissions supplémentaires.

Solution : Activez read_all_tabs pour confirmer que le contenu est accessible. Si vous ne voulez qu’un sous-ensemble, ouvrez la fenêtre de sélection et vérifiez les bons onglets pour chaque document.

Erreur : Missing required parameter document_ids

Cause : Aucun document n’a été sélectionné, ou la variable en amont alimentant document_ids est vide.

Solution : Rouvrez le Picker et sélectionnez au moins un document, ou vérifiez que le node en amont produit un tableau ou une chaîne séparée par des virgules non vide.

Erreur : Missing Google Docs Integration

Cause : Le paramètre integration_id est vide.

Solution : Sélectionnez une intégration Google Docs dans les paramètres du node. Créez-en une dans Settings > Integrations si nécessaire.

Bonnes pratiques

Tip

Utilisez la sortie Markdown pour les nodes LLM. Elle préserve la structure du document (titres, listes, liens) tout en restant compacte et facile à interpréter pour le modèle.

Tip

Limitez la lecture des onglets sur les gros documents. Désactivez read_all_tabs et choisissez uniquement les onglets nécessaires — moins de tokens, exécutions plus rapides, coût plus faible.

Warning

Partagez les documents avec le compte authentifié. Les documents non partagés avec le compte Google de l’intégration peuvent retourner un contenu vide sans erreur dans certains cas.

Warning

Attention aux limites de contexte des LLM. Lire de nombreux documents en une fois peut dépasser la fenêtre de contexte du modèle. Utilisez un node Loop pour traiter les documents un à un si nécessaire.

Nodes associés

Google Docs Writer

Créez ou mettez à jour des documents Google Docs avec le contenu produit en aval.

LLM

Synthétisez, traduisez ou analysez le contenu récupéré depuis Google Docs.

Loop

Itérez sur chaque document ou onglet pour les traiter un à un.

JSON Path Extractor

Extrayez des champs spécifiques de la charge utile JSON (titres, URLs, contenu d’onglets).