Ouvrir le Studio

Google Docs Reader

Lire le contenu et les metadonnees d'un ou plusieurs documents Google Docs

A quoi sert ce node ?

Le node Google Docs Reader lit le contenu et les metadonnees d’un ou plusieurs documents Google Docs. Il prend en charge la selection multi-documents via Google Drive Picker, la selection d’onglets par document et trois formats de sortie (JSON, plain text, markdown).

Utilisations courantes :

  • Extraire des documents pour une synthese assistee par IA
  • Lire du contenu pour l’analyse et l’optimisation SEO
  • Recuperer de la documentation pour des workflows de traduction automatisee

Configuration rapide

Connecter votre compte Google

Allez dans Builder → Integrations → Google et authentifiez-vous avec le scope google_docs

Ajouter le node Google Docs Reader

Trouvez-le dans IntegrationsGoogleDocs Reader

Selectionner vos documents

Utilisez le Google Drive Picker pour selectionner un ou plusieurs documents, puis configurez le format de sortie et la selection des onglets

Configuration

Version : 1.1 | Integration : google_docs

Parametres

integration_id string required

L’integration Google Docs a utiliser. Selectionnez parmi vos integrations Google configurees.

document_ids string[] required

Les identifiants des Google Docs a lire. Utilisez le Google Drive Picker integre pour selectionner un ou plusieurs documents. Prend en charge la selection multiple.

document_names string[]

Noms d’affichage des documents selectionnes. Rempli automatiquement lorsque les documents sont selectionnes via le Picker.

output_type select default: markdown

Le format du contenu extrait.

ValeurDescription
jsonJSON structure avec les metadonnees completes du document
plain_textContenu brut sans formatage
markdownContenu au format markdown (recommande pour le traitement LLM)
read_all_tabs boolean default: true

Indique s’il faut lire tous les onglets de chaque document. Lorsqu’il est active, le contenu de chaque onglet est inclus dans la sortie.

selected_tabs object

Selection d’onglets par document. Lorsque read_all_tabs est desactive, utilisez la fenetre de selection d’onglets pour choisir des onglets specifiques pour chaque document. Utile pour les documents volumineux ou seuls certains onglets sont pertinents.

Entrees

Ce node n’a pas d’entrees. Il lit directement depuis Google Docs en utilisant les parametres configures.

Sortie

document_data string

Chaine JSON contenant le contenu et les metadonnees de tous les documents selectionnes.

{
  "documents": [
    {
      "document_id": "1aBcDeFgHiJkLmNoPqRsTuVwXyZ",
      "title": "Rapport Marketing Q1",
      "tabs": [
        {
          "tab_id": "t.0",
          "tab_name": "Vue d'ensemble",
          "content": "# Rapport Marketing Q1\n\nCe trimestre a connu une augmentation de 25%..."
        }
      ],
      "url": "https://docs.google.com/document/d/1aBcDeFgHiJkLmNoPqRsTuVwXyZ"
    }
  ]
}

Acceder a la sortie : {{Google_Docs_Reader_0.document_data}}

Exemples

Extraire des documents pour une synthese IA

Lire plusieurs rapports marketing et les resumer avec un LLM :

graph LR
    A[Google Docs Reader] --> B[LLM]
    B --> C[Email Sender]

Configuration :

  • Selectionnez 3 a 5 rapports marketing via le Google Drive Picker
  • Definissez output_type sur markdown pour un traitement LLM optimal
  • Connectez a un node LLM avec les instructions : “Resume chaque document en 3 points cles”
  • Envoyez la synthese par email

Lire de la documentation pour traduction

Recuperer de la documentation technique et la traduire avec l’IA :

graph LR
    A[Google Docs Reader] --> B[LLM Translate]
    B --> C[Google Docs Writer]

Configuration :

  • Selectionnez les documents source a traduire
  • Definissez output_type sur markdown pour preserver le formatage
  • Utilisez un node LLM pour traduire le contenu
  • Ecrivez le contenu traduit dans de nouveaux documents avec Google Docs Writer

Bonnes pratiques

  • Utilisez le format markdown pour le traitement LLM. Le type de sortie markdown preserve la structure du document (titres, listes, liens) tout en restant facile a interpreter par les modeles IA.
  • Selectionnez des onglets specifiques pour les documents volumineux. Desactivez read_all_tabs et choisissez uniquement les onglets necessaires pour reduire le temps de traitement et la consommation de tokens.
  • Utilisez la sortie JSON pour le traitement programmatique. Lorsque vous devez extraire des metadonnees specifiques ou traiter des documents de maniere programmatique, le format json fournit les donnees les plus structurees.

Problemes courants

Aucun contenu retourne pour un document

Verifiez que l’integration Google dispose des permissions correctes. Le scope google_docs doit etre active. Verifiez egalement que le compte authentifie a un acces en lecture aux documents selectionnes.

Le contenu des onglets est manquant ou incomplet

Si read_all_tabs est desactive, assurez-vous que les bons onglets sont selectionnes dans la fenetre de selection. Certains documents peuvent avoir des onglets avec du contenu vide ou du contenu necessitant des permissions specifiques.

Nodes associes