Google Docs Reader
Lire le contenu et les metadonnees d'un ou plusieurs documents Google Docs
A quoi sert ce node ?
Le node Google Docs Reader lit le contenu et les metadonnees d’un ou plusieurs documents Google Docs. Il prend en charge la selection multi-documents via Google Drive Picker, la selection d’onglets par document et trois formats de sortie (JSON, plain text, markdown).
Utilisations courantes :
- Extraire des documents pour une synthese assistee par IA
- Lire du contenu pour l’analyse et l’optimisation SEO
- Recuperer de la documentation pour des workflows de traduction automatisee
Configuration rapide
Connecter votre compte Google
Allez dans Builder → Integrations → Google et authentifiez-vous avec le scope google_docs
Ajouter le node Google Docs Reader
Trouvez-le dans Integrations → Google → Docs Reader
Selectionner vos documents
Utilisez le Google Drive Picker pour selectionner un ou plusieurs documents, puis configurez le format de sortie et la selection des onglets
Configuration
Version : 1.1 | Integration : google_docs
Parametres
integration_id string required L’integration Google Docs a utiliser. Selectionnez parmi vos integrations Google configurees.
document_ids string[] required Les identifiants des Google Docs a lire. Utilisez le Google Drive Picker integre pour selectionner un ou plusieurs documents. Prend en charge la selection multiple.
document_names string[] Noms d’affichage des documents selectionnes. Rempli automatiquement lorsque les documents sont selectionnes via le Picker.
output_type select default: markdown Le format du contenu extrait.
| Valeur | Description |
|---|---|
json | JSON structure avec les metadonnees completes du document |
plain_text | Contenu brut sans formatage |
markdown | Contenu au format markdown (recommande pour le traitement LLM) |
read_all_tabs boolean default: true Indique s’il faut lire tous les onglets de chaque document. Lorsqu’il est active, le contenu de chaque onglet est inclus dans la sortie.
selected_tabs object Selection d’onglets par document. Lorsque read_all_tabs est desactive, utilisez la fenetre de selection d’onglets pour choisir des onglets specifiques pour chaque document. Utile pour les documents volumineux ou seuls certains onglets sont pertinents.
Entrees
Ce node n’a pas d’entrees. Il lit directement depuis Google Docs en utilisant les parametres configures.
Sortie
document_data string Chaine JSON contenant le contenu et les metadonnees de tous les documents selectionnes.
{
"documents": [
{
"document_id": "1aBcDeFgHiJkLmNoPqRsTuVwXyZ",
"title": "Rapport Marketing Q1",
"tabs": [
{
"tab_id": "t.0",
"tab_name": "Vue d'ensemble",
"content": "# Rapport Marketing Q1\n\nCe trimestre a connu une augmentation de 25%..."
}
],
"url": "https://docs.google.com/document/d/1aBcDeFgHiJkLmNoPqRsTuVwXyZ"
}
]
}
Acceder a la sortie : {{Google_Docs_Reader_0.document_data}}
Exemples
Extraire des documents pour une synthese IA
Lire plusieurs rapports marketing et les resumer avec un LLM :
graph LR
A[Google Docs Reader] --> B[LLM]
B --> C[Email Sender]
Configuration :
- Selectionnez 3 a 5 rapports marketing via le Google Drive Picker
- Definissez
output_typesurmarkdownpour un traitement LLM optimal - Connectez a un node LLM avec les instructions : “Resume chaque document en 3 points cles”
- Envoyez la synthese par email
Lire de la documentation pour traduction
Recuperer de la documentation technique et la traduire avec l’IA :
graph LR
A[Google Docs Reader] --> B[LLM Translate]
B --> C[Google Docs Writer]
Configuration :
- Selectionnez les documents source a traduire
- Definissez
output_typesurmarkdownpour preserver le formatage - Utilisez un node LLM pour traduire le contenu
- Ecrivez le contenu traduit dans de nouveaux documents avec Google Docs Writer
Bonnes pratiques
- Utilisez le format markdown pour le traitement LLM. Le type de sortie
markdownpreserve la structure du document (titres, listes, liens) tout en restant facile a interpreter par les modeles IA. - Selectionnez des onglets specifiques pour les documents volumineux. Desactivez
read_all_tabset choisissez uniquement les onglets necessaires pour reduire le temps de traitement et la consommation de tokens. - Utilisez la sortie JSON pour le traitement programmatique. Lorsque vous devez extraire des metadonnees specifiques ou traiter des documents de maniere programmatique, le format
jsonfournit les donnees les plus structurees.
Problemes courants
Aucun contenu retourne pour un document
Verifiez que l’integration Google dispose des permissions correctes. Le scope google_docs doit etre active. Verifiez egalement que le compte authentifie a un acces en lecture aux documents selectionnes.
Le contenu des onglets est manquant ou incomplet
Si read_all_tabs est desactive, assurez-vous que les bons onglets sont selectionnes dans la fenetre de selection. Certains documents peuvent avoir des onglets avec du contenu vide ou du contenu necessitant des permissions specifiques.