Ce que vous allez construire
Un workflow qui synchronise les données entre systèmes — par exemple, maintenir une Google Sheet synchronisée avec BigQuery, ou pousser les données CRM vers votre entrepôt de données. Temps de réalisation : 20 minutes Nodes utilisés : Google Sheets, Loop, BigQuery Writer, ConditionalLe problème
Les données sont dispersées à plusieurs endroits :- Données marketing dans Google Sheets
- Données commerciales dans le CRM
- Données produits dans les bases de données
- Analytiques dans BigQuery
Vue d’ensemble du workflow
Modèles de synchronisation courants
Sheet vers BigQuery
Synchronisez les feuilles marketing vers votre entrepôt de données :CRM vers l’entrepôt
Centralisez les données commerciales :Agrégation multi-sources
Combinez des données de plusieurs sources :Guide pas à pas : Sheet vers BigQuery
Étape 1 : Configurer la source
Créez une Google Sheet avec des données structurées :| date | campaign | spend | impressions | clicks |
|---|---|---|---|---|
| 2024-01-15 | Brand | 1000 | 50000 | 2500 |
| 2024-01-15 | Search | 2000 | 30000 | 3000 |
Étape 2 : Créer le workflow
- Cliquez sur New Workflow
- Nommez-le « Marketing Data Sync »
Étape 3 : Récupérer les données source
Étape 4 : Transformer les données
Étape 5 : Valider les données
Étape 6 : Écrire vers la destination
Étape 7 : Journaliser les résultats de synchronisation
Gestion des modes de synchronisation
Rafraîchissement complet
Remplacer toutes les données à chaque synchronisation :Synchronisation incrémentale
Ne synchroniser que les enregistrements nouveaux ou modifiés :Upsert (Update or Insert)
Mettre à jour les enregistrements existants, insérer les nouveaux :Mise en œuvre de la synchronisation incrémentale
Suivre la dernière synchronisation
Stocker l’horodatage de la dernière synchronisation réussie :Gestion des erreurs
Logique de nouvelle tentative
Pour les échecs temporaires :File des enregistrements en erreur
Conserver les enregistrements en échec pour revue manuelle :Alerte en cas d’échec
Envoyer des notifications quand la synchronisation échoue :Planification des jobs de synchronisation
| Type de sync | Fréquence | Moment |
|---|---|---|
| Temps réel | Toutes les 5-15 min | Continu |
| Quasi temps réel | Toutes les heures | À l’heure pile |
| Quotidien | Une fois par jour | Hors pointe (2-4 h) |
| Hebdomadaire | Une fois par semaine | Week-end |
Bonnes pratiques
Idempotence
Rendre les synchronisations sûres à relancer :- Utiliser l’upsert plutôt que l’insert
- Inclure des horodatages pour la déduplication
- Suivre les lots de sync avec des ID
Validation des données
Valider avant d’écrire :- Vérifier les champs obligatoires
- Contrôler les types de données
- Valider les plages
- Vérifier l’intégrité référentielle
Journalisation
Tout journaliser :- Heures de début et de fin
- Nombre d’enregistrements
- Statut succès/échec
- Détails des erreurs
Surveillance
Suivre la santé des synchronisations :| Métrique | Seuil d’alerte |
|---|---|
| Durée de sync | > 2× la normale |
| Taux d’erreur | > 5 % |
| Sync manquées | > 1 manquée |
| Délai des données | > 1 heure |
Résultats attendus
| Métrique | Manuel | Automatisé |
|---|---|---|
| Fréquence de sync | Quotidienne (au mieux) | Toutes les 15 min |
| Taux d’erreur | 5-10 % | < 1 % |
| Temps passé | 2-4 h/semaine | 0 |
| Fraîcheur des données | Heures/jours | Minutes |

