Qu'est-ce qu'un historien ?
Un historien, également appelé historien de données de processus ou historien opérationnel, est un système logiciel spécialisé conçu pour collecter, stocker et récupérer les données temporelles issues des processus industriels. Contrairement aux bases de données généralistes, les historiens sont optimisés pour les exigences uniques des données industrielles : des taux d'ingestion à haute fréquence, une compression efficace des valeurs horodatées et une récupération rapide des tendances en temps réel et historiques.
Les historiens sont une pierre angulaire des architectures modernes SCADA, MES et d'automatisation industrielle, fournissant le stockage de données à long terme nécessaire pour l'optimisation des processus, la conformité réglementaire et l'intelligence opérationnelle.
Pourquoi les historiens sont essentiels dans l'automatisation industrielle
Les historiens de données de processus remplissent plusieurs fonctions critiques qui les rendent indispensables dans les opérations industrielles :
Conformité réglementaire
De nombreuses industries sont tenues par la loi de conserver des enregistrements détaillés des conditions de processus sur de longues périodes :
- Pharmaceutique (FDA 21 CFR Part 11) : Les enregistrements de lots, les conditions environnementales et les paramètres d'équipement doivent être stockés avec des pistes d'audit complètes
- Agroalimentaire (FSMA) : Les données de température, de pression et d'assainissement doivent être traçables
- Eau et eaux usées : Les débits, les dosages chimiques et les paramètres de qualité doivent être archivés pour le reporting réglementaire
- Pétrole et gaz : Les mesures de transfert de garde et les événements des systèmes de sécurité nécessitent un stockage à long terme
Optimisation des processus
Les données historiques permettent aux ingénieurs et aux opérateurs de :
- Identifier les tendances et les schémas du comportement des processus dans le temps
- Comparer les performances actuelles aux références historiques
- Analyser les causes profondes des écarts de qualité ou des défaillances d'équipement
- Optimiser les consignes et les paramètres opérationnels en fonction des performances historiques
Intelligence opérationnelle
Combinées à des outils d'analyse, les données de l'historien alimentent :
- Les tableaux de bord d'indicateurs clés de performance (KPI)
- Les calculs de Taux de Rendement Global (TRG/OEE)
- L'analyse et l'optimisation de la consommation énergétique
- Les modèles de maintenance prédictive basés sur le comportement historique des équipements
Techniques de compression des données
L'une des caractéristiques définitives d'un historien est sa capacité à compresser efficacement les données temporelles. Les systèmes industriels peuvent générer des milliers de points de données par seconde, et stocker chaque valeur brute épuiserait rapidement la capacité de stockage.
Les méthodes de compression courantes incluent :
- Compression par bande morte (deadband) : Ne stocke une nouvelle valeur que lorsque le changement dépasse un seuil configuré. Cela élimine les lectures redondantes lorsqu'une valeur est stable
- Compression par porte pivotante (swinging door) : Utilise un algorithme géométrique qui ajuste les données dans un corridor de déviation, ne stockant que les points nécessaires pour reconstruire la tendance avec une précision spécifiée
- Avec perte vs sans perte : La bande morte et la porte pivotante sont des méthodes avec perte (une certaine précision est sacrifiée pour l'efficacité du stockage). Certains historiens offrent également une compression sans perte similaire aux algorithmes de compression de données standard
Une compression efficace peut réduire les besoins de stockage de 90 % ou plus tout en préservant la forme significative des tendances de processus.
Store-and-Forward
Dans les architectures industrielles distribuées, la connectivité réseau entre les sites distants et l'historien central peut être intermittente ou peu fiable. Le store-and-forward est une capacité critique qui répond à ce problème :
- Les données sont collectées et mises en tampon localement sur le site distant (sur un dispositif edge ou un historien local)
- Lorsque la connectivité est rétablie, les données mises en tampon sont automatiquement transmises à l'historien central dans l'ordre chronologique
- Aucune donnée n'est perdue lors des pannes réseau, garantissant des enregistrements historiques complets et précis
Cette capacité est essentielle pour les opérations géographiquement distribuées telles que les services d'eau, les champs pétroliers et les installations d'énergie renouvelable.
Historien vs bases de données standard
Bien qu'il puisse sembler logique d'utiliser une base de données relationnelle standard (telle que MySQL ou PostgreSQL) pour les données temporelles, les historiens offrent des avantages significatifs pour les applications industrielles :
- Débit d'écriture : Les historiens sont optimisés pour des millions d'écritures par seconde, tandis que les SGBDR sont limités par la surcharge transactionnelle
- Compression des données : Compression industrielle intégrée dans les historiens, absente nativement dans les SGBDR
- Modèles de requêtes : Optimisés pour les requêtes temporelles et de tendances dans les historiens, contre des requêtes relationnelles dans les SGBDR
- Efficacité de stockage : Ratios de compression de 90 %+ pour les historiens, pas de compression par défaut pour les SGBDR
- Intégration : Connectivité native OPC, automate et SCADA dans les historiens, intégration personnalisée requise pour les SGBDR
Cela dit, les approches modernes (comme celle d'Ignition) utilisent de plus en plus les bases de données SQL comme backend de stockage pour les données d'historien, combinant les avantages des outils de bases de données standard avec une couche d'historien optimisée.
Le module Tag Historian d'Ignition
La plateforme Ignition d'Inductive Automation inclut un puissant historien intégré via son module Tag Historian :
- Stockage basé sur SQL : Les données d'historien sont stockées dans des bases de données SQL standard (MySQL, Microsoft SQL Server, PostgreSQL, MariaDB), les rendant accessibles avec les outils SQL standard et les plateformes BI
- Configuration au niveau du tag : Chaque tag peut avoir des paramètres d'historique individuels incluant le taux d'échantillonnage, la bande morte et le fournisseur de stockage
- Stockage partitionné : Les données sont automatiquement partitionnées par période pour des requêtes et un archivage efficaces
- Store-and-forward : La mise en tampon intégrée garantit qu'aucune donnée n'est perdue lors des pannes de base de données ou de réseau
- Groupes de tags historiques : Les tags peuvent être organisés en groupes avec des paramètres d'historien partagés
- Tendances faciles : Les composants Easy Chart et Power Chart intégrés fournissent des outils puissants pour visualiser les données historiques
- Requêtes ad-hoc : La fonction de scripting system.tag.queryTagHistory permet un accès programmatique aux données historiques
Avantages de l'approche d'Ignition
L'historien basé sur SQL d'Ignition offre plusieurs avantages uniques :
- Pas de format de données propriétaire : Les données sont stockées dans des tables SQL ouvertes et accessibles
- Tags et connexions illimités : Pas de licence par tag pour le stockage de l'historien
- Multiplateforme : Fonctionne avec toute base de données SQL supportée
- Compatible IT : Les outils d'administration de base de données standard, les procédures de sauvegarde et les mécanismes de réplication s'appliquent
- Intégration transparente : Les données historiques sont immédiatement disponibles pour les rapports, les tableaux de bord et les analyses au sein de la plateforme Ignition
Bonnes pratiques pour le déploiement d'un historien
- Définir les politiques de rétention : Établir combien de temps les données doivent être conservées à pleine résolution versus sous-échantillonnées ou archivées
- Configurer des bandes mortes appropriées : Définir les valeurs de bande morte en fonction des exigences de précision de chaque mesure
- Planifier la capacité de stockage : Calculer les volumes de données attendus en fonction du nombre de tags, des taux d'échantillonnage et des ratios de compression
- Implémenter la redondance : Utiliser la réplication ou le clustering de base de données pour prévenir la perte de données
- Surveiller les performances : Suivre la taille de la base de données, les temps de réponse des requêtes et le débit d'ingestion
- Sécuriser l'accès : Implémenter un accès basé sur les rôles aux données historiques, en particulier pour les industries réglementées