L'architecture Windows Hardware Error Architecture (WHEA) représente l'approche globale de Microsoft pour la détection et le signalement des erreurs matérielles, considérablement améliorée dans les mises à jour de Windows 11 2024 et Windows Server 2025. L'ID d'événement 17 indique spécifiquement que WHEA a réussi à intercepter et corriger une erreur matérielle avant qu'elle ne puisse affecter le fonctionnement du système ou l'intégrité des données.
L'architecture fonctionne en collectant des informations sur les erreurs provenant de diverses sources matérielles, y compris les processeurs avec Machine Check Architecture (MCA), les contrôleurs de mémoire avec des capacités de Code de Correction d'Erreur (ECC), et les dispositifs PCIe prenant en charge le Advanced Error Reporting (AER). Lorsque des erreurs corrigibles se produisent, WHEA crée des enregistrements d'erreurs standardisés contenant des informations de diagnostic détaillées sur la source de l'erreur, le type et la méthode de correction appliquée.
Ces erreurs corrigées incluent généralement des erreurs de mémoire à un seul bit automatiquement corrigées par l'ECC, des corrections de lignes de cache CPU gérées par des circuits de correction d'erreurs internes, et des reprises de transactions PCIe gérées par des protocoles de couche de liaison. Bien qu'inoffensifs individuellement, les motifs dans ces événements peuvent révéler des problèmes matériels émergents tels que la dégradation des modules de mémoire, le stress thermique sur les processeurs, ou des problèmes d'intégrité du signal dans les interconnexions à haute vitesse.
L'enregistrement de l'événement inclut une structure Common Platform Error Record (CPER) contenant des détails spécifiques au matériel, des classifications de la gravité des erreurs, et des horodatages. Ce format standardisé permet une analyse cohérente des erreurs sur différentes plateformes matérielles et facilite l'intégration avec des solutions de surveillance d'entreprise et des systèmes de maintenance prédictive.