ANAVEM
Languageen
Server monitoring room displaying Windows Event Viewer with WHEA-Logger hardware error events
Event ID 17InformationWHEA-LoggerWindows

ID d'événement Windows 17 – WHEA-Logger : Erreur corrigée de l'architecture matérielle

L'ID d'événement 17 de WHEA-Logger indique que l'Architecture de Gestion des Erreurs Matérielles de Windows a détecté et corrigé une erreur matérielle. Cet événement informatif aide à suivre la stabilité du système et la dégradation potentielle du matériel.

Emanuel DE ALMEIDAEmanuel DE ALMEIDA
18 mars 20269 min de lecture 0
Event ID 17WHEA-Logger 5 méthodes 9 min
Référence événement

Signification de cet événement

L'architecture Windows Hardware Error Architecture (WHEA) représente l'approche globale de Microsoft pour la détection et le signalement des erreurs matérielles, considérablement améliorée dans les mises à jour de Windows 11 2024 et Windows Server 2025. L'ID d'événement 17 indique spécifiquement que WHEA a réussi à intercepter et corriger une erreur matérielle avant qu'elle ne puisse affecter le fonctionnement du système ou l'intégrité des données.

L'architecture fonctionne en collectant des informations sur les erreurs provenant de diverses sources matérielles, y compris les processeurs avec Machine Check Architecture (MCA), les contrôleurs de mémoire avec des capacités de Code de Correction d'Erreur (ECC), et les dispositifs PCIe prenant en charge le Advanced Error Reporting (AER). Lorsque des erreurs corrigibles se produisent, WHEA crée des enregistrements d'erreurs standardisés contenant des informations de diagnostic détaillées sur la source de l'erreur, le type et la méthode de correction appliquée.

Ces erreurs corrigées incluent généralement des erreurs de mémoire à un seul bit automatiquement corrigées par l'ECC, des corrections de lignes de cache CPU gérées par des circuits de correction d'erreurs internes, et des reprises de transactions PCIe gérées par des protocoles de couche de liaison. Bien qu'inoffensifs individuellement, les motifs dans ces événements peuvent révéler des problèmes matériels émergents tels que la dégradation des modules de mémoire, le stress thermique sur les processeurs, ou des problèmes d'intégrité du signal dans les interconnexions à haute vitesse.

L'enregistrement de l'événement inclut une structure Common Platform Error Record (CPER) contenant des détails spécifiques au matériel, des classifications de la gravité des erreurs, et des horodatages. Ce format standardisé permet une analyse cohérente des erreurs sur différentes plateformes matérielles et facilite l'intégration avec des solutions de surveillance d'entreprise et des systèmes de maintenance prédictive.

S'applique à

Windows 10Windows 11Windows Server 2019/2022/2025
Analyse

Causes possibles

  • Corrections de mémoire ECC : Erreurs d'un seul bit dans la RAM système automatiquement corrigées par des mécanismes de code de correction d'erreurs
  • Erreurs de cache CPU : Corrections de parité ou ECC du cache interne du processeur aux niveaux de cache L1, L2 ou L3
  • Récupération de lien PCIe : Nouvelle tentative et récupération automatiques des transactions PCIe échouées en raison de problèmes d'intégrité du signal
  • Gestion thermique : Réduction de la vitesse du matériel ou correction d'erreurs déclenchée par le stress des composants lié à la température
  • Fluctuations de l'alimentation : Erreurs de régulation de tension corrigées par des circuits de gestion de l'alimentation matérielle
  • Correction d'erreurs du chipset : Corrections d'erreurs internes du northbridge, southbridge ou hub de contrôleur intégré
  • Récupération du contrôleur de stockage : Mécanismes automatiques de correction d'erreurs et de nouvelle tentative du contrôleur SATA, NVMe ou RAID
Méthodes de résolution

Étapes de dépannage

01

Analyser les détails de l'événement dans le Visualiseur d'événements

Commencez par examiner les détails spécifiques de l'erreur pour comprendre le composant matériel et le type d'erreur impliqués.

  1. Ouvrez Observateur d'événements en appuyant sur Win + R, en tapant eventvwr.msc, et en appuyant sur Entrée
  2. Accédez à Journaux WindowsSystème
  3. Filtrez le journal en cliquant sur Filtrer le journal actuel dans le volet Actions
  4. Entrez 17 dans le champ ID d'événement et sélectionnez WHEA-Logger comme source de l'événement
  5. Double-cliquez sur les entrées d'ID d'événement 17 pour voir des informations détaillées
  6. Examinez l'onglet Général pour la description de l'erreur et l'onglet Détails pour les données techniques
  7. Cherchez des motifs dans le timing, la fréquence et les composants matériels affectés
  8. Notez le champ Source de l'erreur qui identifie le composant matériel spécifique (processeur, mémoire, dispositif PCIe)
Conseil pro : Exportez les résultats filtrés en CSV pour une analyse des tendances en cliquant avec le bouton droit sur la vue filtrée et en sélectionnant Enregistrer le fichier journal filtré sous.
02

Analyse et corrélation PowerShell

Utilisez PowerShell pour extraire et analyser les événements WHEA de manière programmatique pour l'identification et la corrélation des motifs.

  1. Ouvrez PowerShell en tant qu'administrateur
  2. Interrogez les entrées récentes de l'ID d'événement WHEA-Logger 17 :
    Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17} -MaxEvents 50 | Select-Object TimeCreated, Id, LevelDisplayName, Message | Format-Table -Wrap
  3. Analysez la fréquence des erreurs au fil du temps :
    $Events = Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17} -MaxEvents 200
    $Events | Group-Object {$_.TimeCreated.Date} | Select-Object Name, Count | Sort-Object Name
  4. Extrayez des informations détaillées sur les erreurs :
    Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17} -MaxEvents 10 | ForEach-Object {
        [xml]$EventXML = $_.ToXml()
        $EventXML.Event.EventData.Data | Where-Object {$_.Name -eq 'ErrorSource'}
    }
  5. Créez un rapport de synthèse :
    $WHEAEvents = Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17} -MaxEvents 100
    $WHEAEvents | Group-Object Message | Select-Object Name, Count | Sort-Object Count -Descending
Avertissement : Une fréquence élevée de l'ID d'événement 17 (plus de 10 par jour) peut indiquer un matériel défaillant nécessitant une attention immédiate.
03

Diagnostics matériels et test de mémoire

Effectuez des diagnostics matériels complets pour identifier la cause principale des erreurs corrigibles.

  1. Exécutez le Diagnostic de mémoire Windows :
    mdsched.exe
  2. Planifiez le test et redémarrez le système lorsque cela est demandé
  3. Après le redémarrage, vérifiez les résultats dans le Visualiseur d'événements sous Journaux WindowsSystème, en filtrant pour la source MemoryDiagnostics-Results
  4. Pour un test de mémoire avancé, utilisez le diagnostic de mémoire en ligne de commande :
    bcdedit /set {memdiag} memorytestreboot on
    shutdown /r /t 0
  5. Vérifiez la température du système et l'état du matériel :
    Get-WmiObject -Namespace "root/wmi" -Class MSAcpi_ThermalZoneTemperature | Select-Object InstanceName, @{Name="Temperature";Expression={($_.CurrentTemperature/10)-273.15}}
  6. Vérifiez la configuration de la mémoire ECC dans les Informations système :
    Get-WmiObject -Class Win32_PhysicalMemory | Select-Object BankLabel, Capacity, DataWidth, TotalWidth, TypeDetail
  7. Exécutez les diagnostics du fournisseur de matériel si disponibles (Dell SupportAssist, HP Support Assistant, Lenovo Vantage)
04

Analyse du registre et configuration WHEA

Examinez la configuration WHEA et les paramètres de rapport d'erreurs pour optimiser la détection et le rapport des erreurs matérielles.

  1. Vérifiez la configuration de la politique WHEA dans l'Éditeur du Registre :
    Get-ItemProperty -Path "HKLM:\SYSTEM\CurrentControlSet\Control\WHEA\Policy"
  2. Vérifiez que le rapport d'erreurs est activé :
    Get-ItemProperty -Path "HKLM:\SOFTWARE\Microsoft\Windows\Windows Error Reporting" -Name "Disabled"
  3. Vérifiez les paramètres de l'Architecture de Vérification de la Machine (MCA) :
    Get-ItemProperty -Path "HKLM:\SYSTEM\CurrentControlSet\Control\Session Manager\Memory Management" -Name "MoveImages"
  4. Examinez la configuration de la source d'erreur WHEA :
    Get-ChildItem -Path "HKLM:\SYSTEM\CurrentControlSet\Control\WHEA\ErrorSourceOverrides" -Recurse
  5. Activez la journalisation détaillée WHEA si nécessaire :
    wevtutil sl Microsoft-Windows-WHEA-Logger/Operational /e:true
    wevtutil sl Microsoft-Windows-Kernel-WHEA/Operational /e:true
  6. Vérifiez que la taille du journal des événements système est adéquate :
    Get-WinEvent -ListLog System | Select-Object LogName, MaximumSizeInBytes, RecordCount
Astuce pro : Activez les journaux opérationnels WHEA pour une analyse plus détaillée des erreurs matérielles, mais surveillez la taille des journaux car ils peuvent croître rapidement sur les systèmes avec des erreurs corrigibles fréquentes.
05

Analyse de corrélation avancée et prédictive

Mettre en œuvre une surveillance et une corrélation complètes pour prédire les pannes matérielles avant qu'elles ne se produisent.

  1. Créer un script de surveillance PowerShell pour le suivi continu de WHEA:
    $LogPath = "C:\WHEAMonitoring\WHEA_$(Get-Date -Format 'yyyyMMdd').csv"
    Register-WmiEvent -Query "SELECT * FROM __InstanceCreationEvent WITHIN 10 WHERE TargetInstance ISA 'Win32_NTLogEvent' AND TargetInstance.LogFile = 'System' AND TargetInstance.EventCode = 17" -Action {
        $Event = $Event.SourceEventArgs.NewEvent.TargetInstance
        "$($Event.TimeGenerated),$($Event.EventCode),$($Event.Message)" | Out-File -FilePath $LogPath -Append
    }
  2. Configurer la surveillance des compteurs de performance pour la santé matérielle:
    Get-Counter "\Memory\Corrected Hardware Errors/sec", "\Processor(_Total)\% Processor Time", "\System\Processor Queue Length" -Continuous -SampleInterval 60
  3. Corréler les événements WHEA avec la performance du système:
    $StartTime = (Get-Date).AddDays(-7)
    $WHEAEvents = Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17; StartTime=$StartTime}
    $SystemEvents = Get-WinEvent -FilterHashtable @{LogName='System'; Id=1074,6008,41; StartTime=$StartTime}
    # Analyser la corrélation temporelle entre les erreurs matérielles et les événements système
  4. Générer des rapports de maintenance prédictive:
    $ErrorTrend = $WHEAEvents | Group-Object {$_.TimeCreated.Date} | Select-Object @{Name='Date';Expression={$_.Name}}, @{Name='ErrorCount';Expression={$_.Count}}
    $ErrorTrend | Export-Csv -Path "C:\Reports\WHEA_Trend_$(Get-Date -Format 'yyyyMMdd').csv" -NoTypeInformation
  5. Configurer des alertes automatisées pour les dépassements de seuil d'erreur:
    $Threshold = 5
    $DailyErrors = (Get-WinEvent -FilterHashtable @{LogName='System'; ProviderName='Microsoft-Windows-WHEA-Logger'; Id=17; StartTime=(Get-Date).Date}).Count
    if ($DailyErrors -gt $Threshold) {
        # Envoyer une alerte par email ou SCOM
        Write-EventLog -LogName Application -Source "WHEA Monitor" -EventId 1001 -EntryType Warning -Message "Les erreurs WHEA quotidiennes ont dépassé le seuil: $DailyErrors"
    }

Aperçu

L'ID d'événement 17 du Windows Hardware Error Architecture Logger (WHEA-Logger) se déclenche lorsque le système détecte et corrige avec succès une erreur matérielle. Cet événement représente les capacités de surveillance proactive du matériel de Windows, introduites pour offrir une meilleure visibilité sur la santé du système et la dégradation potentielle des composants.

WHEA fonctionne au niveau du noyau, en interfaçant directement avec les mécanismes de rapport d'erreurs matérielles intégrés dans les processeurs modernes, les contrôleurs de mémoire et les chipsets. Lorsque des erreurs corrigibles se produisent—telles que les corrections de mémoire ECC à un seul bit, les corrections de parité de cache CPU ou la récupération de lien PCIe—WHEA enregistre ces événements pour aider les administrateurs à suivre les tendances de stabilité du système.

Contrairement aux défaillances matérielles critiques qui déclenchent des écrans bleus, l'ID d'événement 17 représente une correction d'erreur réussie. Cependant, des occurrences fréquentes peuvent indiquer un matériel en détérioration qui pourrait éventuellement échouer. L'événement apparaît dans le journal Système et inclut des enregistrements d'erreurs détaillés avec des informations sur la source, les types d'erreurs et les mécanismes de correction utilisés.

Cet événement est particulièrement précieux dans les environnements d'entreprise où la surveillance proactive du matériel prévient les temps d'arrêt inattendus. Les administrateurs système utilisent ces journaux pour planifier la maintenance, remplacer les composants vieillissants et corréler les problèmes de performance avec des problèmes matériels sous-jacents.

Questions Fréquentes

Que signifie l'ID d'événement Windows 17 de WHEA-Logger ?+
L'ID d'événement 17 de WHEA-Logger indique que l'architecture de gestion des erreurs matérielles de Windows a détecté et corrigé avec succès une erreur matérielle. Il s'agit d'un événement informatif montrant que les mécanismes de correction d'erreurs (comme la mémoire ECC, la correction du cache CPU ou la reprise PCIe) ont fonctionné correctement. Bien que l'erreur immédiate ait été résolue, des occurrences fréquentes peuvent signaler un matériel en détérioration nécessitant une surveillance ou un remplacement.
Devrais-je m'inquiéter des occurrences fréquentes de l'ID d'événement 17 ?+
Les entrées occasionnelles d'ID d'événement 17 sont normales et indiquent des systèmes de correction d'erreurs sains. Cependant, des occurrences fréquentes (plus de 10 par jour) nécessitent une enquête. Des schémas de fréquence croissante, des erreurs provenant du même composant matériel, ou une corrélation avec des problèmes de performance du système suggèrent une dégradation potentielle du matériel. Surveillez les tendances au fil du temps et envisagez un remplacement proactif du matériel si les taux d'erreur continuent d'augmenter.
Comment puis-je identifier quel composant matériel cause l'ID d'événement 17 ?+
Examinez les détails de l'événement dans le Visualisateur d'événements ou utilisez PowerShell pour extraire le champ ErrorSource de l'XML de l'événement. Les sources courantes incluent 'Processor' pour les corrections liées au CPU, 'Memory' pour les corrections ECC, et 'PCIe' pour les erreurs liées au bus. Faites une référence croisée avec les outils de diagnostic matériel et vérifiez si les erreurs correspondent à des activités système spécifiques ou à des conditions environnementales comme les changements de température.
L'ID d'événement 17 peut-il entraîner des plantages système ou une corruption de données ?+
L'ID d'événement 17 représente des erreurs corrigées avec succès, de sorte que la stabilité du système et l'intégrité des données sont maintenues. Cependant, ces événements indiquent que des erreurs non corrigibles peuvent survenir à l'avenir à mesure que le matériel se dégrade. Les corrections de mémoire ECC préviennent la corruption des données, les corrections de cache CPU maintiennent la précision du traitement, et les réessais PCIe assurent une transmission de données fiable. Surveillez les tendances pour prévenir la progression vers des erreurs non corrigibles.
Comment configurer la journalisation WHEA et le rapport d'erreurs pour une meilleure surveillance ?+
Activez la journalisation WHEA détaillée en utilisant 'wevtutil sl Microsoft-Windows-WHEA-Logger/Operational /e:true' et 'wevtutil sl Microsoft-Windows-Kernel-WHEA/Operational /e:true'. Configurez des tailles de journal système adéquates pour éviter la perte d'événements. Mettez en place des scripts de surveillance PowerShell automatisés pour suivre la fréquence et les modèles d'erreurs. Envisagez d'intégrer des solutions de surveillance d'entreprise comme SCOM ou des outils tiers pour un suivi centralisé de la santé matérielle sur plusieurs systèmes.
Documentation

Références (2)

Emanuel DE ALMEIDA
Écrit par

Emanuel DE ALMEIDA

Senior IT Journalist & Cloud Architect

Microsoft MCSA-certified Cloud Architect | Fortinet-focused. I modernize cloud, hybrid & on-prem infrastructure for reliability, security, performance and cost control - sharing field-tested ops & troubleshooting.

Discussion

Partagez vos réflexions et analyses

Vous devez être connecté pour commenter.

Chargement des commentaires...