Utiliser memtest pour détecter les erreurs de mémoire RAM

Une bonne pratique de déploiement de serveurs consiste à tester la RAM pendant 24/48h grâce à des outils constructeur ou tiers tels que Memtest86+ qui est probablement le plus connu et réputé. Le but étant, vous l’aurez compris, de détecter les pannes mémoire avant une mise en production.

Avec ce programme, vous pourrez détecter donc les pannes sur les processeurs et chipsets Intel, AMD, SiS, VIA, nVidia etc…de même, vous pourrez déterminer la fréquence mémoire FSB, le statut PAT, les timings mémoire, le statut ECC, le nombre de canaux mémoire, etc…
L’application est mise à jour régulièrement pour refléter les nombreuses évolutions matérielles des constructeurs. N’hésitez pas à vous tenir informé sur le site pour suivre les évolutions.

Preuve de la crédibilité de Memtest86+ dans le domaine IT, des éditeurs tels que VMware recommandent de l’utiliser pour diagnostiquer d’éventuels problèmes hardware ayant amené un crash ESX (voir le KB VMware 1003690). Les « grands » constructeurs eux-mêmes indiquent officieusement (car ils développent leurs propres solutions) qu’ils font confiance au programme, raison de plus pour l’utiliser sereinement…

Pour utiliser Memtest86+, téléchargez-le via l’image ISO mise à disposition sur le site, gravez-la puis démarrez dessus. En principe, les options par défaut suffisent, le but étant principalement de tester en profondeur et surtout dans le temps (le programme ne s’arrête qu’à votre demande !) les barrettes de votre nouveau serveur. Au besoin, vous pourrez configurer sommairement le programme en appuyant sur la touche C pour personnaliser vos tests, ce qui vous proposera quelques options supplémentaires :

Voici un exemple de test réussi sur un chipset Intel i875P :

Ici, un problème mémoire sur un chipset nVidia nForce4 :

Notez enfin que toutes les erreurs signalées par Memtest86+ ne sont pas forcément dues à la RAM étant donné que les tests utilisent – forcément – les mémoires caches L1 et L2 du CPU ainsi que la carte mère. Il est dès lors impossible pour le programme de savoir à 100% du temps d’où viennent les erreurs. Comme pour tout débuggage, on procédera par élimination des éléments suspects pour valider son diagnostic (inversion ou retrait de barrettes notamment).

,

  1. Poster un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :