Posts Tagged Outils
Utiliser memtest pour détecter les erreurs de mémoire RAM
Une bonne pratique de déploiement de serveurs consiste à tester la RAM pendant 24/48h grâce à des outils constructeur ou tiers tels que Memtest86+ qui est probablement le plus connu et réputé. Le but étant, vous l’aurez compris, de détecter les pannes mémoire avant une mise en production.
Avec ce programme, vous pourrez détecter donc les pannes sur les processeurs et chipsets Intel, AMD, SiS, VIA, nVidia etc…de même, vous pourrez déterminer la fréquence mémoire FSB, le statut PAT, les timings mémoire, le statut ECC, le nombre de canaux mémoire, etc…
L’application est mise à jour régulièrement pour refléter les nombreuses évolutions matérielles des constructeurs. N’hésitez pas à vous tenir informé sur le site pour suivre les évolutions.
Preuve de la crédibilité de Memtest86+ dans le domaine IT, des éditeurs tels que VMware recommandent de l’utiliser pour diagnostiquer d’éventuels problèmes hardware ayant amené un crash ESX (voir le KB VMware 1003690). Les “grands” constructeurs eux-mêmes indiquent officieusement (car ils développent leurs propres solutions) qu’ils font confiance au programme, raison de plus pour l’utiliser sereinement…
Pour utiliser Memtest86+, téléchargez-le via l’image ISO mise à disposition sur le site, gravez-la puis démarrez dessus. En principe, les options par défaut suffisent, le but étant principalement de tester en profondeur et surtout dans le temps (le programme ne s’arrête qu’à votre demande !) les barrettes de votre nouveau serveur. Au besoin, vous pourrez configurer sommairement le programme en appuyant sur la touche C pour personnaliser vos tests, ce qui vous proposera quelques options supplémentaires :
Voici un exemple de test réussi sur un chipset Intel i875P :
Ici, un problème mémoire sur un chipset nVidia nForce4 :
Notez enfin que toutes les erreurs signalées par Memtest86+ ne sont pas forcément dues à la RAM étant donné que les tests utilisent – forcément – les mémoires caches L1 et L2 du CPU ainsi que la carte mère. Il est dès lors impossible pour le programme de savoir à 100% du temps d’où viennent les erreurs. Comme pour tout débuggage, on procédera par élimination des éléments suspects pour valider son diagnostic (inversion ou retrait de barrettes notamment).
Installer Dell Open Manage Server Administrator (OMSA) pour VMware ESX 3.5
Publié par Aurélien dans Hardware, Virtualisation le 11 novembre 2009
Pour avoir des informations sur OpenManage et obtenir la dernière version du logiciel, consultez la page dédiée sur le site de Dell.
Préalables à l’installation
- Connectez-vous à l’ESX en root (SSH ou Service Console)
- Vérifiez qu’il reste au minimum 512MB d’espace disque disponible sur la partition /root (se vérifie en tapant df -lh)
- Téléchargez la dernière version d’OpenManage puis envoyez-là dans un répertoire de l’ESX (par exemple /tmp) avec un logiciel supportant le FTP over SSH (SFTP) tel que WinSCP
- Décompressez l’archive avec la commande tar -zxvf (remplacez le nom de fichier de l’exemple par celui qui correspondra au moment du téléchargement…) :
$ tar -zxvf OM_5.5_ManNode_LIN_A00.tar.gz
Procédure d’installation
Installez OpenManage en exécutant le script d’installation dans /tmp/linux/supportscripts/srvadmin-install.sh
$ ./srvadmin-install.sh -b -w -s
- -b : installation de base
- -w : interface web
- -s : OpenManage Storage Management
Une fois l’installation terminée, on démarre les services sans redémarrer le système
$ ./srvadmin-services.sh start
Pour accéder à l’interface web ainsi générée pour l’ESX, il faudra également penser – la première fois – à vérifier que le firewall accepte les connexions sur le port 1311
$ /usr/sbin/esxcfg-firewall -o 1311,tcp,in,OpenManageRequest
Si l’on n’est pas certain que le port en question a déjà été ouvert, il suffira de taper la commande suivante pour lister l’état d’ouverture des ports en temps réel
$ /usr/sbin/esxcfg-firewall -q
Si l’on a besoin de configurer le daemon SNMP, il suffit d’éditer le fichier /etc/snmp/snmpd.conf et d’ajouter les lignes suivantes à la fin du fichier
rocommunity <community_name> trapcommunity <community_name> trapsink <ITA_IP_Address> <community_name>
Quelques informations utiles…
Lorsque l’on se connecte en SSH sur un ESX, on remarque que l’installation s’effectue dans /opt/dell/srvadmin via un lien symbolique OpenManage dans /etc

Pour connaître la version d’OpenManage installée, il suffit de se rendre sur la mire de l’ESX concerné via l’adresse https://<adresse_ip>:1311/ et de cliquer sur le bouton A propos de

Collecter des informations depuis un serveur PowerEdge avec Dell System E-Support Tool (DSET)
Dell System E-Support Tool (DSET) permet de collecter des informations système, hardware et de stockage d’un serveur Dell PowerEdge. Cet outil vous sera notamment utile dans le cadre d’un problème matériel pour lequel vous devrez fournir des informations au support technique.
On télécharge l’application depuis le site de Dell. Ensuite, on copie le fichier .bin sur un disque local de l’ESX à analyser. Pour lancer l’utilitaire, il faut le rendre exécutable (chmod +x) et taper la commande suivante (la version peut bien sûr varier) :
sh delldset_v1.8.1.100.bin
Une fois lancée, l’application demandera de choisir une option pour le rapport. On sélectionnera l’option 2 : Create DSET Report Only
Dell System E-Support Tool (DSET) Options: Choose an option: 1) Read DSET Release Notes First Show latest information concerning features and known issues 2) Create DSET Report Only Creates a DSET report and saves it to user's home directory 3) Clear ESM Hardware Log Only Only clears the ESM Hardware Log contents 4) Install/Upgrade DSET Application Permanently installs or upgrades the DSET application for repeat use Enter option (1-4) or 'q' to quit: 2
Pour faciliter la lecture du technicien Dell on peut renseigner quelques informations supplémentaires :
Company name : <company> E-mail : <e-mail>
Enfin, on choisi les options de rapport suivantes pour générer un fichier pertinent :
Choose Report options: Skip collecting info for all hardware categories(y/n): n Skip collecting info for all storage categories(y/n): n Skip collecting info for all software categories(y/n): n Skip collecting any non-Linux log files(y/n): n Append report filename with timestamp(y/n): y Collect various advanced logs(y/n): y Do you need to store in a different location(y/n): n
Le rapatriement des informations mettra environ 10mn pour s’effectuer (toutes les étapes du génération seront détaillées…). Le tout sera zippé et encodé (mot de passe automatique : dell)


