Binarisation des données sur Excel et transfert vers des logiciels d’analyse : Spss, Stata.

    Pour les besoins d’enquêtes statistiques pour les   études de marché ou les   travaux de recherche scientifique, nous sommes amenés à la binarisation des données. Cependant, cette tâche est souvent perçue comme difficile par les praticiens du marketing au Cameroun.

    Cette publication vise à vous donner les aptitudes pour réaliser vos codages  de données sur forme binaire (1,0) et les exporter vers des logiciels d’analyse comme Spss et Stata. Nous signalons que la binarisation est réalisée dans l’objectif des tests ou analyses statistiques bien précis.

La première étape : Ouvrir votre jeu de données sur Excel

     Le jeu de données est ici le fichier dans lequel vous avez recueilli vos données. Il est possible de l’obtenir automatiquement lorsque vous avez fait une enquête en ligne. Les outils web vous permettent généralement d’exporter les données sur les formats Excel ou Csv.

     Pour le cas d’une enquête terrain, vous pouvez  dépouiller vos données sur un masque de saisie crée à partir de Cs pro ou Epi Info. Par la suite, vous exportez ces données vers Excel.

      Dans notre cas, nous prenons un jeu de données sur format Excel résultant d’une enquête en ligne.

jeu de données quantitatives

Quelques précisions utiles :

  • Notre fichier présente les résultats d’une enquête auprès de 34 internautes ;
  • Nous avons 15 questions allant des colonnes E à S
  • La colonne A correspond au numéro du répondant ;
  • La colonne B est relative à la validité du formulaire renseigné par le répondant (complété : il a répondu à toutes les questions obligatoires ; non complété : le cas contraire).
  • Les colonnes C et B renseignent sur la durée du remplissage du formulaire en ligne par chaque répondant.

La seconde étape : le plan de traitement des données ou de binarisation

    Avant de se lancer dans le codage des données, il est préférable de définir un plan de binarisation. Nous nous intéressons aux colonnes des questions de notre enquête (E à S). La première ligne de chaque colonne présente l’intitulé de la question.

    Nous constatons que les colonnes E, F et J ont les mêmes modalités de réponse : ‘Oui’ , ‘Non’.  Nous allons donc affecter la valeur 1 à ’Oui’ et la valeur 0 à ‘Non’.

    Pour la colonne G, on a cinq modalités de réponse. Elles correspondent aux fréquences d’achat en ligne : ‘Occasionnellement’, ‘Au moins une fois par an’, ‘Au moins une fois par semestre’, ‘Au moins une fois par trimestre’, ’Au moins une fois par mois’.

   Dans le cadre de notre analyse, nous voulons dissocier  les acheteurs réguliers (ceux qui achètent au moins une fois par mois) et des acheteurs occasionnels (autres fréquences). Ainsi nous donner la valeur 1 aux acheteurs réguliers et la valeur 0 aux acheteurs occasionnels.

   Les colonnes G et H sont des questions relatives à l’appréciation de la qualité des produits/services achetés en ligne et au niveau de satisfaction du service d’achat en ligne. Les répondants attribuent une note allant de 1 à 5.

   Pour faciliter notre analyse, nous décidons allons de créer deux groupes : les satisfaits et les internautes à satisfaire. Les satisfaits sont ceux qui ont attribué les notes : ‘3’, ‘4’ et ‘5’. Tandis que les internautes à satisfaire sont ceux qui ont marqué les notes : ‘1’ et ‘2’.

   La valeur 1 sera attribuée aux satisfaits et la valeur 0 sera allouée aux internautes à satisfaire.

  Les colonnes K à S ont les mêmes modalités de réponse : ‘pas du tout d’accord’, ‘pas d’accord’, ‘cela dépend’, ‘plutôt d’accord’ et ‘tout à fait d’accord’. Ici, nous affectons la valeur 0 aux modalités : ‘pas du tout d’accord’, ‘pas d’accord’ et ‘cela dépend’. Tandis que la valeur 1 est affectée aux autres modalités : ‘plutôt d’accord’ et ‘tout à fait d’accord’.

La troisième étape : le codage des données

Nous allons faire recours à l’outil ‘Rechercher et Sélectionner’ situé à l’extrême droite de la barre des outils.

outil rechercher et selectionner

Une fonction de cet outil nous intéresse particulièrement. Il s’agit de la fonction ‘Remplacer’. Nous cliquons  sur la liste déroulante et sélectionnons la fonction ‘Remplacer’. Nous pouvons y accéder directement à travers le raccourci ‘Ctrl+H’.

Une petite fenêtre s’ouvre.

Rechercher et Remplacer

    A ce stade, nous n’avons qu’à entrer la valeur initiale de la modalité à modifier sur la ligne ‘Rechercher’ et insérer la nouvelle valeur à donner à la modalité sur la ligne ‘Remplacer par’.

    Une fois que nous avons fini, nous cliquons sur ‘Remplacer Tout’. Pour éviter des modifications sur toutes les données de votre fichier, sélectionner uniquement la ou les colonne(s) que vous voulez modifier avant d’utiliser la fonction ‘Rechercher et Remplacer’.

    Nous faisons la démonstration avec les modalités : ‘Oui’, ‘Non’, et ‘cela dépend’. Nous notons qu’il faut écrire la modalité telle qu’elle apparaît sur le jeu de données. De même, il ne faut pas confondre la valeur à affecter ‘0’ avec la touche de la lettre ‘O’ du clavier.

Rechercher et Remplacer avec la valeur Oui

 

Résultat

Résultat Rechercher et Remplacer Oui par 1

Rechercher et Remplacer avec la valeur Non

Résultat

Résultat Rechercher et Remplacer Non par 0

 

Rechercher et Remplacer avec la valeur Cela depend

 

Résultat

Résultat Rechercher et Remplacer Cela depend par 0

Le procédé de binarisation est le même pour les autres modifications.

La quatrième étape : exporter les données vers Stata ou Spss

Pour cette étape, il est recommandé d’utiliser le logiciel Stat Transfer. Vous avez quelques liens de téléchargement : https://stattransfer.com/downloads/, https://en.freedownloadmanager.org/Windows-PC/Stat-Transfer.html, https://stat-transfer.software.informer.com/9.0/)

Une fois le codage binaire réalisé, il est conseillé d’enregistrer son fichier Excel sur le type ‘Classeur Excel 97-2003’.

enregistrement classeur excel 97-2003

Une fois que nous installons Stat Transfer, nous l’ouvrons. Nous avons l’interface suivante :

 

interface Stat Transfer

‘Input File Type’  correspond au type de fichier à transférer. Dans notre cas, il s’agit bien d’Excel.

‘File Specification’ : localisation de notre fichier dans notre ordinateur. Nous cliquons sur ‘Browse’ pour rechercher et sélectionner notre fichier à transférer.

‘Output File Type’ est le type de fichier que nous voulons obtenir. Dans notre cas, nous avons SPSS. Il suffit de cliquer sur la liste déroulante pour choisir un autre  type de fichier (Stata, S, SAS…).

Une fois que nous avons renseigné chacune des lignes, nous cliquons sur ‘Transfer’. Dans notre cas, un fichier de type SPSS a été créé dans le dossier où nous avons notre fichier Excel.

utilisation de Stat Transfer

Nous espérons que ces démonstrations vous seront utiles lors de votre binarisation de données. Nous aurons prochainement des publications relatives aux tests et analyses statistiques utilisés en marketing.

Auteur : Josias MIAMDJO, Consultant en marketing et stratégies.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *