COURS
EXPERTISE STATISTIQUE EN MARKETING
1. Objectifs pédagogiques
Identifier le bon test statistique à réaliser compte tenu de la problématique managériale
marketing
Opérer des tests statistiques sur le logiciel JAMOVI
Savoir interpréter les outputs des tests statistiques
Proposer la bonne décision managériale à prendre suite aux résultats des tests statistiques
2. Contenu du cours ESM
1) Manipulation de JAMOVI et préparation des données
2) Test de Khi-deux
3) Test de Pearson
4) Test de Spearman
5) Test de comparaison de moyennes sur échantillons indépendants
6) Test de comparaison de moyennes sur échantillons appariés
7) Test d’ANOVA un facteur
8) Test de régression linéaire simple
9) Test de linéaire multiple
10) Test de régression logistique
Volume horaire : 20h
Agenda du cours : fin en principe le 17 mars
Évaluation : Examen final classique -> partiel
Pour les variables qualitatives, je ne peux calculer que les fréquences.
Variable nominale -> on ne peut pas calculer la moyenne, la médiane etc mais juste les
fréquences
I- Manipulation de JAMOVI et préparation des données
Importer base « open »
Faire ajustement notamment sur types de variables dans onglet « variables ». Double
cliquer sur chaque variable pour changer type ou autre ( voir questionnaire de base).
« Description » c’est pour écrire la question mais pas obligatoire
Traitement données -> onglet « analyses » , « exploration », « descriptives »
On choisit les variables auxquelles on s’intéresse pour les décrire . Exemple : on s’intéresse à
la variable âge
Descriptives « variables across
columns »
Interprétation : 25% des répondants ont moins de 20 ans
Plus l’écart type est élevé, plus les variables sont hétérogènes : standard deviation 7,48
Pour avoir graphique -> plots « histogram »
C’était pour les variables quanti
Pour les variables quali -> faut tout découcher, écart type, médiane, moyenne -> pas de
sens de le calculer pour variables quali. Par contre on peut cocher « frequency tables »
La majorité des valeurs s’approchent de la moyenne. On peut utiliser la moyenne comme
indicateur de comparaison.
La moyenne n’est pas toujours un indicateur de comparaison !
La distribution suit-elle un loi normale ? Oui
Les premiers indicateurs peuvent êtres représentes graphiquement sous forme de boite
à moustache. C’est un graphique très intéressant qui synthétise ces informations.
Plot < Box plot (boite à moustache)
3. Analyses préliminaires sur les données
Boites à moustaches : représenter plusieurs indicateurs sur un seul graphique – min et
max de la série
- 3e quartile
- médiane
- 1er quartile
- valeurs extrêmes
Obj : capacité a combiner plusieurs variables
La ligne inférieure c’est le 1er quartile
La ligne supérieure de la boite est le 3e quartile
= Boîte qui vient décrire de manière statistique et visuelle l’ensemble des variables
descriptives
VOIR SLIDE
On peut modifier les titres de la boite à moustache en allant dans Edit
Pour les variables qualitatives (nominales et ordinales)
Cliquer sur « frequency tables » pour avoir les %
Les 3 points verticaux en haut à droite pour changer couleur par ex
Pour rajouter les packages, il faut aller dans « module » < manage installed
Quand on croise 3, 4 ou 5 variables et qu’on s’intéresse à une variable quanti, je pourrai
utiliser les boîtes à moustache.
Comment faire un score moyen par ex
Data < compute
Tests statistiques
Transformation de variables
Data < transform
Using transform < Add recode condition
puis changer type de variable à nominale
Filtrage
Data < filters
Peut être activé ou désactivé, et même supprimé et caché
Erreur dans le 2e point « 18 à 24 ans »
1)
2)
3)
<= car « non satisfait »
Puis je cherche dans Analyse < exploration < descriptive < montant de la commande
Rattraper 3 cours !
7. Test de régression linéaire simple
Ce test vise à examiner l’existence d’une relation de cause à effet entre une variable
indépendante quantitative et une variable dépendante quantitative
Ce test permet de modéliser une relation linéaire entre deux variables à l’aide d’une
équation mathématique : Y =a x+b
Elle indique si la variable indépendante explique une partie de la variable dépendante
Exemples :
La satisfaction des clients a-t-elle un effet positif sur la part de marché ? Si oui, de
combien la part de marché peut augmenter lorsque le niveau de satisfaction augmente
de 1 point ?
La
satisfaction La part de
marché
Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?
Étape 1 :
D’abord, il faut analyser s’il y a un effet de la variable indépendante sur la variable
dépendante. Pour cela, il faut interpréter les résultats du test F
Nous constatons dans le tableau ci-dessus qu’il y a une relation statistiquement
significative entre la variable dépendante (l’intention de revenir) et la variable
indépendante (satisfaction). La satisfaction explique significativement l’intention de
revenir au restaurant
Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?
Étape 2 :
R² (R-deux) indique la proportion de variance totale de l’intention de revenir expliquée
par la satisfaction globale
La satisfaction explique 1,69% de la variabilité de l’intention de revenir au restaurant
Il est compris entre 0 et 1
R² = 0 : la variable indépendante n’explique rien
R2 = 1 : la variable indépendante explique complètement Y
Exemple : la satisfaction globale influence-t-elle l’intention de revenir au restaurant ?
Étape 3 :
La satisfaction a un effet significatif et positif sur l’intention de revenir au restaurant
Y = a X + b avec a = coeff non standardisé 0,2
L’intention de revenir = 0,200 (coeff non standardisé) satisfaction + 3,913
Si la satisfaction augmente de 1 point, l’intention de revenir augmente 0,2 point
8. Test de régression linéaire multiple
Ce test vise à expliquer la variance d’une variable dépendante à l’aide d’une combinaison
de plusieurs facteurs explicatifs (variables indépendantes)
Ce test permet de modéliser cette relation linéaire à l’aide d’une équation
mathématique :
Y =a1 x 1 +a 2 x 2+ an xn +... b
Exemple :
Est-ce que la part de marché varie en fonction du niveau de satisfaction des clients, du
nombre ……
Exemple : Dans quelle mesure, la satisfaction vis-à-vis des prix pratiqués, de l’efficacité du
personnel, de la facilité à trouver de l’information influencent-ils l’intention de revenir au
restaurant ?
Premier tableau à analyser : Model
Étape 1 :
Nous constatons ci-dessus qu’il y a une relation statistiquement significative entre
intention de revenir et les variables indépendantes (satisfaction vis-à-vis des prix
pratiqués, de l’efficacité du personnel, de la facilité à trouver de l’information).
Étape 2 :
8% de l’intention de revenir au restaurant est expliquée par la combinaison de trois
variables : la satisfaction vis-à-vis des prix pratiqués, l’efficacité du personnel et la facilité
à trouver de l’information
Étape 3 :
Regarder la sig de chaque variable
Regarder si c’est posi ou nega
On voit que
La satisfaction de l’efficacité du personnel a un effet significatif ET positif sur l’intention
de revenir au restaurant
La satisfaction de facilité de trouver l’information a un effet significatif MAIS négatif sur
l’intention de revenir au restaurant => plus gens ont facilité de trouver infos moins ils
auront intention de revenir au resto
La satisfaction de prix a PAS un effet significatif, aucun impact sur l’intention de revenir
au restaurant
DONC : combi de 3 facteurs est significatif mais la satisfaction du prix à elle seule n’a pas un
effet significatif sur intention
Quelle est la variable qui explique le plus l’intention de revenir au resto ?
Regarder la valeur de Beta la plus élevée ici │Bêta│ = │0,2547│ > │-0,1701│
=> efficacité du personnel est celle qui explique le plus intention de revenir au resto
Pour améliorer modèle : on sort la variable qui n’est pas significative : ici c’est la satisfaction
prix
9. Test de régression logistique
Ce test vise à tester un modèle de régression dont la variable dépendante est nominale
(dichotomique) et dont le(s) variable(s) peuvent être quantitative(s) ou qualitative(s).
Ce test permet de prédire la probabilité qu’un événement survienne ou non en fonction
de(s) variable(s) explicative(s)/prédictive(s)
Exemples :
Est-ce que la note de techniques d’enquête en management, la note de marketing, l’âge
de l’étudiant permettent de prédire la réussite ou l’échec à l’examen d’expertise
statistique en marketing ?
Est-ce que le revenu, le lieu d’habitation et la taille du foyer permettent de prédire le
défaut de remboursement ? Ces variables permettent-elles de distinguer les mauvais des
bons emprunteurs ?
Est-ce que la CSP, le lieu d’habitation, l’âge et le degré de respect des gestes barrières
permettent-ils de prédire la probabilité de contracter la Covid-19 ?
Exemple : Est-ce que l’âge du client et le montant de la commande permettent-ils de prédire
la probabilité d’insatisfaction ou de satisfaction envers le restaurant ?
Nous pouvons dire que le modèle permet de prédire significativement la probabilité
d’insatisfaction ou de satisfaction envers le restaurant
L’âge affecte négativement la chance d’être satisfait envers le restaurant. Plus le client
est âgé, plus la chance d’être satisfait diminue.
Le montant de la commande ne permet pas de prédire la probabilité d’insatisfaction et
de satisfaction envers le restaurant
Application (demander qq)
Le manager du restaurant vise à expliquer certains réactions et comportements de ces
clients. Il se pose, ainsi, les questions suivantes :
Dans quelle mesure la satisfaction envers la rapidité du service et la satisfaction vis-à-
vis de l’amabilité du personnel influencent-elles l’intention de retour au restaurant ?
(demander à quelqu’un)
Jamovi < Regression < Linéraire
(pas tout à fait les
mêmes données que le prof)
Il existe une relation statistiquement significative entre x et x et x et x, car P inférieur ou égal
à 0,1 (strictement inférieur à 5%).
R carré = 0,0587 : L’amabilité du personnel, et la rapidité du service expliquent 5,87% de la
variance de l’intention de revenir
2e tableau : coefficients
Les résultats du tableau 2 montrent que l’amabilité du personnel a un impact significatif et
positif sur l’intention de retour au restaurant car P < 0,001 soit inférieur à 5%. Et positif car
bêta (Estimate) est positif (0,2091). Autrement dit, plus le personnel est aimable, plus les
consommateurs ont l’intention de revenir au restaurant.
Les résultat du tableau 2 montrent que la rapidité du service n’a pas d’effets significatifs sur
l’intention de revenir au restaurant.
Est-ce que la satisfaction globale, l’âge du client, la proximité du domicile permettent
de prédire l’intention de revenir ou non au restaurant ?
Pour répondre à cette questions il convient de réaliser un test de corrélation statistique car il
s’agit de tester la relation prédiction entre plusieurs variables indépendantes, et une variable
dépendante de nature qualitative dichotomique.
Il faut transformer la variable intention de revenir
Analyse < regression < logistique binomial
Les résultats du tableau 1 montrent que la combinaison permettent de prédire
significativement l’intention de revenir ou non au restaurant car P est inférieur à 5%.
R deux Mcf = 0,120 : cela signifie que …. ?
L’âge a un effet significatif sur l’intention de revenir au restaurant car P = 0,005. Cela signifie
que l’âge permet de prédire l’intention de revenir, plus précisément il ressort que plus on est
âgé, moins la probabilité de revenir au restaurant est forte et vice-versa.
Le montant de la commande dépend-il de la situation de la consommation (client seul
vs client accompagné) ?
Y a-t-il un lien entre l’âge du client et sa fréquence de visite du restaurant ?
Quelle proportion de la variance de la satisfaction globale est expliquée par le niveau de
satisfaction moyen envers le personnel (amabilité, efficacité et apparence) ?
Rattraper dernières q
Pour ajouter des packages : analyses<modules+ < bilbiothèque jamovi < flexplot et jjstatplot
Pour utiliser ses packages, pas d’espaces et pas de caractére spéciaux
JJSTATPLOT
Analyses < jjstatplot < exploration : dans variables Temperature -> split by Sexe -> box flots
(boite à moustache)
1er graphe
JjstatPlot < Histogram < Variables Age > Split By Sexe
Il est intéressant de croiser les variables, dans cet exemple 3 histogrammes, un pour les
hommes un pour les femmes et un selon la population totale en fonction de l’âge.
Dans Plot>values on Bars on peut changer à « proportion » pour mettre % ou alors mix pour
avoir effectif et proportion
Comme je croise variable une variable quanti avec quali, on nous donne le résultat du test T
qui peut être également intéressant => Femme, moyenne 30 ans et hommes ?, différence
significative
Analysis < Measure < moyenne ou médiane selon ce que l’on cherche
2e graphe- Matrice de corrélation
JJstatPlot < Correlation Matrix < sélectionner les variables quanti que l’on souhaite (ici
caractéristique environnement de vente donc est-ce que lien entre agencement et facilité de
déplacement ? ou alors entre ressenti plaisir et musique ?) < Dependent variables :
temperature, musique, lumiere, accesibilite, deplacement, agencement
Autre graphe pour s’intéresser à la relation entre variable quanti et quali ou alors plusieurs
variables quali
JJstatPlot > Box Violin Plots to compare between groups
La variable de dépendance est la température en ordonné et sur l’axe des abscisses on a les
différentes catégories de CSP avec entre parenthèses l’effectif de chaque groupe.
L’information la plus importante est de voit la moyenne -> les points rouges, plus ils sont
hauts plus ils sont importants. Ceux qui apprécient le plus la température est la CSP+ avec
4,19 de moyenne.
A l’intérieur des violons on a une boite à moustache. Le trait qui coupe la boite est la
médiane. Le trait supérieur de la boite est le quart type 3 et le trait inférieur est le quart type
1.
Si on prend le premier diagramme, on voit que le diagramme est large au niveau de la
moyenne, cela veut dire qu’il y a beaucoup de répondants. Plus il est large, plus il y a de
répondants. La plupart des répondants de la CSP+ ont répondu ?. Pour la CSP- c’est large au
niveau du quart type 1, la plupart des résultat sont au niveau de 2,5.
On sait qu’on a une moyenne de 4,19 mais la tendance est atour de la moyenne, pour le 2 e,
la majorité de la réponse est de 2,5/3.
On peut multiplier ce graphe, en le divisant selon une autre variable. Ici sexe
Dernier graphe de Jjstat pour croiser deux variables quali et PAS DE QUANTI !!
Jjspot < Bar Charts
Entre variable CSP et sexe
Test de Khi 2 n’est pas significatif donc pas de différence significative entre hommes et
femmes en terme de proportion
Ce qui est intéressant est d’aller plus loin en croisant 3 variables quali : par exemple
répartition des clients selon moments de la journée
A midi, les visiteurs que ce soit hommes ou femmes -> CSP-
Le soir on a les inactifs et les CSP+ que ce soit hommes ou femmes
En revanche, on a une surreprésentation de CSP+
FLEXPLOT
Fait la même chose JjSpotPlot mais moins riche. Mais son avantage comparatif est l’étude de
l’effet de régression.
FlexPlot < General Linear Model pour étudier relations de cause a effet des variables
Variables de nature quanti !
Y-a-t-il Lien entre agencement et plaisir ?
On fait généralement des nuages de points
Variable indépendante sur l’axe des abscisses ici agencement et la variable dépendant sur
celle des ordonnées ici plaisir
Graphic options < Fitted line < changer à Regression
Interpréter les résultats sur la base du graphique au partiel!
Première chose à voir : Quelle est la variable dépendante et indépendante ?
On s’intéresse entre la relation de cause à effet entre agencement du point de vente et le
plaisir du ressenti.
Les points représentent des individus et les coordonnées sont les réponses.
Ce qui nous intéresse le plus est la droite. Celle de notre exemple indique une relation
positive car plus x augmente alors plus y augmente => relation positive entre agencement et
plaisir. Plus satisfait par l’agencement, plus ils ressentent du plaisir
La relation est-elle faible ou forte ? il suffit de regarder la pente de la droite qui reflète le
coefficient a (y=ax+b). ici, notre pente est relativement faible donc la relation est faible.
Si la droite est plate, il n’y a pas d’effet, pas de relation.
IL FAUT REGARDER QUEL EST LE SENS ET LA PENTE DE LA DROITE
Relation entre plaisir et accessibilité
Ici, le plaisir ne varie pas. L’accessibilité n’influence pas forcément le plaisir => pas de
relation
On rajoute la variable temperature
On a 3 graphes car Jamovi a découpé cette variable en 3 modalités.
On constate visuellement, que dans le cas de la température appréciée modérément et dans
le cas où la température est pas du tout appréciée, il n’y a pas d’impact -> droite quasiment
plate, pas d’effet d’accessibilité dans ces deux cas.
En revanche, quand température est bien apprécie par le client, l’accessibilité a un impact
sur le plaisir -> pente. L’accessibilité est en mesure d’influencer positivement lorsque la
température est appréciée.
FlexPlot < flexplot -> la même chose qu’au-dessus
QCM EN COURS – questions screen shot Mimi
Partiel – 4 exercices pendant 1h30, on a un tableau de résultats et on nous demande
d’interpréter . Justifier utilisation de ce test, quel es l’intérêt managérial de ce test ? (ce qui
se cache derrière le test).
2 ou 3 ex de ce type
1 exercice sur présentation graphique et il faut interpréter
Exercice où on nous demande de préciser le test statistique (peut être un QCM)
ATTENTION AUX PIEGES : tableau de résultats avec nature des variables précisées et on nous
demande l’interprétation alors que peut-être il fallait pas faire ce test.
4 ou 5 mai
Correction QCM – Document atmosphère du point de vente carrefour City
1- Deux variables quanti : musique et déplacement
Test de corrélation de Pearson ou régression linéaire
Test de régression linéaire est plus puissant que celui de corrélation
Corrélation positive donc plus la musique est plaisante, plus le déplacement est facile
2- Ici on a une variable quantitative (senteur) et une variable quali (sexe) qui a deux
modalités (homme/femme : si on rajoute modalité autre alors change la nature du test)
On compare le score des homme et des femmes en termes de comparaison de moyenne
Test t pour échantillon appariés ??
Pas de différence entre homme et femme donc pas de relation
3- Variable qualitative avec trois modalités (CSP) et variable quantitative
Test Anova ?
Test n’est pas significatif, CSP pas d’effet sur la recommandation
4- Deux variable quali
Test de khi-deux
Il y a bien un lien entre le genre et le fait d’avoir fréquenté ou non le magasin, lien de
dépendance
5- Deux variables quantitatives
Test de corrélation de pearson et test de régression linéaire
On s’intéresse à la relation de cause à effet donc cause de régression linéaire
Test de régression linéaire
Variable Dépendante –> recommandation
Influe fortement
6- Comparer deux moyennes obtenues sur l’agencement et vis-à-vis de la lumière
Test sur échantillon apparié
Test t échantillon apparié
Il y a une différence significative
7- Homme -> on est pas sur la variable genre !
Comparer moyennes obtenues sur agencement, musique et senteur en prévision
Pas une seule moyenne comme dans q. 6
Test Anova intra-sujets
Il faut mettre dans Level les 3 différentes étiquettes (musique, agencement et senteurs-
Puis en bas variables associées
Faut créer un filtre pour garder que les hommes
Avec JAMOVI -> Ils apprécient plus l’agencement que les senteurs et la musique
8- Variable quanti avec variable quali (moments de la journée)
Cette variable quali à + de 2 modalités donc Anova car 3 modalités
Test ANOVA inter-sujets
Pas de différence significative, le plaisir ne varie pas selon le moment de la journée donc pas
d’impact
9- Variable qualitative nominale (apprécier) et plusieurs variables, quel que soit leur nature
on utilise => le test de régression logistique
Transformer la variable -> si sup ou égal à 4 pas apprécier et sinon oui apprécié
Puis sur Jamovi analyse de régression logistique (binomial logistic regression)
Temps en fonction d’âge et musique
10- Variables quantitatives
Test de régression linéaire multiple
L’ensemble de ces variables expliquent 89,9% ? de l’appareillage du plaisir pour savoir celle
qui agit le plus regarder le coeff standardisé
Agencement n’a pas d’impact car la plus-value est sup à 5%
La lumière agi positivement et les senteurs aussi car plus-value inf à 5%
La variable qui agit le plus sont les senteurs