You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: devel/tutorials/A10La_anova/A10La_anova.Rmd
+33-27Lines changed: 33 additions & 27 deletions
Original file line number
Diff line number
Diff line change
@@ -35,21 +35,23 @@ Vous avez découvert il y a peu la moyenne et plusieurs tests d'hypothèse assoc
35
35
36
36
Si vous pensez que faire des comparaisons 2 à 2 est une bonne idée, retournez directement lire le [module 10](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/variance.html) de SDD I.
37
37
38
-
{width='30%'}
38
+
{width='30%'}
39
39
40
40
Si vous pensez qu'il serait judicieux de réaliser une analyse de variance (ANOVA), continuez ce tutoriel pour découvrir toutes les subtilités qui se cachent derrière ce test d'hypothèse.
41
41
42
+
{width='30%'}
43
+
42
44
Dans ce learnr, vous allez pouvoir auto-évaluer votre capacité à\ :
43
45
44
-
- Pouvoir réaliser des graphiques relatifs à la distribution du F
46
+
- Pouvoir réaliser des graphiques relatifs à la distribution F
45
47
46
48
- Appliquer le modèle linéaire, anciennement analyse de variance (ANOVA).
47
49
48
50
- Savoir effectuer des tests de comparaison multiples
49
51
50
52
## Distribution F
51
53
52
-
Avant de vous lancer dans une ANOVA, nous allons d'abord nous intéresser à la distribution associée à ce modèle qu'est la distribution F. La distribution F est une distribution asymétrique n’admettant que des valeurs nulles ou positives.
54
+
Avant de vous lancer dans une ANOVA, nous allons d'abord nous intéresser à la distribution associée à ce modèle qu'est la distribution F. La distribution F est une distribution asymétrique n’admettant que des valeurs nulles ou positives (cela devrait vous rappeler une distribution vue dans un des modules précédents).
53
55
54
56
Afin de répondre à la question suivante, vous devez avoir bien assimilé la technique pour déterminer le nombre de degrés de liberté intragroupe et intergroupe ;)
grade_code("Le code pour obtenir ce graphique est un peu long... mais le snippet est là pour vous préremplir la majeure partie ! Vous avez cependant su convertir le nombre d'observations et le nombre de groupe en nombre de degrés de liberté intrgroupes et intergroupes.")
104
+
grade_code("Le code pour obtenir ce graphique est un peu long... mais le snippet est là pour vous préremplir la majeure partie ! Vous avez cependant su convertir le nombre d'observations et le nombre de groupes en nombre de degrés de liberté intragroupe et intergroupe.", "Il semble que tu n'a pas su déterminer correctement les nombres de degrés de liberté. Si n correspond au nombre d'observations et k au nombre de groupes, alors le nombre de degrés intergroupe vaut k – 1 et le nombre de degrés intragroupe vaut n – k.")
103
105
```
104
106
105
107
@@ -112,7 +114,7 @@ Vous allez réaliser une analyse complète sur l'effet de la vitamine C sur la c
112
114
{width='50%'}
113
115
114
116
115
-
Le jeu données comprend les informations suivantes.
117
+
Le jeu données comprend les informations suivantes :
L'exploration des données est une étape indispensable pour traiter correctement vos données. Si vous avez des doutes, n'hésitez pas à relire les modules [2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu1.html), [3](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu2.html) et [4](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu3.html) de SDD1.
163
+
L'exploration des données est une étape indispensable pour traiter correctement vos données. Si vous avez des doutes, n'hésitez pas à relire les modules [2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu1.html), [3](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu2.html) et [4](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu3.html) de SDD I.
162
164
163
165
#### Réalisation d'un tableau résumé des données
164
166
165
-
Réalisez un tableau proposant les moyennes et les écart-types de la longueur des dents des cochons d'Inde pour chaque dose administrée en vitamine C ainsi que le nombre d'observations par groupe. Le jeu de données a utiliser est donc `tooth_vc`.
167
+
Réalisez un tableau proposant les moyennes et les écart-types de la longueur des dents des cochons d'Inde pour chaque dose administrée en vitamine C ainsi que le nombre d'observations par groupe. Le jeu de données à utiliser est donc `tooth_vc`.
166
168
167
169
💬 **Ce code correspond au snippet `.hmanova1desc`**
168
170
@@ -208,7 +210,11 @@ ___ %>.%
208
210
```
209
211
210
212
```{r tooth_tab_h2-hint-1}
213
+
tooth_vc %>.%
214
+
group_by(., ___) %>.%
215
+
summarise(., mean = mean(___), sd = sd(___), count = sum(!is.na(___)))
grade_code("Tu obtiens le graphique adéquats qui permet de comparer la longueur des dents en focntion de la dose administrée.")
249
+
grade_code("Vous obtenez le graphique adéquats qui permet de comparer la longueur des dents en focntion de la dose administrée.")
244
250
```
245
251
246
-
*L'ANOVA a pour objectif de comparer des moyennes entre elles alors que la boîte de dispersion va vous représenter les 5 nombres qui sont des descripteurs non-paramétriques. Les boites de dispersion ne sont peut être pas le meilleur outils. Il est cependant très utilisé.*
252
+
*L'ANOVA a pour objectif de comparer des moyennes entre elles alors que la boîte de dispersion va vous représenter les 5 nombres qui sont des descripteurs non-paramétriques.*
247
253
248
254
Maintenant que vous avez pris connaissance de vos données grâce à un tableau et un graphique, vous pouvez réaliser votre test d'hypothèse.
249
255
250
256
251
257
### Vérification des conditions d'applications
252
258
253
-
L'ANOVA a une série de conditions d'application
259
+
Pour réaliser une ANOVA, il faut respecter une série de conditions d'application
254
260
255
261
- échantillon représentatif (par exemple, aléatoire),
256
262
- observations indépendantes,
257
263
- variable dite réponse quantitative,
258
264
- une variable dite explicative qualitative à trois niveaux ou plus,
259
265
- distribution normale des résidus,
260
-
- homoscédasticité (même variance intragroupes, “homoscedasticity” en anglais, opposé à hétéroscédasticité = variance différente entre les groupes).
266
+
- homoscédasticité (même variance intragroupe).
261
267
262
268
Les deux dernières conditions **doivent être vérifiées**.
263
269
@@ -269,42 +275,38 @@ Il existe plusieurs tests qui permettent de vérifier l'homoscédasticité. Nous
grade_code("Tu as réalisé l'instruction correcte. Le plus important est encore à faire. Réponds donc à la question suivante.")
286
+
```{rtooth_bart-check}
287
+
grade_code("vous avez réalisé l'instruction correcte. Le plus important est encore à faire. Répondez donc à la question suivante.")
286
288
```
287
289
288
290
```{r bart_quiz1}
289
291
question("Y a t'il homoscédasticité des variances ?",
290
292
answer("oui", correct = TRUE),
291
293
answer("non"),
292
-
correct = "Super, tu as su correctement analyser les résultats de ton test. ",
293
-
incorrect = "Il semble que tu n'as pas bien compris la notion d'homoscédasticité ou que tu n'as pas su définir correctement les hypothèses de ce test de Bartlett.",
294
+
correct = "Super,vous avez su correctement analyser les résultats de ton test. ",
295
+
incorrect = "Il semble que vous n'avez pas bien compris la notion d'homoscédasticité ou que vous n'avez pas su définir correctement les hypothèses de ce test de Bartlett.",
294
296
allow_retry = TRUE)
295
297
```
296
298
297
299
### ANOVA
298
300
299
-
Après avoir réalisé vérifié l'homoscédasticité, il est temps de réalisez l'analyse de variances. L'instruction ci-dessous corresponds au snippet `.hmaniva1`. Il est intéressant d'analyser cette instruction.
301
+
Après avoir réalisé vérifié l'homoscédasticité, il est temps de réaliser l'analyse de variances. L'instruction ci-dessous corresponds au snippet `.hmaniva1`. Il est intéressant d'analyser cette instruction.
300
302
301
-
La fonction `lm()` requiert un jeu de données et une formule. Vous êtes habitué à cet interface formule que vous utilisez dans la réalisation de vos graphiques ou de vos tests d'hypothèses précédents. Cette fonction calcule un objet de class `lm` assigné à `anova.` La fonction lm est fonction puissante qui permet de calculer des modèles linéaires que nous verrons dans le cadre du cours de SDD II. Une ANOVA est en fait une variante du modèle linéaire. De cet objet `anova.`, on calcule le tableau de l'ANOVA grâce à la fonction `anova()`.
303
+
La fonction `lm()` requiert un jeu de données et une formule. Vous êtes habitué à cet interface formule que vous utilisez dans la réalisation de vos graphiques ou de vos tests d'hypothèse précédents. Cette fonction calcule un objet de class `lm` assigné à `anova.` La fonction lm est fonction puissante qui permet de calculer des modèles linéaires que nous verrons dans le cadre du cours de SDD II. Une ANOVA est en fait une variante du modèle linéaire. De cet objet `anova.`, on calcule le tableau de l'ANOVA grâce à la fonction `anova()`.
302
304
303
305
```{r, echo = TRUE, eval=FALSE}
304
306
anova(anova. <- lm(data = DF, YNUM ~ XFACTOR))
305
307
```
306
308
307
-
Réalisez votre modèle ANOVA qui porte donc sur la longeur des dents de cochons d'Inde en fonction de la dose administrée.
309
+
Réalisez votre modèle ANOVA qui porte donc sur la longueur des dents de cochons d'Inde en fonction de la dose administrée.
@@ -351,7 +357,7 @@ question("Y a t'il un effet significatif de la dose administrée sur la croissan
351
357
answer("oui", correct = TRUE),
352
358
answer("non"),
353
359
correct = "Bravo, vous avez correctement analysé votre tableau de l'analyse de la variance. L'ANOVA vous permet de savoir qu'au moins un des groupes diffère des autres. Vous allez devoir réaliser une analyse complémentaire pour déterminer quel groupe diffère des autres.",
354
-
incorrect = "Il semble que tu as mal analysé le tableau de l'analyse de la variance ou que les hypothèses nulle et alternative sont mal définies.",
360
+
incorrect = "Il semble que vous avez mal analysé le tableau de l'analyse de la variance ou que les hypothèses nulle et alternative sont mal définies.",
grade_code("Avec l'aide des snippets, il est relativement simple de réaliser un test post hoc. Cette analyse se base sur l'objet .anova réalisé précédement. Le plus important va être d'interpréter ces résulats. Il est possible de le faire graphiquement ou sur base la sortie R. Les niveaux de la variable facteur votn être comparé 2 à 2 avec un correction via la méthode HSD de Tukey.")
383
+
grade_code("Avec l'aide des snippets, il est relativement simple de réaliser un test post hoc. Cette analyse se base sur l'objet anova. réalisé précédement. Le plus important va être d'interpréter ces résulats. Il est possible de le faire graphiquement ou sur base la sortie R. Les niveaux de la variable facteur votn être comparé 2 à 2 avec un correction via la méthode HSD de Tukey.")
0 commit comments