Skip to content

Commit 88fa962

Browse files
minor modifications A10La
1 parent 69ed554 commit 88fa962

File tree

1 file changed

+33
-27
lines changed

1 file changed

+33
-27
lines changed

devel/tutorials/A10La_anova/A10La_anova.Rmd

Lines changed: 33 additions & 27 deletions
Original file line numberDiff line numberDiff line change
@@ -35,21 +35,23 @@ Vous avez découvert il y a peu la moyenne et plusieurs tests d'hypothèse assoc
3535

3636
Si vous pensez que faire des comparaisons 2 à 2 est une bonne idée, retournez directement lire le [module 10](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/variance.html) de SDD I.
3737

38-
![](images/stop.png){width='30%'}
38+
![](images/red-traffic-lights.png){width='30%'}
3939

4040
Si vous pensez qu'il serait judicieux de réaliser une analyse de variance (ANOVA), continuez ce tutoriel pour découvrir toutes les subtilités qui se cachent derrière ce test d'hypothèse.
4141

42+
![](images/green-traffic-lights.png){width='30%'}
43+
4244
Dans ce learnr, vous allez pouvoir auto-évaluer votre capacité à\ :
4345

44-
- Pouvoir réaliser des graphiques relatifs à la distribution du F
46+
- Pouvoir réaliser des graphiques relatifs à la distribution F
4547

4648
- Appliquer le modèle linéaire, anciennement analyse de variance (ANOVA).
4749

4850
- Savoir effectuer des tests de comparaison multiples
4951

5052
## Distribution F
5153

52-
Avant de vous lancer dans une ANOVA, nous allons d'abord nous intéresser à la distribution associée à ce modèle qu'est la distribution F. La distribution F est une distribution asymétrique n’admettant que des valeurs nulles ou positives.
54+
Avant de vous lancer dans une ANOVA, nous allons d'abord nous intéresser à la distribution associée à ce modèle qu'est la distribution F. La distribution F est une distribution asymétrique n’admettant que des valeurs nulles ou positives (cela devrait vous rappeler une distribution vue dans un des modules précédents).
5355

5456
Afin de répondre à la question suivante, vous devez avoir bien assimilé la technique pour déterminer le nombre de degrés de liberté intragroupe et intergroupe ;)
5557

@@ -99,7 +101,7 @@ abline(h = 0, col = "gray") # Baseline
99101
```
100102

101103
```{r fplot_h2-check}
102-
grade_code("Le code pour obtenir ce graphique est un peu long... mais le snippet est là pour vous préremplir la majeure partie ! Vous avez cependant su convertir le nombre d'observations et le nombre de groupe en nombre de degrés de liberté intrgroupes et intergroupes.")
104+
grade_code("Le code pour obtenir ce graphique est un peu long... mais le snippet est là pour vous préremplir la majeure partie ! Vous avez cependant su convertir le nombre d'observations et le nombre de groupes en nombre de degrés de liberté intragroupe et intergroupe.", "Il semble que tu n'a pas su déterminer correctement les nombres de degrés de liberté. Si n correspond au nombre d'observations et k au nombre de groupes, alors le nombre de degrés intergroupe vaut k – 1 et le nombre de degrés intragroupe vaut n – k.")
103105
```
104106

105107

@@ -112,7 +114,7 @@ Vous allez réaliser une analyse complète sur l'effet de la vitamine C sur la c
112114
![](images/guinea-pig.jpg){width='50%'}
113115

114116

115-
Le jeu données comprend les informations suivantes.
117+
Le jeu données comprend les informations suivantes :
116118

117119
```{r, echo = TRUE}
118120
# importation
@@ -158,11 +160,11 @@ tooth_vc <- filter(toothgrowth, supp == "VC")
158160

159161
### Exploration des données
160162

161-
L'exploration des données est une étape indispensable pour traiter correctement vos données. Si vous avez des doutes, n'hésitez pas à relire les modules [2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu1.html), [3](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu2.html) et [4](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu3.html) de SDD1.
163+
L'exploration des données est une étape indispensable pour traiter correctement vos données. Si vous avez des doutes, n'hésitez pas à relire les modules [2](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu1.html), [3](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu2.html) et [4](https://wp.sciviews.org/sdd-umons/?iframe=wp.sciviews.org/sdd-umons-2020/visu3.html) de SDD I.
162164

163165
#### Réalisation d'un tableau résumé des données
164166

165-
Réalisez un tableau proposant les moyennes et les écart-types de la longueur des dents des cochons d'Inde pour chaque dose administrée en vitamine C ainsi que le nombre d'observations par groupe. Le jeu de données a utiliser est donc `tooth_vc`.
167+
Réalisez un tableau proposant les moyennes et les écart-types de la longueur des dents des cochons d'Inde pour chaque dose administrée en vitamine C ainsi que le nombre d'observations par groupe. Le jeu de données à utiliser est donc `tooth_vc`.
166168

167169
💬 **Ce code correspond au snippet `.hmanova1desc`**
168170

@@ -208,7 +210,11 @@ ___ %>.%
208210
```
209211

210212
```{r tooth_tab_h2-hint-1}
213+
tooth_vc %>.%
214+
group_by(., ___) %>.%
215+
summarise(., mean = mean(___), sd = sd(___), count = sum(!is.na(___)))
211216
217+
#### ATTENTION: Hint suivant = solution !####
212218
```
213219

214220
```{r tooth_tab_h2-solution}
@@ -240,24 +246,24 @@ chart(data = tooth_vc, len ~ dose) +
240246
```
241247

242248
```{r tooth_graph-check}
243-
grade_code("Tu obtiens le graphique adéquats qui permet de comparer la longueur des dents en focntion de la dose administrée.")
249+
grade_code("Vous obtenez le graphique adéquats qui permet de comparer la longueur des dents en focntion de la dose administrée.")
244250
```
245251

246-
*L'ANOVA a pour objectif de comparer des moyennes entre elles alors que la boîte de dispersion va vous représenter les 5 nombres qui sont des descripteurs non-paramétriques. Les boites de dispersion ne sont peut être pas le meilleur outils. Il est cependant très utilisé.*
252+
*L'ANOVA a pour objectif de comparer des moyennes entre elles alors que la boîte de dispersion va vous représenter les 5 nombres qui sont des descripteurs non-paramétriques.*
247253

248254
Maintenant que vous avez pris connaissance de vos données grâce à un tableau et un graphique, vous pouvez réaliser votre test d'hypothèse.
249255

250256

251257
### Vérification des conditions d'applications
252258

253-
L'ANOVA a une série de conditions d'application
259+
Pour réaliser une ANOVA, il faut respecter une série de conditions d'application
254260

255261
- échantillon représentatif (par exemple, aléatoire),
256262
- observations indépendantes,
257263
- variable dite réponse quantitative,
258264
- une variable dite explicative qualitative à trois niveaux ou plus,
259265
- distribution normale des résidus,
260-
- homoscédasticité (même variance intragroupes, “homoscedasticity” en anglais, opposé à hétéroscédasticité = variance différente entre les groupes).
266+
- homoscédasticité (même variance intragroupe).
261267

262268
Les deux dernières conditions **doivent être vérifiées**.
263269

@@ -269,42 +275,38 @@ Il existe plusieurs tests qui permettent de vérifier l'homoscédasticité. Nous
269275

270276
💬 **Ce code correspond au snippet `.hvbartlett`**
271277

272-
```{r tooth_bart_h2, exercise = TRUE, exercise.setup = "tg_prepare"}
273-
___(data = ___, ___ ~ ___)
274-
```
275-
276-
```{r tooth_bart_h2-hint-1}
278+
```{r tooth_bart, exercise = TRUE, exercise.setup = "tg_prepare"}
277279
bartlett.test(data = ___, ___ ~ ___)
278280
```
279281

280-
```{r tooth_bart_h2-solution}
282+
```{r tooth_bart-solution}
281283
bartlett.test(data = tooth_vc, len ~ dose)
282284
```
283285

284-
```{r tooth_bart_h2-check}
285-
grade_code("Tu as réalisé l'instruction correcte. Le plus important est encore à faire. Réponds donc à la question suivante.")
286+
```{r tooth_bart-check}
287+
grade_code("vous avez réalisé l'instruction correcte. Le plus important est encore à faire. Répondez donc à la question suivante.")
286288
```
287289

288290
```{r bart_quiz1}
289291
question("Y a t'il homoscédasticité des variances ?",
290292
answer("oui", correct = TRUE),
291293
answer("non"),
292-
correct = "Super, tu as su correctement analyser les résultats de ton test. ",
293-
incorrect = "Il semble que tu n'as pas bien compris la notion d'homoscédasticité ou que tu n'as pas su définir correctement les hypothèses de ce test de Bartlett.",
294+
correct = "Super,vous avez su correctement analyser les résultats de ton test. ",
295+
incorrect = "Il semble que vous n'avez pas bien compris la notion d'homoscédasticité ou que vous n'avez pas su définir correctement les hypothèses de ce test de Bartlett.",
294296
allow_retry = TRUE)
295297
```
296298

297299
### ANOVA
298300

299-
Après avoir réalisé vérifié l'homoscédasticité, il est temps de réalisez l'analyse de variances. L'instruction ci-dessous corresponds au snippet `.hmaniva1`. Il est intéressant d'analyser cette instruction.
301+
Après avoir réalisé vérifié l'homoscédasticité, il est temps de réaliser l'analyse de variances. L'instruction ci-dessous corresponds au snippet `.hmaniva1`. Il est intéressant d'analyser cette instruction.
300302

301-
La fonction `lm()` requiert un jeu de données et une formule. Vous êtes habitué à cet interface formule que vous utilisez dans la réalisation de vos graphiques ou de vos tests d'hypothèses précédents. Cette fonction calcule un objet de class `lm` assigné à `anova.` La fonction lm est fonction puissante qui permet de calculer des modèles linéaires que nous verrons dans le cadre du cours de SDD II. Une ANOVA est en fait une variante du modèle linéaire. De cet objet `anova.`, on calcule le tableau de l'ANOVA grâce à la fonction `anova()`.
303+
La fonction `lm()` requiert un jeu de données et une formule. Vous êtes habitué à cet interface formule que vous utilisez dans la réalisation de vos graphiques ou de vos tests d'hypothèse précédents. Cette fonction calcule un objet de class `lm` assigné à `anova.` La fonction lm est fonction puissante qui permet de calculer des modèles linéaires que nous verrons dans le cadre du cours de SDD II. Une ANOVA est en fait une variante du modèle linéaire. De cet objet `anova.`, on calcule le tableau de l'ANOVA grâce à la fonction `anova()`.
302304

303305
```{r, echo = TRUE, eval=FALSE}
304306
anova(anova. <- lm(data = DF, YNUM ~ XFACTOR))
305307
```
306308

307-
Réalisez votre modèle ANOVA qui porte donc sur la longeur des dents de cochons d'Inde en fonction de la dose administrée.
309+
Réalisez votre modèle ANOVA qui porte donc sur la longueur des dents de cochons d'Inde en fonction de la dose administrée.
308310

309311
💬 **Ce code correspond au snippet `.hmanova1`**
310312

@@ -314,6 +316,8 @@ anova(anova. <- lm(data = ___, ___ ~ ___))
314316

315317
```{r tooth_anova_h2-hint-1}
316318
anova(anova. <- lm(data = tooth_vc, ___ ~ ___))
319+
320+
#### ATTENTION: Hint suivant = solution !####
317321
```
318322

319323
```{r tooth_anova_h2-solution}
@@ -328,14 +332,16 @@ Une fois votre ANOVA réalisée, vous avez à votre disposition un snippet qui v
328332

329333
Vérifiez la distribution normale des résidus de votre objet `.anova`
330334

331-
💬 **Ce code correspond au snippet `.hmanovaqqplot`**
335+
💬 **Il existe une snippet pour vous aider `.hmanovaqqplot`**
332336

333337
```{r tooth_qqplot_h2, exercise = TRUE, exercise.setup = "tg_prepare"}
334338
plot(___, ___ = ___)
335339
```
336340

337341
```{r tooth_qqplot_h2-hint-1}
338342
plot(___, which = 2)
343+
344+
#### ATTENTION: Hint suivant = solution !####
339345
```
340346

341347
```{r tooth_qqplot_h2-solution}
@@ -351,7 +357,7 @@ question("Y a t'il un effet significatif de la dose administrée sur la croissan
351357
answer("oui", correct = TRUE),
352358
answer("non"),
353359
correct = "Bravo, vous avez correctement analysé votre tableau de l'analyse de la variance. L'ANOVA vous permet de savoir qu'au moins un des groupes diffère des autres. Vous allez devoir réaliser une analyse complémentaire pour déterminer quel groupe diffère des autres.",
354-
incorrect = "Il semble que tu as mal analysé le tableau de l'analyse de la variance ou que les hypothèses nulle et alternative sont mal définies.",
360+
incorrect = "Il semble que vous avez mal analysé le tableau de l'analyse de la variance ou que les hypothèses nulle et alternative sont mal définies.",
355361
allow_retry = TRUE)
356362
```
357363

@@ -374,7 +380,7 @@ summary(anovaComp. <- confint(multcomp::glht(anova.,
374380
```
375381

376382
```{r tooth_post-check}
377-
grade_code("Avec l'aide des snippets, il est relativement simple de réaliser un test post hoc. Cette analyse se base sur l'objet .anova réalisé précédement. Le plus important va être d'interpréter ces résulats. Il est possible de le faire graphiquement ou sur base la sortie R. Les niveaux de la variable facteur votn être comparé 2 à 2 avec un correction via la méthode HSD de Tukey.")
383+
grade_code("Avec l'aide des snippets, il est relativement simple de réaliser un test post hoc. Cette analyse se base sur l'objet anova. réalisé précédement. Le plus important va être d'interpréter ces résulats. Il est possible de le faire graphiquement ou sur base la sortie R. Les niveaux de la variable facteur votn être comparé 2 à 2 avec un correction via la méthode HSD de Tukey.")
378384
```
379385

380386
```{r post_quiz}

0 commit comments

Comments
 (0)