Aide statistique

Bien ?

Dites, entre deux covid, je tente d'aider ma femme qui pond son mémoire en ce moment. Je cale un peu niveau statistique. Sait-on jamais que je puisse en trouver ici.

En gros, elle a une cohorte de 100 patients. Elle les inclut sur base d'un score. Ensuite, elle intervient (traitement, kiné, ...). Plus tard, elle ré-évalue le score.
Le score va de 0 à 100. L'outcome pour chaque patient est la différence entre le score d'admission et le score après prise en charge.
Elle veut savoir quelles variables permettront de prédire quel patient aura un meilleur bénéfice de sa prise en charge.

Elle a un tas de variable ensuite:
- Variables binomiales : sexe, age, ...
- Variables "multiples" avec plusieurs catégories par variables. Du style : acouphène depuis >1an, entre 6mois et 1an, et <6mois.

Bon, pour les variables binomiales, j'ai proposé de faire des tests de moyenne et donc un T-Student apparié. J'aimerais votre confirmation.

Ensuite, pour une variable à plus de deux catégories : que faire ? Une régression multiple ? Le fait d'avoir un variable indépendante comme un différence de score qui est une échelle ne pose pas problème ?

Je mets un screen avec le genre de variable qu'elle a à tester.
 

Jean Mourad

Marginal
Bien ?

Dites, entre deux covid, je tente d'aider ma femme qui pond son mémoire en ce moment. Je cale un peu niveau statistique. Sait-on jamais que je puisse en trouver ici.

En gros, elle a une cohorte de 100 patients. Elle les inclut sur base d'un score. Ensuite, elle intervient (traitement, kiné, ...). Plus tard, elle ré-évalue le score.
Le score va de 0 à 100. L'outcome pour chaque patient est la différence entre le score d'admission et le score après prise en charge.
Elle veut savoir quelles variables permettront de prédire quel patient aura un meilleur bénéfice de sa prise en charge.

Elle a un tas de variable ensuite:
- Variables binomiales : sexe, age, ...
- Variables "multiples" avec plusieurs catégories par variables. Du style : acouphène depuis >1an, entre 6mois et 1an, et <6mois.

Bon, pour les variables binomiales, j'ai proposé de faire des tests de moyenne et donc un T-Student apparié. J'aimerais votre confirmation.

Ensuite, pour une variable à plus de deux catégories : que faire ? Une régression multiple ? Le fait d'avoir un variable indépendante comme un différence de score qui est une échelle ne pose pas problème ?

Je mets un screen avec le genre de variable qu'elle a à tester.
Tu ne peux pas définir que le résultat de ta régression multiple est justement le score après traitement ?

Pour la student, on m’a toujours dit d’utiliser cette table si n < 30...
 
1er
OP
dryemack

dryemack

oui
Tu ne peux pas définir que le résultat de ta régression multiple est justement le score après traitement ?

Pour la student, on m’a toujours dit d’utiliser cette table si n < 30...
Non car tu as des patients qui commence avec un score haut (mauvais) et qui finissent avec un score très bas. D'autres commencent avec un score haut et reste haut après traitement. D'où l'utilisation de la dif de score.
 

Jean Mourad

Marginal
Oups, j'ai mal lu alors, sorry !
 

Liandoran

Redeemer and Destroyer
Mais bien sûr, parce que pour tous, le mémoire est vraiment représentatif du travail effectué. Et aider quelqu'un à apprendre quelque chose qu'il pourra utiliser plus tard n'est pas utile non plus.
 

Akabane

The Chemical Stig
Bien ?

Dites, entre deux covid, je tente d'aider ma femme qui pond son mémoire en ce moment. Je cale un peu niveau statistique. Sait-on jamais que je puisse en trouver ici.

En gros, elle a une cohorte de 100 patients. Elle les inclut sur base d'un score. Ensuite, elle intervient (traitement, kiné, ...). Plus tard, elle ré-évalue le score.
Le score va de 0 à 100. L'outcome pour chaque patient est la différence entre le score d'admission et le score après prise en charge.
Elle veut savoir quelles variables permettront de prédire quel patient aura un meilleur bénéfice de sa prise en charge.

Elle a un tas de variable ensuite:
- Variables binomiales : sexe, age, ...
- Variables "multiples" avec plusieurs catégories par variables. Du style : acouphène depuis >1an, entre 6mois et 1an, et <6mois.

Bon, pour les variables binomiales, j'ai proposé de faire des tests de moyenne et donc un T-Student apparié. J'aimerais votre confirmation.

Ensuite, pour une variable à plus de deux catégories : que faire ? Une régression multiple ? Le fait d'avoir un variable indépendante comme un différence de score qui est une échelle ne pose pas problème ?

Je mets un screen avec le genre de variable qu'elle a à tester.
Je ne sais pas te donner la réponse, mais je peux te dire où la trouver :D

Regarde des publications scientifiques du même domaine, ils décriront exactement quelle méthode statistique a été utilisée pour faire les calculs. L'info sera soit dans le corps de la publi, soit à la fin qqpart dans la Experimental Section, soit dans un document séparé (Supplemental Information) :)
Pour les auteurs les plus loquaces, ils disent même quel software a été utilisé, etc etc :) et en cas de soucis, pas hésiter à contacter le premier auteur par mail il sera ravi de répondre, surtout que leur labo est probablement fermé en ce moment :)
 
1er
OP
dryemack

dryemack

oui
Un des buts du mémoire est de gagner en indépendance et de chercher les réponses par soit même/via travail bibliographique.

Deux solutions à l'UCL, demander à un statisticien de faire le taf à notre place. Ou le faire nous-même.
Ne t'en fait pas pour nos employeurs, nos compétences vont un poil plus loin que la recherche bibliographique :)

Akabane oui je passerai pas cette étape. J'avais comme ça pour une publication l'an dernier car finalement la réalisation d'un test statistique est assez simple mais savoir lequel utiliser et ensuite interpréter, c'est là la difficulté.
 

Anewone

Elite
Hello,

C'est difficile d'être précis ici, donc je vais juste te donner ma perspective.

Par variable binomiale tu entends variable dichotomique (le sexe), ordinale (acouphènes), et continue (l'âge).

Quelques hypothèses avant :
On va assumer que tes variables suivent une loi normale, par simplicité, c'est évident pour l'âge / la taille, ça l'est beaucoup moins pour d'autres que tu ne cites pas ici mais qu'elle a peut-être inclus dans son "Post Cap".
Pour les distinguer, intuitivement, si j'additionne les tailles de deux personnes (indépendantes l'une de l'autre) et que je te dis qu'elles font 4m, tu me diras qu'elles font probablement l'une et l'autre 2m -> loi normale. Si je te dis que deux personnes ont 4M€ de capital à elles deux, tu me diras que l'une à probablement 3.9M€ et l'autre 0.1M€ -> loi de puissance (donc PAS normal).
-----------
Pour la partie statistique descriptive, on va se contenter du plus simple, en supposant qu'elle aie un échantillon bcp plus grand que 30 patients (de par la loi des grands nombres qui imho est du bullshit 99x/100 mais simplifions ici) :

Pour comparer des données continues, tu peux utiliser l'indice de corrélation de Pearson et inférer via un T-student (apparié par design de ton étude). Attention aux hypothèses (voir Google).

Pour comparer des données nominales, tu peux utiliser "Cramer's V".

Pour comparer des données dichotomiques (pile ou face) avec des données continues, tu peux utiliser le coefficient de corrélation "Point-Biserial".
------------
Pour une analyse de l'ensemble de tes variables...

Au lieu d'utiliser une régression linéaire simple ou multiplie qui requiert l'indépendance de tes des observations, je te conseille d'utiliser le model linéaire Hiérarchique. Plus d'infos ici https://www.statisticssolutions.com/hierarchical-linear-modeling-vs-hierarchical-regression/

Si tu utilises une régression linéaire multiple, tu dois déterminer le "r" de ta matrice colinéaire reprenant l'ensemble de tes variables indépendantes, pour déterminer son potentiel de multi-colinéarité. Je te renvois vers les hypothèses des régressions linéaires multiples (au moins 4.. si pas 6.. je ne les ai plus en tête).
------------
En résumé, pour ta première question, "oui mais".
Pour ta deuxième question "non mais".


J'espère t'avoir tout de même été utile, et encore merci pour tes efforts durant cette période difficile.
 
1er
OP
dryemack

dryemack

oui
Excellent merci ! J'ai lu ton lien, ça correspond en effet à l'outil statistique qu'il me faut. Je vais tenter de faire, j'espère que SPSS permet ceci !
 
Haut