Institut de Santé Publique,
d'Épidémiologie et de Développement
 

Centre Inserm U897
Equipe Biostatistique

CPMTL 1.1
Programme de calcul de la P_value pour une série de plusieurs codages d'une variable explicative dans un modèle logistique.

Presentation

Le programme CPMTL permet de calculer la P_value exacte pour une série de codages d'une variable explicative dans un modèle logistique. La méthode employée pour le calcul de la P_value exacte repose sur la détermination d'une intégrale multiples. Les codages possibles de la variable explicative sont la dichotomisation et la transformation de Box-Cox (voir description ci-après). Ce programme permet a l'utilisateur de choisir entre des transformations dichotomiques et/ou des transformations de Box-Cox. Après avoir choisit le nombre de transformation, deux choix sont possibles; soit utiliser la strategie proposée (voir description ci-après), soit choisir sa propre strategie en indiquant ; les valeurs des seuils pour les transformations dichotomiques et les valeurs des paramètres pour les transformations de Box-Cox. Le programme se limite à un total de 7 transformations dichotomiques et 5 transformations de Box-Cox.  

Transformation dichotomique   \begin{displaymath}z_p(k)=\left\{\begin{array}{c}0 \ \textrm{si} \ z_p\leq c_k\\1 \ \textrm{si} \ z_p> c_k\end{array}\right .\end{displaymath}


 

Strategy for dichotomous transformations 

Number of transformations

c1 c2 c3 c4 ... c7
1 median          
2 1st tercile 2nd tercile        
3 1st quartile 2nd quartile 3rd quartile      
4 1st quintile 2nd quintile 3rd quintile 4th quintile    
...            
7 1st octile 2nd octile 3rd octile 4th octile   7th octile

Box-Cox transformation 

\begin{displaymath}z_p(k)=\left\{\begin{array}{c}\lambda_k^{-1}(z_p^{\lambda_k}......z_p \hspace{+4mm} \textrm{si} \lambda_k =0\end{array}\right .\end{displaymath}

 

 

En particulier $\lambda_k=1$ n'implique pas de transformation, $\lambda_k=0$ donne le log, $\lambda_k=0.5$ la racine carrée, $\lambda_k=1.5$ la puissance 1.5 et $\lambda_k=2$ le carré.

Stratégie pour les transformations de Box-Cox

Nombre de transformations λ1 λ2 λ3 λ4 λ5
1 1        
2 1 0      
3 1 0 2    
4 1 0 2 0.5  
5 1 0 2 0.5 1.5

Fichiers téléchargeables

Version Linux/Unix : fichier archive compacté CPMTL-Unix.zip contenant les fichiers suivants :

readme fichier de documentation au format texte ascii
CPMTL.f fichier source en fortran
CPMTL1 fichier exécutable pour Linux
CPMTL2 fichier exécutable pour Unix
exdata exemple d'un jeu de données

Le programme est  écrit en Fortran 77. Il suffit de compiler le fichier source  CPMTL.f

Version PC DOS : fichier compacté cpmtl.zip contenant les fichiers suivants :

readme.txt fichier de documentation au format texte ascii
cpmtl.f fichier source en fortran
exdata.txt exemple d'un jeu de données
cpmtl.exe version exécutable du programme fortran (programme DOS).

Résultats

Le programme fournit les résultats suivants :

  • les résultats des tests du score associées a chaque transformation de la variable,
  • la P_value exacte associée au test correspondant à la transformation la plus significative.

Lancement du programme

  • Vérifier votre fichier de données de données conformément aux instructions (voir " Fichier de données " ci-dessous). Le nom exact de ce fichier devra être donné lors de l'utilisation du programme. 
  • Exécuter le programme en tapant le nom de l'exécutable choisit (dans le répertoire contenant le fichier exécutable et le fichier <data>)

Fichier de données

Ce fichier ASCII contient le jeu de données et doit être fourni en respectant la structure suivante :

-

Le fichier de données doit se présenter en colonne :
  • la première colonne contient la valeur de la variable dépendante binaire (0 ou 1)
  • la deuxième colonne contient les valeurs de la variable d'intérêt (variable qui va être transformée)
  • les autres colonnes correspondent aux valeurs des autres variables explicatives dites variables d'ajustements (maximum 11).
  • le nombre maximum d'individus est fixé à 3000. Ainsi votre fichier ne doit pas dépasser 3000 lignes.
- Remarques :
  • chaque variable doit être séparée par un ou plusieurs espaces
  • le programme ne gère pas les observations manquantes. Si un sujet a des valeurs manquantes il doit être exclu de l'analyse et ne doit pas figurer dans le fichier de données.

References

Liquet B, Commenges D. 
Correction of the P-value after multiple coding of an explanatory variable in logistic regression. 
Stat Med 2001 20(19): 2815-2826.

Accès au résumé

Auteurs

Benoit Liquet
Daniel Commenges

Inserm U897
146 rue Léo Saignat
33076 Bordeaux Cedex
France

Contact

Mél: Daniel.Commenges@isped.u-bordeaux2.fr.
Nous sommes intéressés par vos commentaires mais nous ne pouvons garantir une assistance.

Licence

Ce programme est logiciel gratuit. Vous pouvez le redistribuer et/ou le modifier selon la licence GNU édictée par la Free Software Foundation, version 2 et postérieure. Ce programme est distribué dans l'espoir qu'il sera utile, mais SANS AUCUNE GARANTIE. Voyez le permis d'usage GNU pour plus de détails.


Téléchargement :

Back to main page: