Sujet: Re: réseau de neurones: choix des données ?
De: guerif (l' arobase) gmail.com
Groupes: fr.comp.ia
Organisation: http://groups.google.com
Date: 26. Nov 2006, 16:07:02
tripacer a écrit :
Voici le problème auquel je suis confronté actuellement avec mon
réseau de neurones (RN) :
Au départ, j'ai 2 groupes de molécules différentiées par un
caractère (1 groupe possède ce caractère, l'autre non).
Je voudrais par la suite construire un RN capable de prédire ce
caractère pour tout autre groupe de molécules.
Pour cela, j'ai calculé un grand nombre de caractéristiques
moléculaires pouvant discriminer le caractère recherché. Pour ne pas
devoir inclure toutes ces caractéristiques dans le RN, et donc pour
minimiser le nombre de neurones en entrée, j'ai utilisé plusieurs
tests statistiques pour identifier les caractéristiques les plus
discriminantes (p<<<0.05).
Bonjour Xavier,
Quels tests statistiques as tu utilisés ? Univariés ou multivariés ?
Dans le premier cas, tu as pu éliminer des caractéristiques très
intéressantes; il est possible qu'une caractéristique utilisée seule
ne soit absolument pas discriminantes mais qu'associée à d'autres
elle devienne très pertinente (cf. exemple classique du XOR.)
As tu envisagé l'utilisation d'une méthode de sélection de variables
adaptée aux réseaux de neurones; je pense notament aux approches
suivantes : HVS (heuristic for variable selection) et ARD (automatic
relevance determination) qui ne font appel qu'aux paramètres du
réseau sans necessité le calcul ni des dérivés premières (comme
SBP) ni des derivés secondes (comme OBD, OBS, OCD, EBD, EBS, ...).
Hope this helps!
Sébastien
--
Sébastien Guérif
http://www-lipn.univ-paris13.fr/~guerif