Bonjour,
On Tue, 25 Jan 2005 11:35:32 +0900
Charles Plessy <p-l-e-s-s-y-RemoveDashes@riken.jp> wrote:
Je ne connais pas gist, mais ta question semble porter sur le concept
de machine learning.
Je veux entraîner l'algorithme à détecter un certain patron
d'expression. Cependant, si je ne donne pas d'exemples négatifs, il
donne un bon scores à tous les vecteurs analysés.
C'est normal: si tu lui a appris à donner des bons scores (ce que tu
fais en ne lui donnant que des exemples positifs), il te donneras des
bons scores.
Pour le moment j'essaye d'utiliser le vecteur nul comme exemple
négatif, car si je prend des cas concrets, je vais introduire un
biais, à moins d'être exhaustif, auquel cas l'algorithme ne sert plus
à rien.
L'idée est que tu dois lui fournir des exemples représentatifs
positifs et négatifs, et l'algo d'apprentissage partira de là pour
« généraliser » les concepts positifs et négatifs.
Il s'agit effectivement d'une sorte de biais, mais c'est sur
l'existence de ce type de biais que repose le concept d'apprentissage.
Il n'existe pas de « bias-free learning ».
Meilleur sera ton jeu d'entraînement, meilleurs seront tes résultats.
Une idée serait de tirer au hasard un petit nombre d'exemples dans
l'ensemble de tes données, de les trier à la main en positifs et
négatifs, d'entraîner ton algo là-dessus, puis de l'appliquer à
l'ensemble de tes données.
La notion de « petit nombre » est à adapter suivant le cas. Par
contre, il est important que tu n'introduises pas toi-même de biais dans
le choix des exemples.
Suis-je passé à côté de quelque chose ?
Oui, du concept même de « machine learning ». Cherche un peu sur
internet avec ce mot, tu devrais trouver des documents synthétiques.
Sinon, je te conseille le livre « Machine learning », Tom M. Mitchell
(McGraw-Hill, 1997).
--
Jérémy JUST <jeremy_just@netcourrier.com>