Jérémy JUST wrote:
As-tu un autre système à proposer ?
Qu'un algo d'apprentissage? Non, à vue de nez, ça me semble une bonne
idée (sans préjuger des résultats).
Je voulais dire... une alternative à gist, mais...
Malheureusement, ça fait trois ans et demi que je ne fais plus dans
les puces. Donc je ne suis pas au courant de ce qui se fait
actuellement.
Une bonne méthode (à mon avis) serait de tirer des cas au hasard sur
l'ensemble de ton jeu de données (nombre à déterminer selon la taille de
tes données et ta patience), puis de les classer manuellement en
positifs et négatifs.
À la limite, si /quelques/ cas t'embêtent, tu peux les laisser de
côté.
Je me suis aperçu que comme il n'aime pas les doublons, le problème ne se pose pas. Maintenant, je trie le fichier qui indique qui est "1" et qui est "-1", et j'élimine l'entrée -1 si elle a le même identifiant que la ligne précédente. Un problème de réglé :)
Cela dit, si tu as regardé le prix du Mitchell sur Amazon US, c'est
normal que tu l'aies trouvé hors de prix (143 USD!!). Il est à 66 EUR
sur Amazon France. Ah, zut, tu écris du Japon?
À ce prix-là, je vais me l'offrir si les frais de port ne sont pas exorbitants. Les critiques disent qu'il est un peu passé (et conseillent le Russel&Norvig), mais comme c'est les concepts de base qui me manquent, ça ne devrait pas poser trop de problèmes...
Merci pour tous tes conseils.
--
Charles