fr . comp . ia


Service Usenet Gratuit - You The Net .Com Consultez les groupes de news usenet nntp avec www.youthenet.com Postez et suivez voos fils de discussions gratuitement avec you the net .com le service gratuit de news en ligne

Re: Inintelligence artificielle, ou bien choix cyber-démocratique ? sur Fr Comp Ia



Groupes les plus fournis
hierachie de merde comp mail serveurs tv tnt lettres langues-anciennes grec usenet-fr emile durkheim comp sys mac programmation lettres langues-anciennes latin usenet usages rec tv series petites-annonces rencontres comp usenet lecteurs-de-news informations comp lang perl sci astronautique comp os unix mac rec sport arts-martiaux comp stockage sci linguistique rec arts musique jazz rec photo materiel


Derniers posts youthenet
Re: Démission pour création d'entreprise commerce ou service Que pensez-vous de la doctrine de James Madison ? Re: envoi des données à un serveur html la demeure du chaos Re: Alice au pays de Free (d'après la t ribune) Re: Est-ce ue violation de la GPL? Re: L'ultra libéralisme du chemin de fer prôné par Sarkozy... Président langue de bois ? la compagnie de l'autre

actualité

Regard approfondi sur sept grandes professions de la santé
CNW Telbec (Communiqué de presse) - Il y a 12 heures
Infirmières autorisées << - La main-d'oeuvre chez les IA a connu une croissance constante de près de 2 % par année sur six ans; il y avait 257 961 IA en ...
source

actualité

Mot de passe
Factornews - 30 nov 2008
Et même à ces endroits, évitez les man'uvres de contournement : l'IA a déjà du mal dans un espace de trois mètres de large, alors si vous vous mettez à ...
source

Accueil |  Ajouter aux Favoris |  Inscription |  connexion |  Flux RSS de fr.comp.ia |

fr . comp . ia

Re: Inintelligence artificielle, ou bien choix cyber-démocratique ?



accueil . fr . comp . ia




Re: Inintelligence artificielle, ou bien choix cyber-démocratique ?

   
Sujet: Re: Inintelligence artificielle, ou bien choix cyber-démocratique ?
De: use.link.in.signature (l' arobase) ddress.invalid (Patrick 'Zener' Brunet)
Groupes: fr.soc.politique, fr.comp.ia
Organisation: Guest of ProXad - France
Date: 11. Dec 2005, 00:13:31
Bonjour.

Je réponds à Lambda <lambda_designs@hotmail.com>
qui dans dnf94t$gc$1@news.Stanford.EDU a écrit :
Patrick 'Zener' Brunet wrote:
Actuellement je suis en train de mettre au point une architecture de
site Web dans lequel toute l'intelligence est déportée sur le
serveur (donc les pages sont adaptées +/- sur mesure, et sont donc
pratiquement statiques).

Dans ces conditions, récupérer le robot d'indexation à l'entrée et
lui imposer une visite guidée ne pose pas de problème technique
(sauf pour les robots pirates, mais ceux-là peuvent aller dans le
décor, ça ne me gêne pas).

Et là il devient intéressant de se demander s'il est pertinent de
donner au robot le texte brut à analyser, ou plutôt une version de
la page adaptée pour l'indexation "intelligente". Le but n'est pas
de faire de la présence pour une recherche quelconque, mais de se
placer précisément pour une recherche particulière - oui, je sais,
cet objectif est un peu à contre-courant :-)

Dans ces conditions, pouvoir qualifier simplement une page selon les
critères que je citais au début de cette discussion (notamment le
thème principal et le type d'intention) serait très intéressant.

Et si un tel standard se faisait jour, il pourrait s'imposer
rapidement, selon la même logique que les qualifications du W3C :
peu de gens ont vraiment intérêt à un Web poubelle.

Ce qui rendrait alors cette démarche de moins en moins à
contre-courant...


Allez, j'enfonce les portes ouvertes, mais finalement faut bien que je
fasse semblant d'avoir assimilé le cours sur l'indexation du web sur
lequel j'ai un exam mardi...
Le seul petit problème de tout ça, c'est que tout le monde n'est pas
beau et gentil (et encore, beau, on s'en fout dans ce contexte). Et
que peu de gens ont intérêt à un web poubelle, mais ceux qui le
veulent ont un volume de pages difficilement évaluable. Si on prend
un moteur d'indexation du web et qu'on n'utilise aucune méthode de
random restart, la probabilité de se retrouver sur une page de spam
après quelques itérations vaut quasiment 1. Un système de robot
guidant les moteurs n'aiderait pas du tout de ce point de vue-là. Au
contraire, un peu de malice dans la réalisation d'un système qui
ferait ça permettrait sans doute un spamming plus efficace...

C'est à double tranchant. Etes-vous allé visiter la page lien que spécifie
ma signature ?


Par contre, offrir aux moteurs de recherche le contenu du site en
version "préparsée" pourrait avoir d'intéressants avantages. Mais
comment savoir si on peut se fier au parsing proposé ? L'une des
techniques de spam est d'avoir deux versions de la page : celle qui
est retournée au moteur de recherche, et celle qui est retournée à
l'utilisateur humain. ce serait rendu plus facile avec ce type
d'approches... mais je pense que le jeu en vaudrait la chandelle.

Déjà dans le principe je ne crois pas aux pages-fleuves, et donc je
préconise volontiers qu'une page traite d'un point précis. A quoi sert le
principe de l'hypertexte si on fait une seule page de 10000 lignes ?

Donc ensuite résumer ça en mots-clés et ne montrer que ça quand c'est un
robot qui visite me paraît une évidence.

Par contre, il faudrait revoir intégralement la façon dont on conçoit
l'indexation du web qui est généralement une approche type "bag of
words" à peine améliorée.

Avec ce qui précède, même si le robot est très con, il ne prendra que ce
qu'il trouvera et ce sera garanti représentatif.
Par contre bien sûr ça représente une vraie conception de la part du
concepteur, et ça va passer pour de la régression sociale aux yeux des
amateurs qui se contentent de mettre leur texte en ligne en l'état.

Inversement, le placement pour une recherche particulière est déjà
possible : c'est à ça que servent les mots-clés qu'on peut entrer dans
les en-têtes de la page.

Pas très d'accord du fait des multiples sens parasites que peut prendre un
mot, et aussi des mots qui sont systématiquement éliminés parce que l'une de
leurs interprétations est un article ou autre mot non-discriminant.

Donc, à moins de pouvoir se baser sur une expression exacte (difficile du
fait des conjugaisons et autres accords) ou d'avoir la chance de tomber sur
un mot très peu divergent tel que deuteranomalie par exemple, rien ne vaut
la spécification d'un "namespace" ou de mots possédant un rôle prédéfini.

Par exemple, on pourrait dire (l'exemple de Pascal Bourguignon):

TypeDoc:technique ; accident avion
....et ça ne rendrait que des documents de type "étude technique", pas de
roman, ni de trailer de film, ni de biographie, ni de pub d'assurance...
Il manque juste une petite nomenclature normalisée des types de documents,
et une admission contrôlée des pages qui prétendent l'utiliser (je n'ai pas
dit que c'est facile, mais à terme c'est le seul moyen de donner de la
valeur à l'information).

Les techniques plus avancées pour ça,
ironiquement appelées optimisations pour moteur de recherche, sont
plus proches des techniques de spam que d'une entreprise
philantropique "les gens veulent vraiment visiter ma page".

C'est le combat boulet cuirasse... Et il y a beaucoup de boulets dans notre
monde :-)

Mais il faut se poser la vraie question: un vendeur de service d'indexation
a-t-il vraiment intérêt à indexer de la .erde ?
Dans quel but ? Que les utilisateurs renoncent à leur recherche initiale et
visitent les pubs à la place ? Et qu'ils soient ensuite satisfaits du
service rendu ?

Apparemment il y a beaucoup de demande pour ça, sinon les pubs en question
seraient royalement ignorées et personne ne paierait pour les insérer en
pure perte, et donc le service de recherche s'asphyxierait de lui-même.
Bref comme on fait son lit on se couche... Vive la démocratie éclairée :-)

Cordialement,

--
/***************************************\
* Patrick BRUNET
* E-mail: lien sur http://zener131.free.fr/ContactMe
\***************************************/




Date Sujet  Auteur
13.11. * Inintelligence artificiellejr
14.11. `* Re: Inintelligence artificielle, ou bien choixPatrick 'Zener'
07.12.  `* Re: Inintelligence artificielle, ou bien chovictorfelder@gm
07.12.   +- Re: Inintelligence artificielle, ou bien cPascal Bourguig
08.12.   `* Re: Inintelligence artificielle, ou bien cPatrick 'Zener'
10.12.    `* Re: Inintelligence artificielle, ou b ieLambda
10.12.     `* Re: Inintelligence artificielle, ou biPatrick 'Zener'
10.12.      `* Re: Inintelligence artificielle, ou Lambda
11.12.       `* Re: Inintelligence artificielle, oPatrick 'Zener'
11.12.        `* Re: Inintelligence artificielle,Lambda
14.12.         `* Re: Inintelligence artificiellPatrick 'Zener'
14.12.          `- Re: Inintelligence artificiePatrick 'Zener'
Derniers articles
petites-annonces informatique autos mitsubishi jobs offres jobs demandes jobs d jobs rec genealogie soc politique soc religion rec sport automobile petites-annonces divers hierachie de merde comp usenet serveurs comp sys palm-pilot bio medecine

Derniers messages
petites-annonces informatique autos mitsubishi jobs offres jobs demandes jobs d jobs bio general rec boissons vins rec genealogie rec aquariophilie soc religion bio medecine soc politique soc alcoolisme rec arts litterature

actualité

Regard approfondi sur sept grandes professions de la santé
CNW Telbec (Communiqué de presse) - Il y a 12 heures
Infirmières autorisées << - La main-d'oeuvre chez les IA a connu une croissance constante de près de 2 % par année sur six ans; il y avait 257 961 IA en ...
source

actualité

Midnight Club Los Angeles, le test
Caradisiac.com - 30 nov 2008
Perdre une course que l'on a sur-performé pour un virage que l'IA prends de façon irréelle alors qu'elle n'a été qu'un fantôme derrière vous pendant 4mn ...
source


 




Copyright 2008 ©  - YouTheNet.com

| nervosität |