fr . comp . normes . unicode


Service Usenet Gratuit - You The Net .Com Consultez les groupes de news usenet nntp avec www.youthenet.com Postez et suivez voos fils de discussions gratuitement avec you the net .com le service gratuit de news en ligne

Re: Plage des Mots qui ont un seul caractère ? sur Fr Comp Normes Unicode



Groupes les plus fournis
comp os linux configuration hierachie de merde comp mail serveurs tv tnt lettres langues-anciennes grec usenet-fr emile durkheim comp sys mac programmation lettres langues-anciennes latin usenet usages rec tv series petites-annonces rencontres comp usenet lecteurs-de-news informations comp lang perl sci astronautique comp os unix mac rec sport arts-martiaux comp stockage sci linguistique rec arts musique jazz


Derniers posts youthenet
Re: Démission pour création d'entreprise commerce ou service Que pensez-vous de la doctrine de James Madison ? Re: envoi des données à un serveur html la demeure du chaos Re: Alice au pays de Free (d'après la t ribune) Re: Est-ce ue violation de la GPL? Re: L'ultra libéralisme du chemin de fer prôné par Sarkozy... Président langue de bois ? la compagnie de l'autre

actualité

Ingres annonce la version 9.2 de son SGBD
ITRManager.com - 19 nov 2008
Des applications internationalisées : Ingres Database 9.2 apporte une gestion multi langages avec des fonctions Unicode étendues. ...
Ingres Database 9.2, l'alternative opensource TooLinux
2 autres articles
source

actualité

Microsoft Folder Share devient Windows Live Sync
Clubic - 20 nov 2008
... ID et avec la corbeille Windows alors qu'il fonctionnera sur les systèmes d'exploitation en chinois ou en japonais notamment grâce au support Unicode. ...
FolderShare change de nom pour devenir Windows Live Sync PCWorld France
Windows live sync, la gamme Windows live s'agrandit MobiGeeks.fr
4 autres articles
source

Accueil |  Ajouter aux Favoris |  Inscription |  connexion |  Flux RSS de fr.comp.normes.unicode |

fr . comp . normes . unicode

Re: Plage des Mots qui ont un seul caractère ?



accueil . fr . comp . normes . unicode




Re: Plage des Mots qui ont un seul caractère ?

   
Sujet: Re: Plage des Mots qui ont un seul caractère ?
De: clovis (l' arobase) club-internet.fr (Jean-Philippe Odent)
Groupes: fr.comp.normes.unicode
Organisation: Dangereuse
Date: 20. Feb 2008, 09:11:34
On Tue, 19 Feb 2008 16:42:03 +0100, Xavier Roche
<xroche@free.fr.NOSPAM.invalid> wrote:

Euh, vous pouvez éventuellement séparer les katakana, mais pour les
Kanji (idéogrammes), il est totalement impossible de séparer les mots
composés (de kanjis et/ou de kanas) des kanjis "isolés" puisque ce sont
les même caractères (au sens Unicode du terme) sans appliquer des
traitements (très) complexes.

En fait je bosse sur un logiciel. La "complexité" ici dépendra
seulement du temps d'exécution des instructions. Il suffit de
programmer l'algorithme pour le voir.

(Pour prendre un exemple, le "?" de "?"(?) (blanc) et le "?" de "?
?" (riz blanc) ou de "??" ("amusant") sont identiques)

Ca ne m'éclaire que partiellement.

Si je montre ce tableau de la langue des 65536 premiers unicodes, on
peut les localiser ?

  TLanguage =

(Basic_Latin,Latin_1_Supplement,Latin_Extended_A,Latin_Extended_B,IPA_Extensions,Spacing_Modifier_Letters,

Combining_Diacritical_Marks,Greek_and_Coptic,Cyrillic,Cyrillic_Supplement,Armenian,Hebrew,Arabic,Syriac,Arabic_Supplement,

Thaana,Devanagari,Bengali,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Sinhala,Thai,Lao,Tibetan,Myanmar,Georgian,

Hangul_Jamo,Ethiopic,Ethiopic_Supplement,Cherokee,Unified_Canadian_Aboriginal_Syllabics,Ogham,Runic,Tagalog,Hanunoo,Buhid,

Tagbanwa,Khmer,Mongolian,Limbu,Tai_Le,New_Tai_Lue,Khmer_Symbols,Buginese,Phonetic_Extensions,Phonetic_Extensions_Supplement,

Combining_Diacritical_Marks_Supplement,Latin_Extended_Additional,Greek_Extended,General_Punctuation,Superscripts_and_Subscripts,

Currency_Symbols,Combining_Diacritical_Marks_for_Symbols,Letterlike_Symbols,Number_Forms,Arrows,Mathematical_Operators,

Miscellaneous_Technical,Control_Pictures,Optical_Character_Recognition,Enclosed_Alphanumerics,Box_Drawing,Block_Elements,

Geometric_Shapes,Miscellaneous_Symbols,Dingbats,Miscellaneous_Mathematical_Symbols_A,Supplemental_Arrows_A,Braille_Patterns,

Supplemental_Arrows_B,Miscellaneous_Mathematical_Symbols_B,Supplemental_Mathematical_Operators,Miscellaneous_Symbols_and_Arrows,

Glagolitic,Coptic,Georgian_Supplement,Tifinagh,Ethiopic_Extended,Supplemental_Punctuation,CJK_Radicals_Supplement,Kangxi_Radicals,

Ideographic_Description_Characters,CJK_Symbols_and_Punctuation,Hiragana,Katakana,Bopomofo,Hangul_Compatibility_Jamo,Kanbun,

Bopomofo_Extended,CJK_Strokes,Katakana_Phonetic_Extensions,Enclosed_CJK_Letters_and_Months,CJK_Compatibility,CJK_Unified_Ideographs_Extension_A,

Yijing_Hexagram_Symbols,CJK_Unified_Ideographs,Yi_Syllables,Yi_Radicals,Modifier_Tone_Letters,Syloti_Nagri,Hangul_Syllables,

High_Surrogates,High_Private_Use_Surrogates,Low_Surrogates,Private_Use_Area,CJK_Compatibility_Ideographs,Alphabetic_Presentation_Forms,

Arabic_Presentation_Forms_A,Variation_Selectors,Vertical_Forms,Combining_Half_Marks,CJK_Compatibility_Forms,Small_Form_Variants,
 Arabic_Presentation_Forms_B,Halfwidth_and_Fullwidth_Forms,Specials);


Sachant que chaque type de caractère est défini ainsi:

  Lu Letter, Uppercase
  Ll Letter, Lowercase
  Lt Letter, Titlecase
  Lm Letter, Modifier
  Lo Letter, Other
  Mn Mark, Nonspacing
  Mc Mark, Spacing Combining
  Me Mark, Enclosing
  Nd Number, Decimal Digit
  Nl Number, Letter
  No Number, Other
  Pc Punctuation, Connector
  Pd Punctuation, Dash
  Ps Punctuation, Open
  Pe Punctuation, Close
  Pi Punctuation, Initial quote
  Pf Punctuation, Final quote
  Po Punctuation, Other
  Sm Symbol, Math
  Sc Symbol, Currency
  Sk Symbol, Modifier
  So Symbol, Other
  Zs Separator, Space
  Zl Separator, Line
  Zp Separator, Paragraph
  Cc Other, Control
  Cf Other, Format
  Cs Other, Surrogate
  Co Other, Private Use
  Cn Other, Not Assigned


Merci encore pour toute aide.

--
Jean-Phil


Date Sujet  Auteur
19.02. * Plage des Mots qui ont un seul caractère ?Jean-Philippe O
19.02. `* Re: Plage des Mots qui ont un seul caractère Xavier Roche
20.02.  +- Re: Plage des Mots qui ont un seul caractèreJean-Philippe O
20.02.  `* Re: Plage des Mots qui ont un seul caractèreJean-Philippe O
20.02.   +* Re: Plage des Mots qui ont un seul caractèXavier Roche
11.03.   |`- Re: Plage des Mots qui ont un seul caracJean-Marc Despe
20.02.   `- Re: Plage des Mots qui ont un seul caractèAntoine Leca
Derniers articles
petites-annonces informatique autos mitsubishi jobs offres jobs demandes jobs d jobs rec sport automobile hierachie de merde comp sys palm-pilot misc engeulades usenet usages soc economie sci psychanalyse misc droit soc alcoolisme

Derniers messages
petites-annonces informatique autos mitsubishi jobs offres jobs demandes jobs d jobs bio general misc actualite rec sport automobile hierachie de merde soc environnement comp sys palm-pilot misc engeulades usenet usages sci psychanalyse

actualité

Ingres annonce la version 9.2 de son SGBD
ITRManager.com - 19 nov 2008
Des applications internationalisées : Ingres Database 9.2 apporte une gestion multi langages avec des fonctions Unicode étendues. ...
Ingres Database 9.2, l'alternative opensource TooLinux
2 autres articles
source

actualité

BurnAware : nouvelle version de l'outil de ...
Génération NT - 25 nov 2008
... la présence de plusieurs outils d'écriture dans chaque onglet de la page de démarrage et les corrections de bogues mineurs avec les systèmes Unicode.
source


 




Copyright 2008 ©  - YouTheNet.com

| Tonic drink |