Skip to content
jamesohortle edited this page Nov 10, 2019 · 2 revisions

Recherche sur le site web

Nous utilisons un moteur de recherche appellé Sphinx pour indexer le contenu de notre base de données.

Les données sur les caractères sont recherchables :

  • titre (dans la langue actuelle et en anglais)
  • section
  • codes decimal et hexa
  • ensembles de caractères auquel le caractère s'appartient
  • d'autres données

Il y a de fichiers additionnels que vous pouvez utiliser pour personnaliser votre recherche :

entities.txt et specs.txt

Ces deux fichiers sont décrits dans fichiers de données principales. Avec ces deux fichiers, vous pouvez rechercher par entité caractère de HTML (par ex. β) et manipuler les caractères de contrôle (par ex. \t).

Synonymes des caractères

Dans (fichiers de localisation, section "Noms des caractères") vous pouvez spécifier les synonymes pour chaque caractère :

00A9 : Copyright : (с)
2122 : Trade mark sign : tm

Formes des mots et listes des mots vides

Dans le dossier de localisation il y un dossier qui s'appelle morph avec les fichiers wordforms.txt et stopwords.txt.

Les formats de ces fichiers sont décrits dans la documentation de Sphinx :

Par exemple loc/ru/morph/wordforms.txt:

phone > telephon
  • Data for Unicode-Table.com

Documentation in English

Clone this wiki locally