Skip to content
Tomasz Borek edited this page May 31, 2015 · 3 revisions

Wyszukiwarka na stronie

Naszą wyszukiwarkę zasila Sphinx, który indeksuje zawartość naszej bazy danych.

Można wyszukiwać po:

  • tytule (w bieżącym języku i po angielsku)
  • sekcji
  • kodach: dziesiątkowym i szesnastkowym
  • zestawach znaków, do których dany znak należy
  • innych danych

Dalszemu dostosowaniu wyszukiwania służą pliki:

entities.txt oraz specs.txt

Obydwa są opisane w głównych danych. Z ich pomocą, możesz wyszukiwać po encjach HTML (np. β) jak i po znakach kontrolnych (np. \t).

Synonimy znaków

W (tłumaczeniach, sekcja "Nazwy znaków") możesz podać synonimy dla każdego znaku:

00A9 : Copyright : (с)
2122 : Trade mark sign : tm

Formy słów i listy słów stopu

W katalogu z tłumaczeniami jest podkatalog morph z plikami wordforms.txt oraz stopwords.txt.

Format tychże opisany jest w anglojęzycznej dokumentacji do Sphinxa:

Np. loc/ru/morph/wordforms.txt:

phone > telephon
  • Data for Unicode-Table.com

Documentation in English

Clone this wiki locally