Skip to content
Vasily edited this page Jun 12, 2017 · 4 revisions

Данные и локализация unicode-table.com

В этом репозитории хранятся данные сайта Таблица символов Юникода.

Вы можете помочь проекту одним из следующих способов:

  • Перевести его на какой-либо из языков
  • Исправить обнаруженные неточности
  • Уточнить и дополнить имеющиеся данные
  • Добавить новые интересные наборы символов
  • Написать статьи о конкретных символах, разделах, языках и странах
  • Улучшить поиск по сайту
  • Либо сделать безвозмездный денежный взнос :)

Как вносить изменения

Если вы разбираетесь в git и имеете аккаунт на github, вы можете сделать fork нашего репозитория, внести изменения и прислать нам pull request.

Если же вы не знаете, что означают все эти слова, вы просто можете скачать архив с последней версией, внести изменения и прислать нам их на адрес info@unicode-table.com

В случае, если вы хотите проделать достаточно объёмную работу, лучше обсудить сначала всё с нами: info@unicode-table.com.

Соглашения о формате файлов

Все данные хранятся в виде простых текстовых файлов. Обратите внимание на следующие требования:

  • Кодировка файлов: UTF-8 (обязательно «без BOM»)
  • Переносы строк: в стиле Unix (один символ «\n» вместо двух, как в Windows). Обычно можно настроить в текстовом редакторе.
  • Вместо символа табуляции используйте 4 пробела.
  • Старайтесь избегать лишних пустых строк и пробелов в конце строки.
  • Придерживайтесь формата используемого в исходных файлах.

Структура данных

Репозиторий содержит два каталога с данными: data — каталог с основными данными; loc — локализация текстов на различные языки.

Например, раздел «Кириллица» занимает диапазон символов с 0400 до 04FF, относится к алфавитам и используется, допустим, в трёх языках: русском, украинском и болгарском. Такие данные, как «диапазон», «тип», «языки» и «страны» описаны один раз в файле data/sections.txt.

Название же этого раздела на различных языках: «кириллица» (рус.), «cyrillic» (англ.), «kyrillisch» (нем.) и его описания хранятся в каталоге с локализациями. В loc/ru/sections.txt — русская локализация, loc/en/sections.txt — английская и т.д.

Файлы локализации

Каждой языковой версии сайта соответствует отдельный каталог внутри loc: loc/ru, loc/en, loc/de.

Чтобы перевести сайт на какой-нибудь другой язык (например, на французский), следует создать каталог loc/fr и записать туда переводы всех файлов из loc/en.

На сайте используется следующий принцип: если какие-то данные ещё не переведены на текущий язык, то используется название из английской версии.

Форматы файлов

Форматы файлов описаны на отдельных страницах