Skip to content

Latest commit

 

History

History
26 lines (23 loc) · 1.16 KB

README.md

File metadata and controls

26 lines (23 loc) · 1.16 KB

docX-Parser

Скрипт для парсинга docx файлов и их конвертации в Html текст. В дальнейшем будем делать сохранение данных из docx файлов в облачную базу данных, чтобы создать хронологию и поиск по добавленым файлам.

На данном этапе скрипт умеет:

  • Открывать docx файлы
  • выводить их содержимое в окно просмотра
  • Удалять пустые параграфы
  • Удалять лишние пробелы и скобки
  • Преобразовывать данные в массив
  • Функция очистки окна предпросмотра

Формат docx файла:

[REPORT TYPE : NOON]
[Tmpl : AWT-STANDARD-V1]
[DRSVer : 2.5.6.0.H]
[TimeFormat : UTC]
[Vessel : CALHOUN]
[IMO : 9304576]
[CallSign : V7BT4]
[NOONLat : 19-38.6N]
[NOONLon : 087-34.9E]
[PositionDate : 2018/08/15 0630]
[NOONOffset : +5.5]