[ Назад ] [ На первую страницу ]

О хранилище текстов

Хранилище должно отвечать следующим требованиям:

  • Интеграция максимального разнообразия вариантов оцифровок текстов и документов их электронного представления (ДЭП), созданных разрозненными энтузиастами с помощью имевшихся в их распоряжении инструментов.
  • Для каждого из использованных в хранилище языков — обеспечение сквозного поиска по всему массиву хранящихся в системе текстов и тех доступных в системе первичных ДЭП, которые могут быть автоматически интерпретированы как текст.
  • Обеспечение единого стандарта описания хранимых ресурсов, независимого от их типа и содержания.
  • Обеспечение электронного и бумажного представления хранимых в системе текстов качественными шрифтами в пригодных для современных стандартных средств программируемого вывода кодировках. В случае необходимости (при невозможности качественного представления хранимых в системе текстов) -- доработка стандартных средств программируемого вывода.
  • Обеспечение максимальной автоматизации процесса миграции содержимого хранилища в направлении отделения содержания текстов от их представления и, соответственно, автоматической генерации ДЭП.
  • Обеспечение удобных и максимально автоматизированных средств разбиения хранимых в системе текстов на семантически атомарные составляющие, а также выявления и удаления из системы абсолютно избыточного контента.
  • Обеспечение удобных и максимально автоматизированных средств объединения текстов в пакеты версий одного текста, на основе пополняемого списка критериев.

[ Вверх ]


Последнее изменение: 12 апреля 2003 г.