[ Назад ] [ На первую страницу ]
О хранилище текстов
Хранилище должно отвечать следующим требованиям:
- Интеграция максимального разнообразия вариантов оцифровок текстов и
документов их электронного представления (ДЭП), созданных разрозненными
энтузиастами с помощью имевшихся в их распоряжении инструментов.
- Для каждого из использованных в хранилище языков обеспечение сквозного
поиска по всему массиву хранящихся в системе текстов и тех доступных в
системе первичных ДЭП, которые могут быть автоматически интерпретированы как
текст.
- Обеспечение единого стандарта описания хранимых ресурсов, независимого от
их типа и содержания.
- Обеспечение электронного и бумажного представления хранимых в системе
текстов качественными шрифтами в пригодных для современных стандартных
средств программируемого вывода кодировках. В случае необходимости (при
невозможности качественного представления хранимых в системе текстов) --
доработка стандартных средств программируемого вывода.
- Обеспечение максимальной автоматизации процесса миграции содержимого
хранилища в направлении отделения содержания текстов от их представления и,
соответственно, автоматической генерации ДЭП.
- Обеспечение удобных и максимально автоматизированных средств разбиения
хранимых в системе текстов на семантически атомарные составляющие, а также
выявления и удаления из системы абсолютно избыточного контента.
- Обеспечение удобных и максимально автоматизированных средств объединения
текстов в пакеты версий одного текста, на основе пополняемого списка
критериев.
[ Вверх ]
Последнее изменение: 12 апреля 2003 г.
|