3. Описание текстологической модели данных.

В этом разделе мы опишем текстологическую модель данных, положенную в основу организации данных в системе "НОВЫЙ ВЕК". Как и ранее будем, где это удобно, применять сокращенное обозначение термина текстологическая модель данных - ТЛМД.

Выше, в предисловии, дано не формальное, упрощенное определение ТЛМД. Формальное определение ТЛМД дать достаточно сложно и в рамках этого документа нецелесообразно, так как введет в описание не нужную сложность и еще больше Вас запутает. Лучше договоримся о том, что все конструкции, понятия и прочие сведения описанные в этом разделе и есть текстологическая модель данных системы "НОВЫЙ ВЕК".

Итак, все данные (тексты) в системе "НОВЫЙ ВЕК" размещаются в так называемых библиотеках. Каждой библиотеке ставится в соответствие буква латинского алфавита от A до Z. Для данной библиотеки можно определить ее авторов(владельцев) и наименование. Для определения библиотеки необходимо использовать дерево меню системы по цепочке (<F10>"Библиотекарь" - "Библиотека"). Работая в меню "Библиотека" можно не только создать на рабочем устройстве библиотеку, но и удалить с него все тексты.

Любая библиотека текстов состоит из отдельных книг, определяемых номером. Номер книги - это целое число от 0 до 9999. Книга в свою очередь состоит из томов, определяемых номером тома. Номер тома - это тоже целое число от 0 до 999. Любой том любой книги состоит из фрагментов, фрагменты в книге нумеруются от 1 до определенного в томе количества фрагментов. Максимальное количество фрагментов в томе зависит от общего размера тома. Фрагменты книги состоят из строк, которые нумеруются целыми числами от 1. Строка состоит из символов и может содержать от 1 до 1200 символов. Любой том любой книги может иметь наименование и (или) автора(владельца). Любой фрагмент книги также может иметь наименование.

Кроме книг, томов, фрагментов, строк и подстрок в ТЛМД имеется понятие диапазон. ДИАПАЗОН - это некоторый текст являющийся подмножеством текстов данной библиотеки и интересующий вас в некотором смысле. Например, можно рассмотреть диапазон строк фрагментов книги личных карточек сотрудников, содержащих сведения об их происхождении. Другой пример, это диапазон фрагментов содержащих лицевые счета сотрудников. Можно придумать и более сложные примеры диапазонов.

Для работы с текстами в описанной структуре используется текстологический адрес. Текстологический адрес (ТЛА) состоит из следующих параметров:
Индекс библиотекиНомер (номера)
КнигиТомаФрагментаСтрокиДлина

Не следует пугаться количества параметров входящих в ТЛА, так как при практической работе системы "НОВЫЙ ВЕК", большинство из них устанавливается автоматически. Чаще всего Вам необходимо знать только номер книги, номер тома и номер фрагмента, чтобы войти в Вашу текстологическую структуру для выполнения необходимых операций по обработке текста. Как видно из схемы, ТЛА можно адресовать не только отдельный символ текста, но и строку, фрагменты и т.д. Приведем несколько примеров ТЛА.

Примеры текстологических адресов:

1. A[1, 2, 3] - это текст размещенный в библиотеке A в 1-ой книге 2-го тома, 3-й фрагмент;

2. A[10, 5, 6, 7] - это адрес 7-ой строки в 10-ой книге 5-й том, 6-ой фрагмент;

3. A[12, 5..14, 5, 1] - это адрес 10-ти строк, каждая из которых находится в 12 книге в томах от 5 до 14 включительно, в этих томах берутся фрагменты с номером 5 и в свою очередь в этих фрагментах берутся 1-ые строки.

Примечание. В этом примере мы имеем дело с адресом диапазона.

Можно продолжать приводить примеры ТЛА, но лучше Вам это сделать самостоятельно, мы обратим Ваше внимание лишь на то, что если определен ТЛА в том или ином виде, то система выполняет операции с тем текстом, который определен этим ТЛА. Далее в процессе описания системы там, где это не вызывает путаницы, для термина "текстологический адрес" будет употребляться слово "адрес".

При работе с фрагментами книг вы можете пользоваться так называемыми ассоциациями фрагмента. Ассоциации фрагмента могут иметь различный смысл. Внешне ассоциация представляется как подстрока некоторой строки фрагмента буквы и фон в которой, имеют цвет отличный от основного. Ассоциации фрагмента могут иметь различный тип. В этой версии ассоциации могут иметь следующие типы:

  1. Шрифт.
  2. Файл.
  3. Текст (ссылка на другой текст).
  4. Поле бланка.
  5. Ссылка на программу написанную на языке САДКО.
  6. Защищенное поле (поле карточки).
  7. Цвет.

Ссылка - это ассоциация текста фрагмента в некоторой его точке с текстом другого фрагмента. Любая ссылка определяется текстом "ОТКУДА" и текстом "КУДА". Определение ссылки представляется адресами этих текстов и хранится в специальной системной области фрагмента книги, называемой областью ассоциаций. Аналогом ссылки может служить обычная ссылка в тексте произведения, когда авторы хотят отослать читателя за более подробным объяснением контекста. В системе "НОВЫЙ ВЕК" ссылка -это не только и не столько способ пояснения текста, но и мощное средство организации справочно-поискового аппарата информационных систем. Ссылка это еще и средство определения сложных структурированных текстов (объектов) при выполнении операций по логической работе с ними, Понятие ссылка позволяет на тексте, размещенном в ТЛМД, определить сетевую структуру текстов со всеми вытекающими отсюда последствиями.

Поле - это по сути своей ссылка, но с небольшой особенностью, заключающейся в том, что поле это ссылка текст которой можно изменять работая в соответствующем режиме (режим БЛАНК). Поле это удобное средство организации работы с текстами типа бланк.

Вычисления - это ассоциации с программами обработки текста фрагмента или их некоторого подмножества. Ассоциации типа вычисления инициируют алгоритмы обработки текстов или обеспечивают переход к исходному тексту этого алгоритма на встроенном языке программирования.

"Обратить внимание" - этот тип ассоциации предназначен для выделения по тексту фрагмента особым цветом тех символов, на которые автор хотел бы обратить внимание. Это своего рода подчеркивание жирным карандашом или выделение жирным шрифтом.

Многофункциональность понятия ассоциация в системе "НОВЫЙ ВЕК" обусловлено тем свойством любого текста, что Вы в различные моменты времени один и тот же текст можете воспринимать по разному в различных смыслах. Например, работая с текстом расчетного листка заработной платы, Вы можете ассоциировать текст "всего начислено", как с возможностью посмотреть более детально историю начисления заработной платы в целях анализа зависимости начислений, и в тоже время эта ассоциация может рассматриваться, как ссылка на программу вычисления этой величины после заполнения соответствующих полей бланка. В системе "НОВЫЙ ВЕК", для определения ассоциаций, предусмотрен целый комплекс средств от простейшего определения одной ассоциации до массового и автоматического их определения по результатам ввода, поиска и обработки текстов.

Кроме ассоциаций фрагментов книг в системе "НОВЫЙ ВЕК" предусмотрено понятие ключ. Ключ - это текстовая строка длиной не более 80 символов, которая используется при просмотре ТЛМД в целях поиска книг, фрагментов и(или) строк содержащих этот текст. Ключ может быть определенным и неопределенным. Определенный ключ - это ключ, который занесен в системный список ключей. В системном списке ключей содержится текст ключа и адреса текстов ТЛМД, где этот текст встречается, если Вы, при определении ключа, установили соответствие между строкой текста и ключом. Другими словами можно привязать ключ к любой строке и соответственно фрагменту, книге. Если ключ определен, то система "НОВЫЙ ВЕК", после перехода в режим поиска по ключу, (см. клавишу F7) работает по системному списку адресов соответствующих этому ключу, переходя по этим адресам в соответствующие точки ТЛМД. Это своего рода прямой доступ к информации. Неопределенный ключ - это только текст, который Вы задаете при поиске информации по ключу, не используя список определенных ключей. Система "НОВЫЙ ВЕК", при поиске текстов по неопределенному ключу, просматривает заданный диапазон поиска последовательно, строка за строкой, определяя строки, которые содержат этот ключ. В случае, если в строке найден ключ, то система "НОВЫЙ ВЕК" выполняет действия определенные Вами при заполнении бланка поиска.

Теперь обратим Ваше внимание на то, что все выше описанные понятия относятся к основным понятиям текстологической модели данных. С ними Вы будете иметь дело в любой момент сеанса работы с ТЛС "НОВЫЙ ВЕК". При работе с любой ТЛМД Вы можете выполнять следующие действия:

В соответствии с этим действиями в ТЛС "НОВЫЙ ВЕК" имеются режимы работы:

ПРОСМОТР - это режим при котором Вы можете просматривать текст фрагмента книги на экране, печатать текст или его часть на принтере, отбирать весь текст или его часть в КАРМАН. КАРМАН - это промежуточный буфер куда можно накапливать интересующие Вас тексты для последующей их обработки. Например, просматривая текст содержащий списки (непример прайс листы) Вы можете отобрать в КАРМАН те строки из списков которые Вас заинтересовали. ТЛС "НОВЫЙ ВЕК" при переходе к тексту очередного фрагмента устанавливает по умолчанию режим просмотра, если Вы не изменили установку "Режим изменения" в меню настроек. Изменение текста фрагмента в режиме просмотра запрещено.

ВСТАВКА, ЗАМЕЩЕНИЕ - это разновидности режима редактирования. В этом режиме Вы можете изменять текст текущего фрагмента, используя алфавитно-цифровые и управляющие клавиши. Отличие режима замещения от режима вставки состоит в том, что в режиме замещения очередной символ вводимый с клавиатуры замещает символ на который указывает курсор, в режиме же вставка при вводе очередного символа часть строки справа от курсора сдвигается вправо на одну позицию и в появившееся свободное место записывается вводимый символ. Для включения режима редактирования необходимо нажать клавишу <0 INS> на дополнительной клавиатуре. При этом на экране слева внизу загорится индикатор с указанием вид редактирования. Внимание, перед установкой режима редактирования необходимо отменить текущий режим работы, кроме режима просмотра.

ССЫЛКА - этот режим позволяет работать с ассоциациями фрагмента типа ссылка и обеспечивает переход к тексту фрагмента на который указывает данная ссылка. Можно также печатать текст фрагмента на который указывает ссылка или поместить его в КАРМАН. Если в меню настроек для ссылок установлен режим после перехода по ссылке - "ссылка", то после появления на экране очередного фрагмента режим ссылка устанавливается автоматически. Для ручной установки режима ССЫЛКА нажмите клавишу <F6>, предварительно отменив другие режимы работы, кроме режима просмотра. В левом нижнем углу экрана загорается индикатор "Ссылка".

КЛЮЧ - этот режим позволяет произвести поиск и отбор текстов по ключевым фразам. Поиск осуществляется в диапазоне установленном бланком описания поиска. В бланке Вы можете указать вариант действия системы в случае обнаружения в тексте диапазона ключевой фразы. ТЛС "НОВЫЙ ВЕК" либо составит список адресов ключевой фразы, либо поместит строку содержащую ключевую фразу в КАРМАН, либо поместит в КАРМАН заголовок в тексте фрагмента. Помещаемый в КАРМАН текст может быть снабжен ТЛА в зависимости от установок "Ключи" в меню "Настройка".

БЛАНК - этот режим позволяет работать с ассоциациями фрагмента типа "Поле". Основное назначение режима - работа с текстами типа бланк. Бланк это часто используемый текст в котором имеется постоянная и переменные части. Форма этого текста стандартизована и Вам достаточно заполнить переменные поля бланка чтобы получить необходимый документ. Примером бланка может служить бланк платежного требования или бланк лицевого счета. Вообще бланк это очень распространенная и удобная работа с текстом. В режиме бланк ТЛС "НОВЫЙ ВЕК" позволяет редактировать поля установленные в области ассоциаций фрагмента и быстро перемещаться от поля к полю с использованием соответствующих клавиш.

ВЫЧИСЛЕНИЯ - этот режим при котором осуществляются вычисления по тексту и реализация достаточно сложных алгоритмов их обработки. Есть три варианта этого режима. Первый вариант это вычисления по тексту. Для выполнения вычислений по тексту необходимо отсветить прямоугольную область и затем нажать клавишу <*> на дополнительной клавиатуре. После этого ТЛС "НОВЫЙ ВЕК" произведет вычисления в отсвеченной области в соответствии с настройками. Основной принцип выполнения вычислений заключается в следующем. Текст прямоугольной области просматривается слева направо, сверху вниз, построчно. В каждой строке сканируется арифметическое выражение, которое затем вычисляется. Результаты арифметических вычисленных построчно складываются.

Второй вариант - Вычисления по диапазону. Периодический диапазон представляет собой в общем виде совокупность текстологических адресов указывающих на элемент матрицы в заданном интервале фрагментов, томов и книг. Вычисления производятся с элементами диапазонов.

Третий вариант - использование языка программирования "САДКО".

В заключении этого раздела отметим, что к текстологической модели данных относится целый набор специфических операций по работе с текстом, о которых речь пойдет ниже при описании соответствующих компонент ТЛС "НОВЫЙ ВЕК". Это и сортировка по тексту, и формирование предметных указателей, и авто определение обратных ссылок, а также комплекс операций по работе с диапазонами.

Для закрепления основных понятий описанной ТЛМД приведем схему представления текстов в ТЛС "НОВЫЙ ВЕК".

Текстологическая модель данных системы "НОВЫЙ ВЕК"


© ООО "АТЛАС" г.Воронеж, 2007. Все права защищены.

Сайт создан в системе uCoz