СТАНДАРТ ST.33
|
РЕКОМЕНДУЕМЫЙ СТАНДАРТНЫЙ ФОРМАТ ДЛЯ ОБМЕНА ФАКСИМИЛЬНОЙ
ИНФОРМАЦИЕЙ ПАТЕНТНЫХ ДОКУМЕНТОВ
Редакция, принятая Постоянным Комитетом по информационным технологиям
на второй пленарной сессии 12 февраля 1999 года
ВВЕДЕНИЕ
1. Настоящий стандарт определяет форматы, которые должны использоваться для обмена патентной
информацией в факсимильном виде. Данный стандарт основывается на международных стандартах (ИСО и
ВОИС) и на рекомендациях Международного консультативного комитета по телеграфии и телефонии (CCITT),
при необходимости даются ссылки на международные стандарты или рекомендации. Данный стандарт
предназначен для представление патентных документов на электронных носителях данных.
2. Подробное описание формата предусматривает следующее представление некодированной
(факсимильной) информации:
(a) целые страницы документов представляются как одно изображение независимо от их содержания
(библиографические данные, текст или изображения);
(b) части страниц с так называемыми встроенными изображениями определяются как кадры
(фреймы); при этом к таким кадрам можно обращаться с помощью процедур, предусмотренных в
Рекомендациях по разметке патентных документов с использованием SGML (Стандартного языка обобщенной
разметки) (Стандарт ВОИС ST.32).
3. Настоящий стандарт состоит из разделов:
(a) .СТРУКТУРА ФАЙЛА И ЗАПИСИ. с описанием физического расположения факсимильной
информации на магнитной ленте;
(b) .ПРИНЯТЫЕ ТРЕБОВАНИЯ К ФАКСИМИЛЬНОМУ КОДИРОВАНИЮ. с описанием способа,
который должен использоваться для кодирования информации.
ОПРЕДЕЛЕНИЕ
4. В настоящем стандарте выражение .патентный документ. включает патенты на изобретения, патенты на
растения, авторские свидетельства, патенты на промышленные образцы, свидетельства о полезности,
полезные модели, дополнительные документы к вышеупомянутым документам и опубликованные заявки на них.
5. Выражение «электронные носители данных» включает:
. средства коммуникации для обмена данными в режиме прямого доступа (он-лайн)
. сменные электронные носители данных, такие как магнитные или оптические диски или ленты
СПЕЦИФИКАЦИЯ СМЕННЫХ СРЕДСТВ
6. Сменные средства должны иметь внешние, читаемые без применения технических средств метки с
серийным именем тома. Данное имя должно быть также записано на самом носителе в месте,
предусмотренном для этой цели.
СТРУКТУРА ФАЙЛА И ЗАПИСИ
7. Один файл может быть продолжен в нескольких томах, если это согласовано партнерами по обмену
8. Для лент, предназначенных для обработки на машинах класса мейнфрейм (центральной машины),
применимо следующее:
(a) стандартные метки для тома, заголовка 1 и заголовка 2 должны быть совместимы с метками
фирмы .IBM.;
(b) кодирование меток и префиксов записей должно осуществляться латинскими буквами и
арабскими цифрами, полностью совместимыми с кодом .IBM EBCDIC. и набором кодовых знаков, приведенным в Приложении 1;
Структура файла
9. Сменные носители данных должны содержать один файл, состоящий из некоторого количества
патентных документов.
10. Каждый файл должен содержать совокупность логических записей, представляющих изображения
документов или в форме полных страниц, или в форме встроенного изображения. Ниже приведена общая
структура файла:
11. Длина логической записи должна быть меньше (216-256) x 19 996 позиций. Максимальным количеством
физических записей в логической записи является 65 280.
Метод спэннинга
12. Метод спэннинга (переноса или продолжения записи) необходим для физических записей из-за
неспособности магнитноленточных устройств работать при обычных обстоятельствах с физическими записями,
содержащими более 32 тыс. знаков. Префикс записи содержит некоторые элементы, относящиеся к методу
спэннинга (продолжения записи), а именно, элемент 7 - номер последовательности записи и элемент 16 - общее
количество записей.
Характеристики логической записи
13. Логическая запись не может содержать более одного изображения. Все изображения считаются
содержащимися в кадрах (фреймах). Кадр может охватывать целую страницу (кадр номер 0000) и таким
образом содержать все виды изобразительных данных в случае факсимильного кодирования полной страницы.
Характеристики физической записи
14. Физическая запись имеет следующие характеристики:
(a) режим записи переменно-блочный;
(b) максимальный размер переменного блока равен 20 000, включая указатель длины блока;
(c) максимальная длина физической записи 19 996, включая указатель длины записи;
(d) каждая физическая запись начинается с префикса из 256 байт (включая двоичный указатель
длины записи, не применяющийся в прикладных программах для мейнфреймов (центральных машин). Префикс определен в Приложении 2.
(e) логическая запись может распространяться на несколько физических записей;
(f) физическая запись должна содержать не более одной логической записи;
(g) одному кадру присваивается серия номеров последовательности записей, относящихся к
физическим записям;
(h) структуру физической записи можно схематически представить следующим образом:
ИДЕНТИФИКАЦИЯ ПАТЕНТНОГО ДОКУМЕНТА
15. Соотношение между патентными документами и физическими записями определяется содержанием
каждой физической записи
Префикс записи содержит полную идентификацию каждого патентного документа, содержащего
элементы, определенные в соответствии со стандартами ST.10/В и ST.16;
В одном и том же файле могут существовать дополнительные измененные документы с той же
самой идентификацией, В общем случае переход от одного документа к другому ( в частности, с тем
же самым идентификатором) приводится посредством записи, для которой:
. текущий яl номер последовательности записей равен числу «Всего записей», и
. текущий номер кадра равен «Номеру последнего кадра», и
. текущий номер страницы равен числу «Всего страниц».
ПРИНЯТЫЕ ДОГОВОРЕННОСТИ ОТНОСИТЕЛЬНО ФАКСИМИЛЬНОГО КОДИРОВАНИЯ
16. Схема кодирования данных в виде изображений основывается на модифицированном методе сжатия
данных .READ II. для факсимильного оборудования CCITT группы 4, как указано в рекомендации T.6 CCITT.
Следующие инструкции по функциям обработки и контроля являются частью этой рекомендации, и их
необходимо отметить особо:
(a) к о д и р о в а н и е п е р в о й с т р о к и: кодирование первой строки двумерное, и исходной
строкой отсчета для нее является воображаемая белая линия;
(b) к о д с и н х р о н и з а ц и и с т р о к: коды синхронизации строк не используются;
(c) к о д о к о н ч а н и я к а д р а: код окончания кадра должен быть представлен кодом конца
факсимильного блока (EOFB), который состоит из двух последовательных кодов конца строки (EOL) и
представлен следующими 24 битами: EOFB = 000000000001000000000001;
(d) б и т ы з а п о л н е н и я д л я с т р о к: биты заполнения для строк не используются;
(e) б и т ы з а п о л н е н и я д л я к а д р а: биты заполнения должны использоваться после EOFB
для выравнивания на границах байтов. Их форматом является строка нулей с длиной от 1 до 7 битов;
(f) м е т о д к о д и р о в а н и я: составной код для прогона длиннее 2560 не допускается. Прогоны
длиннее 2623 должны кодироваться последовательными составными кодами плюс код завершения;
(g) н а п р а в л е н и е с т р о к и б и т: строка бит имеет направление от наиболее значащего бита
(MSB) к наименее значащему биту (LSB);
(h) р е ж и м с ж а т и я: все данные должны находиться в сжатой форме. Режим без сжатия не
используется.
ПРИМЕР
17. Пример кодирования введенных изображений приведен в Приложении 4, содержащем образец документа
из восьми страниц.
ПРИМЕНЕНИЕ
18. До начала регулярного обмена информацией между ведомствами рекомендуется всесторонне обсудить
точную процедуру внедрения настоящего стандарта, в частности, в связи с информацией, которая будет
записываться под номерами элементов 22 - 30 включительно из описания префикса, приведенного в
Приложении II.
[Приложения смотрите во вложенном файле]
|
|