БиблиОтека

БИБЛИОТЕКА / МЕЖДУНАРОДНЫЕ ДОКУМЕНТЫ / СТАНДАРТЫ ВОИС

СТАНДАРТ ST.36


Версия 1.2

РЕКОМЕНДАЦИИ ПО ОБРАБОТКЕ ПАТЕНТНОЙ ИНФОРМАЦИИ С ИСПОЛЬЗОВАНИЕМ XML
(РАСШИРЯЕМОГО ЯЗЫКА РАЗМЕТКИ)

Изменения одобрены рабочей группой SDWG ST.36 23 ноября 2007 г.

ВВЕДЕНИЕ

1. Данный Стандарт рекомендует средства XML (eXtensible Markup Language, расширяемого языка разметки), используемые для подачи, обработки, публикации и обмена всеми видами патентной информации. Он основан в большей части на Административных инструкциях к Договору о патентной кооперации (PCT), части 7, Приложении F, Приложении I (Patent Cooperation Treaty, Administrative Instructions, Part 7, Annex F, Appendix I) (далее – Приложение F). Термин «ресурсы XML» относится к любым компонентам, используемым для создания и реализации XML. Хотя ресурсы XML обычно включают таблицы стилей, схемы W3C и другие объекты, данный Стандарт в настоящее время включает только определения типа документа (DTD), модели содержания, элементы и небольшое число символов. Более подробно информацию о W3C (World Wide Web Consortium, Консорциум всемирной компьютерной сети) см. на http://www.w3c.org/.

2. Данный Стандарт относится к применению расширяемого языка разметки (XML) 1.1.

См. http://www.w3.org/TR/2004/REC-xml11-20040204/:

”Расширяемый язык разметки (XML) является сокращенным вариантом SGML (т.е., стандартного обобщенного языка разметки) и полностью описан в данном документе. Его задача - возможность использования, получения и обработки общего SGML в Интернете тем же способом, каким в настоящее время это происходит с HTML. XML был разработан для облегчения реализации и для взаимодействия сетей как с SGML, так и с HTML.”

3. В соответствии с данным Стандартом, включенная в запись документа XML разметка является примером представления содержания документа с использованием XML, при помощи которого “документы составляются из единиц памяти, называемых объектами, содержащих как проанализированные, так и не проанализированные данные. Проанализированные данные состоят из знаков, некоторые из которых образуют данные, а некоторые - разметку. Разметка кодирует описание формата хранения документа и логическую структуру. XML предоставляет механизм наложения ограничений на формат хранения и логическую структуру” (W3C).

4. XML не может быть использован сам по себе в качестве основы для обработки патентных документов – “Данные технические условия не накладывают ограничения на семантику, использование, или (не считая синтаксиса) названия типов элементов и атрибутов…” (W3C).

5. Таким образом, данный Стандарт определяет элементы и их родовые идентификаторы, или «тэги», и атрибуты для разметки патентных документов. То есть, данный Стандарт описывает в некоторой степени семантику (значения), использование и наименования элементов и атрибутов, входящих в состав различных типов рассматриваемых документов.

«[Определение: Каждый документ XML включает один или более элементов, границы которых определены либо начинающими и заканчивающими тэгами, либо для незанятых элементов - тэгами незанятых элементов. Каждый элемент относится к типу, определяемому его именем, иногда называемым «родовым идентификатором» (GI), и может иметь набор описаний атрибутов.] Каждое описание атрибута имеет имя и значение” (W3C)

Примечание: Подробное описание и определения см. спецификацию XML на http://www.w3.org/TR/2004/REC-xml11-20040204/.

6. Целью введения данного Стандарта является описание логических, независимых от системы структур для обработки патентных документов, как для текста, так и для изображений. Это значит, что данный Стандарт может быть использован вместо Стандартов ВОИС CT.30, CT.32, CT.33 и CT.35, касающихся подачи, обработки, публикации и обмена библиографическими данными, рефератами или полными текстами любых типов патентных документов. Стандарт описывает ресурсы XML для следующих данных:

(a)
Полный или частичный текст патентных документов, включая библиографические данные, записанные как закодированные символами данные.

(b)
Страницы документов целиком, представленные как одно изображение (изображение страницы), вне зависимости от их содержания (библиографические данные, текст или изображения).

(c)
Данные в рамках полнотекстовых документов, которые не могут быть записаны как закодированные символами данные, такие как рисунки, химические формулы и особенно сложные таблицы (так называемые встроенные изображения).

7. Согласно данному Стандарту записи XML должны быть правильно построенными XML-документами и должны соответствовать одному из Описаний Типа Документа (DTD), содержащемуся в приложении F, или ведомственному DTD, которое, в свою очередь, соответствует данному Стандарту. DTD, соответствующее данному Стандарту, должно быть построено из элементов в соответствии с рекомендациями данного Стандарта. DTD, содержащиеся в Приложении F, опубликованы на http://www.wipo.int/pct-safe/epct/xml_canon.htm, где DTD будут обновляться по мере принятия нового варианта. Как только обновленное DTD публикуется на веб-сайте, оно становится доступно для официального использования.


ОПРЕДЕЛЕНИЯ

8. Для целей данного Стандарта даются следующие определения:

А) Выражение «патентный документ» включает патенты на изобретения, патенты на растения, патенты на промышленные образцы, свидетельства о полезности, полезные модели, дополнительные документы к ним, опубликованные заявки и описания, а также документы, относящиеся к ведению дел по заявкам и выданным охранным документам, включая действия после выдачи патента, по поддержанию прав собственности и всю переписку между ведомством и заявителем, а также ведомств между собой.

Б) Разметка определяется как текст, добавляемый к содержанию документа и описывающий структуру и другие атрибуты документа способом, не являющимся способом системной спецификации, независимо от какой-либо обработки, которой он может быть подвергнут.

В) Остальные определения см. описание XML: http://www.w3c.org/TR/2004/REC-xml11-20040204/


ОБЛАСТЬ ДЕЙСТВИЯ СТАНДАРТА

9. Несмотря на то, что DTD, описанные в Приложении F, были разработаны для использования в соответствии с Договором о Патентной Кооперации, данный Стандарт рекомендует использовать их всеми патентными ведомствами для электронной подачи заявок. Образец DTD, отраженный в Приложении А к данному Стандарту, предназначен служить руководством по использованию международных общих элементов (ICE) для публикации патентных документов. По мере развития Стандарта в список, приведенный ниже, могут быть добавлены другие DTD.

10. Некоторые DTD, включенные в Приложение F, перечислены ниже вместе с соответствующей стадией делопроизводства по заявке в качестве иллюстрации их предполагаемого использования. Таблица является только руководством к возможному использованию этих DTD в процессе патентного делопроизводства; разные ведомства могут иметь разные нужды.

ТРЕБОВАНИЯ СТАНДАРТА

Основные

11. Международные Общие Элементы (ICE) являются основой данного Стандарта. ICE строятся на базе Приложения F, Стандарта ВОИС CT.32 и других источников. См.: http://www.wipo.int/standards/en/xml_material/st36/index.html.

12. ICE должны использоваться так, как определено в данном Стандарте, то есть они должны иметь такие название, содержание, атрибуты и значение, которые указаны в списке ICE. Поскольку данный Стандарт и Приложение F, возможно, не включают все элементы, необходимые для всех патентных ведомств, в таких случаях разрешается использовать специфические для ведомств DTD, как описано ниже.

13. Специфическая для ведомства информация может быть обработана следующим образом.

(Схемы и приложения во вложенном файле)