СТАНДАРТ ST.22
|
РЕКОМЕНДАЦИИ ПО ОФОРМЛЕНИЮ ЗАЯВОК НА ПАТЕНТЫ, НАПРАВЛЕННЫЕ НА ОБЛЕГЧЕНИЕ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ (ОРС)
Переработано и одобрено Рабочей группой по стандартам и документации ПКИТ
на десятой сессии 21 ноября 2008г.
ВВЕДЕНИЕ
1. Данные Рекомендации относятся к заявкам на патенты, поданным или на бумаге, или в электронной форме (электронная подача), если текстовая часть заявки представлена в графическом формате (например, PDF или TIFF).
2. Данные Рекомендации были разработаны для того, чтобы помочь при подготовке заявки на патент в печатной форме, пригодной для последующего получения электронно-цифровой записи содержания на патент с помощью оборудования для Оптического Распознавания Символов (ОРС или, на английском языке, OCR).
3. Данные Рекомендации были разработаны на основе опыта разных ведомств по использованию оборудования для ОРС. Они составлены с целью достижения наименьшего возможного процента ошибок на шаге автоматического чтения текста заявок на патент, и в то же время допускают персональное чтение документа при необходимости. Следует иметь в виду, что этот документ не дает детальных рекомендаций для японского и корейского языков, поскольку в этих странах процент заявок, полностью подаваемых в электронном виде, по отношению к общему числу поданных в год заявок, на самом деле превышает 90%, и следовательно для японского и корейского языков этот Стандарт практически не будет применяться.
4. Главная цель получения цифровой записи заявки на патент - возможность облегчения публикации такой заявки в печатном формате с использованием техники компьютерного набора, и, следовательно, такое преимущество для всех пользователей, как улучшение внешнего вида и качества патентных документов. Последующей целью является создание машиночитаемых баз данных полных текстов опубликованных документов для использования впоследствии преимуществ, представляемых полнотекстовым компьютерным поиском.
ОПРЕДЕЛЕНИЯ
5. Для целей данных Рекомендаций выражение «заявка на патент» означает заявки на: патент на изобретение, авторское свидетельство на изобретение, свидетельство о полезности, полезную модель, дополнительный патент или свидетельство, дополнительное авторское свидетельство на изобретение и дополнительное свидетельство о полезности.
6. Математическая или химическая формула называется «сложной», если она не может быть представлена линейной последовательностью знаков, и знаки которой могут иметь либо подстрочный, либо надстрочный индекс. Формула является очень сложной, если она содержит составные подстрочные или надстрочные индексы или если она содержит математические символы суммы, интеграла или произведения.
7. Ограничивающая рамка знака/ряда знаков – это наименьший привязанный к осям координат прямоугольник, который включает все части знака/ряда знаков.
8. Термин "курсив" относится к стилизованной форме рукописного почерка, когда буквы в словах соединены, изображая каждое слово одной сложной линией. Шифры называются курсивными, если они имитируют рукописный стиль.
СОЗДАНИЕ ОРИГИНАЛА
9. Заявка на патент часто будет подготавливаться с использованием технических средств обработки текста. Как показал опыт, самым эффективным форматом из используемых, позволяющим надежно применять технику ОРС, является так называемый формат ОСR-B, определенный в стандарте Международной организации по стандартизации (ИСО) 1073/II.
БУМАЖНЫЙ НОСИТЕЛЬ В ЛУЧАЕ ПОДАЧИ ЗАЯВКИ НА БУМАГЕ
10. Для облегчения сканирования бумажный носитель отпечатанной заявки должен иметь следующие характеристики:
(a) Бумага должна быть прочной, белой и чистой.
(b) Вес бумаги должен быть в интервале от 70, предпочтительно 80, до 120 г/м2.
с) Размер бумаги должен быть предпочтительно А4, а именно 210х297 мм (Северо-Американский стандарт).
(d) Листы не должны иметь заломов, дыр и/или быть скручены.
е) Бумага не должна быть впитывающей, чтобы избежать расплывания чернил (например, при использовании струйного принтера).
РЕКОМЕНДАЦИИ ПО РАЗМЕТКЕ СТРАНИЦЫ
11. Следует избегать двусторонней печати. Если это невозможно, должна использоваться бумага, достаточно непрозрачная для того, чтобы обеспечить хорошее качество сканирования и с одной и с другой стороны листа.
12. Знаки должны быть целиком (однотонно) черными на белом фоне.
13. На верхней, нижней и правой сторонах каждого листа должно быть оставлено поле минимум 2 см, на левой стороне листа минимальное поле должно быть 2,5 см. Любая справочная информация заявителя или его представителя должна приводиться в верхнем поле. Разметка страницы приведена в Приложении 1.
14. Следует избегать нумерации строк. Если требуется, номера строк должны печататься арабскими цифрами в левом поле страницы, размеченной, как показано в Приложении 1, на расстоянии минимум 1 см от границы текста. Размер шрифта номеров строк должен быть, по меньшей мере, 12 кегля / пунктов.
15. Нумерация страниц должна указываться арабскими цифрами без каких-либо других разграничивающих знаков. Номера страниц предпочтительно проставлять в центре верхнего или нижнего поля страницы, как это показано в Приложении 1.
16. Описание, формула и реферат должны быть напечатаны, начиная каждое с нового листа. Более того, первое слово, напечатанное на первом листе каждой из трех вышеупомянутых частей заявки, должно указывать соответствующую часть (на языке заявки). Пункты формулы должны быть последовательно пронумерованы. Формат нумерации пунктов формулы должен позволять чётко отделять номер пункта формулы от его текста. Рекомендуемые форматы должны использовать либо арабские цифры, после которых ставится точка, либо слова «пункт формулы» - или их эквивалент на языке заявки на патент, - после которых через пробел ставится номер пункта формулы арабскими цифрами. Последующий текст каждого пункта формулы должен отделяться от номера пункта формулы отступом вправо не менее чем на 1 см в обоих случаях.
17. Страницы должны состоять из одного столбца абзацев (текстовые абзацы или абзацы изображения).
18. Страницы, содержащие абзацы, должны иметь вертикальную (книжную) ориентацию.
19. Следует избегать горизонтальной («альбомной») ориентации страниц. Она допускается только для страниц, содержащих встроенные рисунки или таблицы, для которых не подходит вертикальная («книжная») ориентация.
20. На любой странице текст должен иметь только одно направление.
21. Горизонтально ориентированные страницы должны быть повернуты на 90 градусов против часовой стрелки при объединении в один комплект с вертикально ориентированными страницами.
22. Рекомендуется избегать использования сносок, текста и заголовков на полях, за исключением указанного в параграфе 14 (нумерация строк), параграфе 15 (нумерация страниц) и включения отсылок заявителя к данным подачи, проставляемым на полях в левом верхнем углу.
РЕКОМЕНДАЦИИ ПО ФОРМАТИРОВАНИЮ АБЗАЦЕВ
23. Рекомендуется, чтобы таблицы, сложные химические и математические формулы, чертежи и рисунки отделялись от абзацев текста. Желательно, чтобы такие встроенные объекты окружались сверху и снизу пустыми полями, по меньшей мере, в 1 см на всю ширину страницы.
24. Чертежи и рисунки максимально должны быть включены в раздел «Чертежи» а ссылки на них должны содержаться в разделах
«Описание» и «Формула» заявки на патент.
25. Чертежи и рисунки должны быть черно-белыми (следует избегать изображений с серыми тонами, т.к. при их сканировании или преобразовании в черно-белые эта информация теряется). Рисунки должны быть сделаны ясными линиями, толщина которых должны быть достаточна для хорошего воспроизведения при разрешении 300 точек на дюйм.
26. Следует избегать рукописного текста в абзацах или примечаниях. Если необходимо, они должны рассматриваться как встроенные изображения и соответствовать рекомендациям, данным в параграфе 23.
27. Строки текста должны печататься через полтора интервала.
28. Абзацы должны разделяться пространством, по меньшей мере вдвое большим, чем расстояние между строками в абзаце.
29. Базисные линии всех знаков внутри строк абзаца должны быть тщательно выровнены, за исключением знаков подстрочных и надстрочных индексов, указанных в параграфе 35.
30. Следует избегать выравнивания текста абзацев по ширине. Если оно всё же применяется, расстояние между словами должно быть, по меньшей мере, такой же ширины, как в не выровненном тексте. Выровненный по ширине текст может мешать системам ОРС правильно идентифицировать границы слова в тексте.
31. Насколько возможно, следует избегать разделения слов с помощью тире (например, в конце строк или ячеек таблицы). Это не относится к языкам, которые используют составные существительные (например, к немецкому языку).
РЕКОМЕНДАЦИИ ПО ТАБЛИЦАМ
32. Должен использоваться только белый фон.
33. Таблицы должны иметь границы (рамки). Границы должны быть толще 1,5 пунктов и выполнены только сплошными линиями.
РЕКОМЕНДАЦИИ ПО ШРИФТАМ
34. Минимальный рекомендуемый размер шрифта должен быть 12 пунктов, предпочтительно – 14. Как общая рекомендация – все знаки текста должны иметь один и тот же размер шрифта.
35. Текстовые абзацы, содержащие подстрочные и надстрочные индексы, должны использовать, по меньшей мере, 12-й размер шрифта (рекомендуется 14 – чем больше, тем лучше). Следует гарантировать, чтобы ограничивающая рамка подстрочных или надстрочных знаков достаточно перекрывала ограничивающую рамку нормальных знаков на той же строке (это предотвращает при процедуре ОРС печать подстрочных/надстрочных знаков на других строках).
36. Рекомендуется использовать следующие шрифты (в приведенном порядке): (a) Семейство шрифтов с одинаковой шириной знаков (Monospaced): OCR-B, Courier New, Free Mono.
Б) Семейство шрифтов с засечками (Serif): ITC Officiana Serif, Times New Roman, Free Times.
(c) Семейство шрифтов без засечек (Sans Serif): Verdana, ITC Officiana Sans, Arial, Helvetica, DejaVu Sans.
Однако шрифты Arial, Helvetica, DejaVu Sans, Free Times and Times New Roman не рекомендуются для заявок, содержащих химические и/или математические формулы, а также акронимы (слова, сформированные из первых букв словосочетаний, которые они заменяют), в которых смешаны буквы и цифры. Для китайских знаков рекомендуется шрифт Song.
37. Знаки шрифтов должны иметь четкую форму, без теней. Промежутки между знаками должны быть достаточно широкими (следует избегать узкой разрядки).
38. Не должны использоваться узкие и рукописные шрифты.
39. Насколько возможно следует избегать полужирных и наклонных шрифтов.
40. Насколько возможно следует избегать необычных (нестандартных / нетипичных / неправильных ) знаков. Если необходимо, они должны быть стандартными буквами Греческого алфавита и символами шрифта (в порядке их предпочтения). Не должны использоваться знаки, которых нет среди UNICODE: такие знаки распознаются средствами ОРС как встроенные изображения и поэтому делают распознаваемый текст трудным для чтения. Каждое ведомство должно определить и опубликовать свои требования для тех знаков, которые могут использоваться при подготовке заявок на патенты.
41. Текст не должен подчеркиваться. Если это необходимо, следует обеспечить, чтобы подчеркивание не перекрывало ограничивающие рамки знаков.
42. Смешивание азиатских (т.е. основанных на идеографическом письме) и европейских языков (т.е. основанных на латинском и кириллическом алфавитах) внутри разделов/ страниц заявок на патенты является проблемой для процедуры ОРС и его следует избегать, за исключением случаев, когда это необходимо.
РЕКОМЕНДАЦИИ ПО СКАНИРОВАНИЮ
43. Заявки на патент должны сканироваться или в черно-белой, или в полутоновой (серой) шкале.
44. Предпочтительным разрешением для сканирования является 300 точек на дюйм. Сканирование с разрешением ниже 300 точек на дюйм, даже в полутоновой (серой) шкале, может привести к плохому качеству публикуемых ведомствами документов, т.к. обмен документами между ведомствами и процессы публикации часто включают преобразования к черно-белым страницам с разрешением 300 точек на дюйм в формате TIFF группы IV.
45. Отсканированные документы должны быть преобразованы либо в PDF формат, либо в TIFF формат.
ИСПРАВЛЕНИЯ
46. Исправления в тексте заявки должны делаться перепечаткой целой страницы. Не допускаются знаки подтверждения исправления – такие, как, например, указаны в Международном Стандарте ISO 5776. Не допускается делать исправления с помощью белой корректирующей жидкости, самоклеющихся полосок бумаги, стирания или зачеркивания. Заменяющие листы не должны посылаться в ведомство по факсу, использующему стандартное разрешение факсов: листы должны либо посылаться физически, либо по факсу, использующему разрешение не менее 300 точек на дюйм, либо любыми средствами сетевой передачи, поддерживаемыми ведомством, при условии, что каждый лист отсканирован с разрешением не менее 300 точек на дюйм.
РЕКОМЕНДАЦИИ ДЛЯ ВЕДОМСТВ
47. Патентные ведомства должны избегать изменения полученных листов до передачи их на сканирование и процедуру ОРС. Например, иногда в практику ведомств включена операция штампования полученных листов, что может загораживать символы листа, делая представленный заявителем текст нечитаемым при процедуре ОРС. Если печати/ изменения должны быть использованы на оригинальных листах, то ведомству необходимо принять меры к тому, чтобы такие изменения вносились только на поля документов в соответствии с Приложением 1.
48. В будущем патентные ведомства должны избегать разработки бумажных бланков для взаимодействия между заявителями и ведомством. Как показывает имеющийся опыт, разработка и внедрение безопасных онлайн систем предпочтительнее, чем построение систем распознавания бланков на бумаге. Тем не менее, для разработанных на бумаге бланков даются следующие рекомендации с точки зрения облегчения их распознавания:
• На бланках не должны использоваться строки из маленьких точек для указания пользователю, куда следует вводить текст.
• Для знакомест должны использоваться цвета, легко убираемые при сканировании (Drop-out colors) (светло - серый).
• Цвета, легко убираемые при сканировании (Drop-out colors), не должны использоваться для участков формы (полей бланка), которые, как предполагается, будут заполняться содержанием разных цветов или оттенков серого, таких, как отсканированная подпись или рисунок.
ВНЕДРЕНИЕ РЕКОМЕНДАЦИЙ
49. Рекомендуется, чтобы Ведомства, которые намерены начать прием или потребовать подачи заявок на патент, отпечатанных в формате, пригодном для ОРС, регулярно публиковали в своих Официальных Бюллетенях и на Веб- сайтах полное руководство для этого, точно определяя в нем разрешенные шрифты и допустимый размер бумаги.
ПРИМЕРЫ
50. Примеры хороших и плохих для ОРС страниц заявок приведены в Приложении 2 к данным Рекомендациям. Приведенные примеры показывают, что следует, а чего не следует делать, и сопровождаются краткими пояснениями.
(Приложения смотрите в скачиваемом файле)
|
|