Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Пример кодирования знаков ограничителей (стр. 19)




Однако, несмотря на то, что пробелы справа и слева не входят в состав знака-ограни-чителя, они там должны быть обязательно. Этот момент отражен в п.п. 4.4, процитиро-ванном чуть выше.

Знаки символа в наборах А и В (слева) всегда начинаются слева со светлого модуля и заканчиваются справа темным модулем. Знаки символа в наборе С (справа) начинаются слева с темного модуля и заканчиваются справа светлым модулем. Вопрос 14. Является ли 666 неотъемлемой частью всех ИНН? 34

Рассмотрим теперь рекомендуемый алгоритм декодирования (п.п. 4.6.)

Распознавание цифр в коде основано на определении расстояния между кромками со-седних двух штрихов одного символа, между передним и задними кромками.

Величины е1, е2 измеряются в единицах расстояния (мм) и сравниваются с пороговы-ми. После сравнения с пороговыми эти величины переводятся в безразмерные Е1 и Е2. Для части случаев определяется суммарная ширина двух штрихов b1+b2. Отметим, что термин "Передний край" предназначен не для указания направления движения сканера при распознавании, а для составления более компактного алгоритма распознавания. Знаки из наборов B и С зеркальны. Расположение "переднего края" внутрь штрихового кода по-зволяет объединить эти наборы в таблице распознавания.

Из таблицы 4.10. следует, что при Е1=2 и Е2=2 символ однозначно декодируется как "шесть" как в левой (В), так и в правой (С) части кода.

Внимательное прочтение данного пункта ГОСТа показывает, что в декодировании не участвует пробелы между символами. Главное, чтобы штрихи различных символов не со-прикасались, чтобы между двумя соседними символами был хотя бы один пробел.

Рекомендуемый в ГОСТе алгоритм декодирования знаков-ограничителей, в отличии от знаков символа, учитывает пробелы между символами. Это означает, то символ-ограничитель может быть распознан как знак, но не наоборот. По этой причине (что для знаков-символов пробелы не существенны) можно применить алгоритм распознавания цифр к знаку-ограничителю. Знаки-ограничители будут распознаваться как 6, т.к. для них тоже будет выполнено условие Е1=2 и Е2=2.

В анализируемом п.п. 4.6 "Рекомендуемый алгоритм декодирования" нет описания на-значения (использования) символов-ограничителей. Символы-ограничители EAN-13 не позволяют распознать, где начало и конец штрих-кода, т.к. правый знак ограничитель не-отличим от левого. Назначение центрального знака – ограничителя вообще непонятно. Для сравнения, во всех других стандартах штрихового кодирования, например в ГОСТ 30743-2001 "....Спецификация символики Code 128 (Код 128)" в аналогичном п.п. написа-но "При использовании указанных пяти этапов декодируют первый знак. Если первым знаком является знак Start....". Из ГОСТа понять назначение данных ограничителей нель-зя. На официальном сервере www.ean.ru (ссылка взята из ГОСТа) утверждается, что по крайним ограничителям идет настройка считывателя на ширину модуля, что технически может показаться простым, логичным, но, как показало целенаправленно проведенное ис-следование, вовсе необязательным решением.

Крайне интересными оказались результаты целенаправленного исследование устой-чивости считывания программой ABBYY FineReader штрихового кода EAN-13 при моди-фикации основных символов и знаков-ограничителей. Целенаправленная модификация структуры основных символов показала, что это возможно не более, чем на один модуль, при этом в одной части случаев символ не читается, в другой части – программа сообщает о неуверенном распознавании. Случаев устойчивого распознавания не зафиксировано. Напомним, что символ в EAN-13 состоит из 7 модулей.

Результаты модификации символов ограничителей с трудом поддаются осмыслению. Ниже приведены исходный (т.е. нормальный) и максимально модифицированный штрих-код, который успешно считывается программой ABBYY FineReader 4.0 и 5.0. Программа успешно распознает штрих-код при любой его ориентации.

 

Даже визуально видно, что "погрешность" выполнения ограничителей во много раз превышает все мыслимое. Например, в центральном ограничителе данного штрихового кода ширина любого из элементов превышает стандартную ширину символа 7 модулей. Вопрос 14. Является ли 666 неотъемлемой частью всех ИНН? 36

Расстояние между кромками штрихов у всех трех ограничителей так же больше 7, т.е. эти символы невозможно декодировать по приведенной в ГОСТ таблице 10. Очевидно, что в данном случае при таких погрешностях ни о какой настройке считывателя не может идти и речи. Все три ограничителя при распознавании в данном случае не используются и про-сто отбрасываются за ненадобностью. Необходимо отметить, что отбрасывание или до-бавление штрихов в ограничитель тут же вызывало сбой распознавания. Судя по всему, программе распознавания требуется, чтобы там было два штриха, параметры которых, может быть, даже и не пытаются определять.

Условия получения модифицированного штрих-кода. Если пробел обозначить как "0", а штрих - "1", то структура правого и левого ограничителей (согласно ГОСТ) – 101. В рас-сматриваемом примере структура крайних ограничителей левого 1111110000000011110, правого 0111100000000111111. Структура центрального ограничителя в примере 0000000000111111110000000000111111110000000000, а по ГОСТ 01010.

Целесообразно отметить, что, поскольку этот пример является максимально модифи-цированным штрих-кодом, то при сканировании с листа бумаги он уже может не распо-знаваться. Вообще, вместо "символов-ограничителей" можно подставлять практически все, что угодно. Программа успешно распознавала треугольники, шахматки, волнистые линии и т.п.

Необходимо отдельно отметить, что полученный результат справедлив только для распознавания штрихового кода программой ABBYY Fine Reader 4.0 и 5.0. Согласно ГОСТ Р 51294.3 – 99 "Автоматическая идентификация. Кодирование штриховое. Термины и определения" существуют два разных термина "алгоритм декодирования" и "рекомен-дуемый алгоритм декодирования". Реальный алгоритм может быть различным в различ-ных устройствах считывания и отличаться от рекомендуемого. Так же отметим, что все сказанное в этом вопросе дословно справедливо и для кода EAN-8 (ГОСТ один)

Необходимо разъяснить достаточно часто возникающую ошибку в понимании этого вопроса, наподобие нижеприведенного

«Уж сколько раз говорили: человек тут не может видеть шестерок, потому что это не для человека предназначенный язык. А компьютер тоже не может здесь видеть шестерок, потому что он вообще кроме нулей и единиц ничего не "видит".» д. А. Кураев

Безусловно, компьютер кроме нулей и единиц ничего другого "не понимает". Но чело-век воспринимает цифру 6 как 6 и на экране компьютера, и на принтере. Любая цифра или буква кодируется определенной последовательностью нулей и единиц. Экспертиза, про-веденная греческими учеными по благословению Афонских монахов, показывает что и на электронном уровне шестерка и символ-разделитель кодируются одинаково.

Вывод.

Идентификационный номер (в том числе и ИНН), записанный по системе EAN в виде штрих-кода, содержит последовательность из трех шестерок. Данная последовательность одними устройствами считывания может ис-пользоваться как ключевая, другим быть совершенно ненужной.

Вопрос 15. Может ли у ИНН быть иное назначение, кроме как идентификация человека взамен персональных данных? Возможно ли что-то сделать, чтобы идентификационный номер, как таковой, перестал заменять гражданское имя человека?

Для полноценного ответа на поставленный вопрос необходимо дать сравнение поня-тий "имя" и "идентификационный номер". Термин "идентификационный" широко исполь-зуется в информатике и вычислительной технике.

1. Понятие идентификационного номера (в частности налогоплательщика) в соот-ветствии с терминологией в области информационных технологий следующее:

Идентификационный номер

1 – номер, используемый для доступа к устройству или объекту, такому как файл, ок-но или диалог графического интерфейса. Такой номер однозначным образом идентифици-рует объект.

Идентификатор

1 – любая строка текста, используемая как имя, например: имя процедуры или пере-менной в программе, имя дисковода жесткого диска или дискеты;

2 – лексическая единица, используемая в качестве имени для элементов языка; имя, присваиваемое данному и представляющее собой последовательность латинских букв и цифр;

3 – строка символов, обозначающая или именующая объект системы;

4 – набор символов, приписываемый объекту в системе, предназначенный для выде-ления объекта из ему подобных. Алфавит, из которого составляется идентификатор, и правила его составления задаются системой, идентификатор иногда называют именем;

Идентификатор объекта

2 – элемент данных, однозначно определяющий объект внутри системы.

3 – элемент данных, однозначно определяющий объект внутри системы. В сетевых ба-зах данных соответствующее понятие называется ключ базы данных, в иерархических ба-зах данных - ISN, в расширенной реляционной модели – внешний ключ или суррогат, в языках программирования – указатель. (Примечание экспертов – согласно опубликован-ным данным, в налоговых органах используется расширенная реляционная модель)

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...