Заерко а: Недопустимое название — Циклопедия

Разное

Repository BNTU — Вычисление среднего расстояния между пиками горизонтальной проекции

Authors

Заерко, Д. В.

Липницикий, В. А.

Date
2019

Publisher

БНТУ

Another Title

Calculating the average distance between horizontal projection peaks

Bibliographic entry

Заерко, Д. В. Вычисление среднего расстояния между пиками горизонтальной проекции = Calculating the average distance between horizontal projection peaks / Д. В. Заерко, В. А. Липницикий // Системный анализ и прикладная информатика. – 2019. – № 3. – С. 4-8.

Abstract

В ходе анализа и построении алгоритма шумофильтрации на этапе сегментации символьных строк, прояснилась необходимость в описании особой базы или словаря для хранения модельной и скелетной проекции символов алфавита. Однако, при форматировании записей алфавитной проекции в словаре возникли вопросы: сколько значений проекции необходимо для описания единственного символа, а также, как может изменяться данная величина в зависимости от числа проанализированных строк и их символов. Объекты исследования в статье – это вертикальная проекция символов, а так же их ширина сегментов проекции. Предмет изучения – изменение средней ширины символьного сегмента проекции для определенного типа номерных знаков (символьных строк). Основная цель – вычисление и обоснование средней величины сегмента. Информация о средней ширине сегмента проекции, описывающей символ, позволяет определить число значений проекции (координат по оси ox) для хранения самих значений проекций этого символа из некоторого алфавита. Рассматриваются несколько языковых алфавитов, где каждому из них сопоставлен уникальный тип. В частности рассмотрены номерные знаки Республики Беларусь и Словацкой Республики. Используя элементарный статистический аппарат, проведены вычисления и анализ выборок, учитывая случай высокой их вариации. В результате получены средние значения ширины сегментов и значения дисперсии ширины сегментов на примере двух типов алфавитов. Попутно, в ходе исследования, представлен алгоритм использования полученных величин при формировании записей модельной проекции. Алгоритм учитывает «особые» случаи выхода за границы сегментов. Описанные шаги и вычисления возможно применить для большего числа алфавитов, что указывает на возможность описания словарей модельной проекции для них, с последующем широким использованием в шумофильтрации символьных строк.

Abstract in another language

During the analysis and construction of the noise filtering algorithm at the stage of segmentation of character strings, the need to describe a special database or dictionary for storing model and skeletal projections of alphabet characters became clear. However, when formatting entries for alphabetical projection in the dictionary, the following questions arose: how many projection values are needed to describe a single character, and also how this value may change depending on the number of strings analyzed and their characters. The objects of research in the article are the vertical projection of the characters, as well as their width of the projection segments. The subject of research is the change of the average width of the projection segment for a certain type of license plates (character string). The main goal is to calculate and justify the average size of the segment. Data about the average width of the projection segment that describes a character allows to determine the number of projection values (coordinates along the ox axis) to store the projection values of this character from an alphabet. Several language alphabets are considered, where each of them is associated with a unique type. In particular, license plates of the Republic of Belarus and the Slovak Republic are considered. Using an elementary statistical apparatus, calculations and analysis of samples were carried out, taking into account the case of their high variation. As a result, the average values of the segment width and the variance of the segment width were obtained using two types of alphabets as an example. In research an algorithm for using the obtained values in the formation of model projection records is presented. The algorithm takes into account «special» cases of going beyond the segment boundaries. The described steps and calculations can be applied to a larger number of alphabets, which indicates the possibility of describing model projection dictionaries for them, with subsequent widespread use of character strings in noise filtering.

URI
https://rep.bntu.by/handle/data/62304

View/
Open