Напечатать документ Послать нам письмо Сохранить документ Форумы сайта Вернуться к предыдущей
АКАДЕМИЯ ТРИНИТАРИЗМА На главную страницу
Дискуссии - Наука

А.Г. Буховец, Е.А. Семин
Фрактальные аспекты моделирования классификационной задачи

Oб авторе - А.Г. Буховец
Oб авторе - Е.А. Семин


Аннотация.

В центре внимание данной работы математическая модель классификационной задачи, в основе которой понятия теории фрактальных множеств и особенности моделирования ментальных процессов. В рамках такого подхода классификационную деятельность можно рассматривать как бы с двух точек зрения. С одной стороны — это работа с эмпирическим представлением объектов классификации, с другой — ментальное воспроизведение задачи построения классификационных разбиений. Реализация этих двух видов деятельности происходит в процессе построения некоторого фрактального множества, генерируемого посредством рандомизированной системы итерированных функций. Математическая модель классификационной задачи представляется в виде двух пространств: метрического, связанного с феноменологической составляющей, и ультраметрического, отражающего когнитивную сторону решаемой задачи. Как показывает анализ результатов решения задач классификации, фрактальные модели хорошо соответствуют требованиям, предъявляемым к постановке задачи и алгоритмическим особенностям её решения. Сама специфика постановки задачи отражается в необходимости учитывать такие характеристики как изолированность отдельных объектов, возможность устанавливать сходство/различие объектов, компактность пространства признаков и др. Эти свойства характерны для создаваемого в ходе решения ультраметрического пространства. Взаимосвязь этих двух пространств осуществляется посредством моделирования фрактальной структуры. В работе показано, как именно использование фрактального подхода в решении классификационных задач связано с построением ультраметрических пространств. Характерно, что эти ультраметрические пространства являются составной частью алгоритма решения самой задачи. Эта алгоритмическая составляющая часть решения классификационной задачи напрямую связывается с когнитивными процессами и интерпретируется как модель процессов, присущих умственной деятельности.

Ключевые слова: классификационная задача, рандомизированные системы итерированных функций, ультраметрические пространства, фрактальные множества, моделирование ментальных процессов.


ВВЕДЕНИЕ. О ФОРМИРОВАНИИ КЛАССИФИКАЦИОННЫХ СТРУКТУР

Моделирование классификационной задачи уже имеет свою историю. По-видимому, можно считать разумным сделанное предположение о том, «если существует некоторое реальное структурное членение мира, то ему в определённом приближении соответствуют и структура нашего знания» [1, С. 18] и окружающая нас действительность. Вследствие этого возникает потребность в создании таких математических структур, в которых воспроизводились бы компактные множества и при этом отсутствовала связность различных элементов системы. Подходы к построению классификационных схем [2, 3] традиционно опирались на многомерные связные метрические пространства, такие, например, как Rn с заданными в них мерами близости ρ(x, y); x, yRn. Эти меры, представленные в виде числового значения, характеризуют степень близости/сходства между произвольными точками этого пространства, которые выполняли роль классифицируемых объектов.

В философских экспликациях постановки классификационных задач можно на наш взгляд, различать два подхода, которые условно будем называть линиями Декарта и Ньютона. С точки зрения Декарта объяснять какие-либо эффекты следует исходя из взаимного расположения объектов: «…физика Декарта есть физика взаимных расположений, а не предположений относительно существований каких-то внутренних сил» [4, С. 162]. Отсюда его стремление создать метод, позволяющий фиксировать положения тел, который в окончательном виде привел к созданию координатной системы. Классификационная задача с этой точки зрения сводится к изучению структур многомерных данных, исследованию взаимного расположения объектов в признаковом пространстве [3, 5, С. 148]. Подход Ньютона был нацелен на описание изменений в (рас)положении тел, исследование их динамики, определение причин, вызывающих эти изменения, и, как следствие, расположение тел относительно друг друга. Пространство, как и время, Ньютон считал абсолютным понятием [6]. Образец такого подхода проявился в открытии закона всемирного тяготения, (правда, приписываемого некоторыми исследователями Гуку). Использование динамических систем — это продолжение и развитие этого направления, имеющего целью установление тех основ, которые формируют структурные особенности.

О необходимости создания подхода, позволяющего автоматически учитывать, как свойства алгоритмов классификации, так и свойства получаемых в результате их выполнения классов, давно уже было отмечено в [2, 5]. Тогда же было высказано предположение о необходимости разработки нового математического аппарата, в большей степени соответствующего отмеченным ниже особенностям классификационной задачи. В настоящей работе будет представлен подход к моделированию классификационной задачи, базирующийся на фрактальной теории, который соединяет в себе как динамические характеристики генерирования, так и геометрические аспекты данных. Этот подход, опирающийся на исследование свойств аттрактора РСИФ [7], можно рассматривать как синтез двух этих подходов ранее существовавших порознь. В его основу была положена идея перехода к моделированию задачи классификации в ультраметрических пространствах.

Мы считаем, что процессы построения классификаций, которые раньше неявно присутствовали в виде описания процедур и представлялись моделями некоторых когнитивных процессов, играют важную роль не только в узкопрактических прикладных вопросах. Изучение и моделирование таких процессов может служить составной частью общей теории ИИ.


1. ОСОБЕННОСТИ ПРЕДСТАВЛЕНИЯ ДАННЫХ И РЕЗУЛЬТАТОВ КЛАССИФИКАЦИОННЫХ ЗАДАЧ

Классификационная задача, как известно, в самом общем виде заключается в следующем. В имеющейся совокупности объектов выделить классы однородных в некотором смысле объектов, т.е. разделить заданное множество таким образом, чтобы объекты, отнесённые к одному классу, были более схожи между собой, чем объекты, принадлежащие различным классам (см., например, [2, С. 18, 5]. В рамках такой постановки задачи одним из основных подходов к построению классификации являются алгоритмы кластерного анализ, использующие геометрическое представление данных.

К особенностям классификационной задачи и получаемых в ходе её решения результатов, на наш взгляд, следует отнести следующие аспекты.

  • Объекты в случае геометрического подхода, точнее — топологического, представлены точками (или многомерными векторами), имеющими конечное число координат. Очевидно, что при таком подходе классифицируемые объекты не имеют общей границы.
    Такой подход позволяет сохранить индивидуальность каждого объекта и вместе с тем разграничить объекты.
  • Интуитивное понятие сходства объектов формализуется такой математической конструкцией как метрика (расстояние, мера близости). Это позволяет рассматривать совокупность объектов как точки некоторого метрического пространства. Проблемы могут возникнуть в том случае, когда сходство выражается псевдометрикой [8] или ультраметрикой [9]. Но эти вопросы, как правило, в работах практического характера не оговариваются. В любом случае основное утверждение, связанное с метрикой, которое обязательно формулируется в классификационной задаче: объекты одного класса должны быть более близки друг к другу, чем объекты, принадлежащие разным классам. Это свойство часто неявно подразумевает, что классы точек образуют в пространстве признаков некоторые скопления, возможно различной плотности. Данное свойство послужило основой для использования в англоязычной литературе термина кластер (cluster), который затем и вытеснил в отечественной литературе другие термины. Алгоритмы, выделяющие кластеры, стали называть алгоритмами кластерного анализа.
  • Отдельно сделаем замечание относительно самого пространства и представления результатов выполнения классификационной процедуры. Пространство, образованное совокупностью общих для всех объектов признаков, принято называть признаковым пространством. Под термином классификация подразумевается, как сам результат, так и процедура, с помощью которой он был получен. Ранее этот вопрос активно обсуждался в литературе [1, 10], но в настоящее время утратил свою актуальность и, как правило, каждый автор довольствуется контекстом и/ или здравым смыслом.
  • Свойства признакового пространства, особенно если за основу берётся евклидово пространство, как правило, не оговариваются специальным образом. По умолчанию полагают, что это пространство является связным или непрерывным — не оговаривается ни то, ни другое, и эти термины не определяются и не фигурируют среди перечисляемых свойств. Кроме этого, модель евклидова пространства предполагает его неограниченность. Эти два свойства в некотором смысле противоречат конкретным особенностям задачи: каждый, кто имел дело с практическими задачами, знает, что значения признаков не могут быть как угодно большими, а в признаковом пространстве имеются области, в которых не могут находиться объекты. На важность существования таких промежутков для признания классификации естественной обращал внимание ещё Любищев А. А. [11].
  • Отсутствие упорядоченности. Как правило, классификационный результат рассматривается как измерение, выполненное на номинальном (классификационном) уровне. При этом предполагается, что все объекты одного класса являются эквивалентными, т.е. классификационное разбиение задаёт на множестве объектов отношение эквивалентности. В топологии (см., например, [12]), классы эквивалентности задают на исходном множестве т.н. фактор-множество, а сам процесс построения такого дизъюнктивного разбиения (покрытия) принято называть факторизацией множества.

Указанные выше особенности классификационных задач позволили нам сначала отказаться от рассмотрения классификации как некоторой оптимизационной задачи и переформулировать проблему как задачу исследования структуры многомерных данных в признаковом пространстве [3, 5], а затем перейти к исследованию механизмов генерирования таких структур [7]. Дальнейшее развитие этих идей позволило изменить взгляды как на саму постановку классификационной задачи, так и на скрытые за внешними признаками механизмы формирования самих данных.

Заметим, что отмеченные выше особенности позволяют, на наш взгляд, объяснить дальнейший выбор алгоритмов моделирования фрактальных структур и избежать того, что В. И. Арнольд называл «немотивированной аксиоматикой» и против чего он активно выступал.


Полный текст доступен в формате PDF (1302Кб)

Вестник ВГУ, Серия: Системный анализ и информационные технологии, 2022, № 3, с.127-138, DOI: https://doi.org/10.17308/sait/1995-5499/2022/3/127-138



А.Г. Буховец, Е.А. Семин, Фрактальные аспекты моделирования классификационной задачи // «Академия Тринитаризма», М., Эл № 77-6567, публ.29492, 11.05.2025

[Обсуждение на форуме «Публицистика»]

В начало документа

© Академия Тринитаризма
info@trinitas.ru