Методы бикластеризации для анализа интернет-данных

       

Формальный анализ понятий (ФАП)


Определение 2.11   Формальный контекст

есть тройка

, где

— множество, называемое множеством объектов,

— множество, называемое множеством признаков,

— отношение.

Отношение

интерпретируется следующим образом: для

,

имеет место

, если объект

обладает признаком

.

Для формального контекста

и произвольных

и



определена пара отображений:

которые задают соответствие Галуа между частично упорядоченными множествами

и

(см. Раздел 2.1.1), а оператор

является оператором замыкания на

— дизъюнктном объединении

и

, т.е. для произвольного

или

имеют место следующие соотношения [1]:

(экстенсивность),

(идемпотентность),

  • если

    , то

    (изотонность).

  • Множество

    называется замкнутым, если

    [1].

    Определение 2.12   Формальное понятие формального контекста

    есть пара

    , где

    ,

    ,

    и

    . Множество

    называется объёмом, а

    — содержанием понятия

    .

    Очевидно, что объем и содержание произвольного формального понятия являются замкнутыми множествами.

    Множество формальных понятий контекста

    , которое мы будем обозначать посредством

    , частично упорядочено по вложению объёмов: формальное понятие

    является менее общим

    (более частным), чем понятие

    ,

    , если

    , что эквивалентно

    (

    — обобщение

    ).

    В работе [1] было показано, что подмножества произвольного множества, замкнутые относительно заданной на нем операции замыкания, образуют полную решётку, а в работах [83,33] — что множество всех понятий формального контекста

    образует полную решётку.

    Определение 2.13   Множество понятий контекста

    образует решётку

    , где

    . и

    . Такие решётки называют решётками понятий, или решётками Галуа [33].

    Любая полная решётка изоморфна решётке понятий некоторого формального контекста [33]. В качестве объектов этого контекста нужно выбрать

    -неразложимые элементы, а в качестве признаков —

    -неразложимые элементы исходной решётки. Тогда объект

    в контексте будет обладать признаком

    , если элемент решётки, соответствующий

    , находится "под" элементом, соответствующим


    .

    Определение 2.14   Строчно- (столбцево-) редуцированным называется такой формальный контекст, в котором всякое объектное (признаковое) понятие является


    -неразложимым (


    -неразложимым). Редуцированным называется формальный контекст, являющийся одновременно строчно- и столбцево-редуцированным.

    Определение 2.15   Пусть дан


    — формальный контекст и
    , тогда выражение


    называется импликацией (на множествах признаков), если


    (или


    ), т.е. все объекты из


    , обладающие множеством признаков


    , обладают также множеством признаков


    .

    Аналогичным образом определяются импликации на множествах объектов. Наличие импликации


    в контексте


    соответствует тому, что в диаграмме решётки


    формальное понятие


    находится ниже формального понятия


    .

    Импликации формального контекста удовлетворяют аксиомам Армстронга [33] для произвольных


    :



  • ;


  • если


    то


    ;


  • если


    и


    то


    .


  • Помимо определённых выше однозначных (one-valued) формальных контекстов в анализе формальных понятий изучаются многозначные (many-valued) контексты:

    Определение 2.16   Многозначный формальный контекст есть четвёрка
    , где
    ,
    ,


    — множества (объектов, признаков и значений признаков, соответственно), а


    — тернарное отношение
    , задающее значение


    признака
    ,

    причём:

        и
        влечёт
    .

    Многозначные признаки могут рассматриваться как отображения
    , таким образом, можно обозначать


    вместо


    .

    Процедура сведения многозначных контекстов к однозначным называется шкалированием (scaling). Для шкалирования каждый признак многозначного контекста представляется формальным контекстом, называемым шкалой.

    Определение 2.17   Шкала для признака


    многозначного контекста


    есть (однозначный) контекст


    такой, что


    . Объекты в шкале называются значениями шкалы, а признаки — признаками шкалы.

    Определение 2.18   Пусть задан многозначный контекст


    и шкалы


    , тогда производным контекстом будем называть контекст


    , где множество признаков


    (


    ) и отношение




    и


    .

    В нашей работе для построения таксономии алгоритмов использовалось два варианта шкалирования — порядковое шкалирование и номинальное шкалирование. Порядковая шкала


    используется для признаков, значения которых упорядочены относительно некоторого порядка


    , а обладание объектом некоторым значением признака влечёт обладание всеми меньшими значениями признака. С помощью номинальной шкалы


    представляют несравнимые между собой значения признаков, например, цвет.

    Возможные виды шкалирования рассмотрены в [33].

    Назад Содержание Вперёд


    Содержание раздела