Методы бикластеризации для анализа интернет-данных

       

Описание модели DR-бимножеств


Бимножеством будем называть пару

, принадлежащую декартовому произведению

.

Частным случаем бимножеств являются формальные понятия. Приведем определения, которые помогут провести обобщение формальных понятий до бимножеств.

Определение 2.20   Обозначим через

число нулевых значений объекта

на признаках из

, т.е.

. Сходным образом через

определим число нулевых значений признака y на объектах из

.

Теперь формальные понятия можно ввести с помощью леммы.

Лемма 2.1   Бимножество (X,Y) является формальным понятием контекста K тогда и только тогда, когда выполняются следующие условия:



    или, аналогично 

(2.1)

    и 

(2.2)

Отношение "быть более частным" (отношение "специализации") в модели вводится иначе, чем это принято для решеток понятий. А именно, требование антимонотонности для содержания понятия заменяется требованием монотонности.

Определение 2.21   Отношение "быть более частным" определяется следующим образом:

тогда и только тогда, когда

и

. Ограничение

называется антимонотонным в смысле отношения

тогда и только тогда, когда

таких, что

. Двойственным образом,

называется монотонным в смысле отношения

тогда и только тогда, когда

. Заметим, что

означает, что бимножество

удовлетворяет ограничению

.

Ограничение на минимальный размер компонент бимножества выглядит следующим образом

. Такое ограничение монотонно по отношению

.

С помощью монотонного ограничения на допустимое число нулей, приходящихся на признак или объект, можно контролировать число нулей внутри бимножества, сохраняя при этом строгую связь между компонентами бимножества.

Определение 2.22   Пусть даны бимножество

и положительное целое число

, тогда

называется плотными тогда и только тогда, когда оно удовлетворяет антимонотонному ограничению

и

Необходимо извлекать такие бимножества

, для которых объекты

(соответственно, признаки

) имеют большую плотность единичных значений на признаках из


(соответственно на объектах из
), чем на других признаках, т.е. на

(соответственно, на объектах
). Такое требование приводит к ограничению релевантности, в котором параметр

выражает разность нулевых значений внутри и вне бимножеств.
Определение 2.23   Пусть даны бимножество

и положительное целое число
, тогда

называется релевантным тогда и только тогда, когда оно удовлетворяет следующему ограничению:

и

Фактически, плотные и релевантные бимножества являются обобщением формальных понятий, которые можно рассматривать как бимножества при значениях

и
.

— обобщение первого уравнения леммы 2.1 ,

обобщает второе уравнение этой леммы, означающее, что все внешние элементы по отношению к данному бимножеству содержат по крайней мере

нулевых значений в дополнение к уже имеющимся для каждого внутреннего элемента. Параметр

отвечает за плотность внутри бимножества, а параметр

показывает значимость разности с внешними элементами. Свойство

антимонотонно по отношению

и может быть использовано для эффективного отсечения. Свойство

не является ни монотонным, ни антимонотонным, но его также можно эффективно использовать.
Определение 2.24   Пусть дано плотное и релевантное бимножество

(т.е. удовлетворяющее
).

называется DR-бимножеством тогда и только тогда, когда оно максимально по отношению
, т.е. не существует

такого, что

удовлетворяет

и
.
Множество всех таких пар контекста

при заданных

и

обозначается как

. Отметим, что для объектов и признаков можно ввести различные пороги

и

.
Назад Содержание Вперёд

Содержание раздела