Контекст Категории



Сходство и одинаковость Математическая модель знаковых последовательностей с повторами (текстов) представляет собой мультимножество.

Мультимножество было определено Д.

Кнутом в 1969 г.

и позднее подробно изучено А.

Б.

Петровский [1] .

Универсальным свойством мультимножества является существование одинаковых элементов.

Предельным случаем мультимножества с единичными кратностями элементов является множество.

Множество с единичными кратностями, соответствующими мультимножеству, называется его порождающим множеством или доменом.

Множество с нулевой кратностью является пустым множеством.

Проблема заключается в определении одинаковости элементов.

Одинаковость зависит от принимаемых во внимание свойств этих элементов.

Огурцы и арбузы внешне одинаковы по цвету, но при гастрономическом использовании их трудно назвать одинаковыми, хотя ботаническое описание во многом совпадает. По мнению Г.

Фреге, любой объект, находящийся в отношениях с другими объектами и их сочетаниями, имеет столько же свойств (значений), сколько и этих отношений.

Часть принимаемых во внимание значений называется смыслом, которым представлен предмет в данной ситуации.

Наименование предмета числом, символом, словом, картинкой, звуком, жестом для его краткого описания называется знаком предмета (это одно из значений).

Все возможные части значения (значения) предмета соответствуют одному знаку.

В этом состоит основная проблема распознавания смысла, но в то же время и основание обходиться минимальным набором знаков.

Невозможно присвоить уникальный знак каждому подмножеству значений.

Объектами информационного обмена являются минимальные наборы символов (ноты, алфавит, словарь языка).

Значение знаков обычно не рассчитывается, а определяется интуитивно контекстами знака (окружением).

Решением проблемы многозначности знаков является смысловая разметка текста.

Семантическое обозначение можно объяснить на примере предельной однозначности.

На русских счетах текст представляет собой последовательность одинаковых символов (костяшек).

К [2] словарь такого текста состоит из одного слова.

Без семантической разметки использовать такие тексты невозможно.

Поэтому словарь меняется, а символы разбиваются на группы — единицы, десятки, сотни и т. д. Эти названия групп (цифры) представляют собой уникальные номера слов.

Словарь Д являются числами от 0 до девяти.

На таких декартовых счетах каждое домино представлено матричной единицей.

Например, число 2021 на матричных счетах представлено суммой четырех матричных единиц:

Контекст категории

где индексы представляют собой декартовы координаты матричного слова (в данном случае числа).

Произошло превращение одинаковых предметов в похожие.

Мерой сходства являются координатные значения слов.

Помимо позиционных, повторы цифр из словаря происходят при выполнении арифметических действий.

Отношения эквивалентности устанавливаются:

Контекст категории

Если после арифметического действия получено число 9 +1 , то на этой позиции появляется 0, а к следующей цифре добавляется 1. На счетах все костяшки домино сдвигаются в исходное (нулевое) положение, а в следующей цифре (проволоке) добавляется единица.

На матричных счетах выполняется преобразование:

Контекст категории

Если задать меру тождества знаков, то отношение толерантности (сходства) можно снова превратить по этой мере в отношение эквивалентности (тождественности).

Например, округление чисел.

Разницу между толерантностью и эквивалентностью можно узнать по нарушению транзитивности.

Для отношений толерантности она может нарушаться.

Например, предположим, что элемент A похож на B в одном смысле.

Если значение В не совпадает со значением элемента С, то А может быть похоже на С только по пересечению их значений (части свойств).

Транзитивность отношений восстанавливается (замыкается), но только для этой общей части смысла.

После того, как тождество будет достигнуто указанием значения, А будет эквивалентно С.

Например, описанное выше преобразование (замыкание) по некоторым координатам обеспечивает выполнение арифметических действий на матричных счетах.

Другой пример контекстной зависимости знаков – шахматы.

Еще более ярко это проявляется в парных шахматах [3].

В этой модификации шахмат вам разрешено делать ограниченное количество двойных ходов во время игры в любой момент игры.

Игра остается стабильной.

В остальном правила такие же, как и в обычных шахматах, за двумя исключениями: первый ход одиночный и допускается рокировка под шах.

Автор игры в случае двойных ходов - проф.

Зайцев Г.

А.

Для шахмат словарь их матричного текста — это номера одной из фигур каждого цвета и разделитель ходов (от 1 до 11).

Слово шахматного текста является матричной единицей.

Его первая координата уникальна и представляет собой номер клетки на шахматной доске (от 1 до 64).

Вторая координата слова взята из словаря.

Текст шахматной матрицы в любой момент игры представляет собой сумму единиц матрицы, каждая из которых показывает фигуру на соответствующем месте шахматной доски.

Повторы в тексте возникают как от дублирования фигур, так и от постоянных переходов в ходе игры от сходства к одинаковости и наоборот для всех фигур, кроме короля.

Игра заключается в реализации максимально эффективных таких переходов и собственно классификации фигур.

Пешки сначала одинаковы, затем становятся похожими только по правилу движения, а иногда пешка становится идентичной ферзю.

Инструментом анализа матричных текстов является контроль транзитивности для проверки разницы между сходством и тождеством.

Неспособность контролировать транзитивность является алгебраическим объяснением непонимания языковых текстов, проигрыша в шахматах или ошибок в числовых расчетах.

Транзитивность отношений является условием преобразования множества объектов в математическую категорию.

Семантической разметкой текста может быть вычисление его категорий посредством транзитивного замыкания.

Объекты категорий представляют собой контексты матричных слов.

[2] , морфизмы – преобразования матриц этих контекстов.



Контекст

Контекст слова ? к,дж матричный текст [2] его фрагмент называется Ф дж я, к – сумма матричных единиц (слов) между двумя матричными повторяющимися словами ? я, Джей И ? к,дж :

Контекст категории

где индекс Д р означает, что это место можно заполнить любым индексом из правого словаря Д р матричный текст [2] , включая символы текстообразующих фрагментов.

Контекст — это все слова матричного текста между повторяющимися словарными символами.

Д р .

Например, между повторяющимися словами, повторяющимися периодами, знаками абзацев, глав, объемами языковых текстов или фраз, периодами и частями музыкальных произведений.

Знаки текстообразующих фрагментов выглядят одинаково, но это тоже знаки-омонимы – их контекст – фрагменты (1).

Контекстом языкового фрагмента (экспликации или объяснения) может быть не только языковой текст, но и звуковой (например, музыка), образный (фото) или совместный (видео).

Контекстом музыкального текста может быть языковой текст (например, либретто).

Матричные слова соответствуют своим матричным контекстам, представленным в виде алгебраических объектов (1).

Все возможные связи между этими объектами являются предметом анализа при определении значения слов.

Теория категорий полезна для изучения таких конструкций, поскольку она основана на понятии транзитивности.



Категория контекста

Позволять Ф 1 дж , .

, Ф н дж - это все контексты Ф дж я, к слова ? дж, дж ∈ D р в тексте п , А Д дж , .

, Д дж нР – правые словари этих контекстов:

Контекст категории

В к = я + 1 в (1) частным случаем фрагмента является матричное слово ? я+1,ДР .

Категория контекста Кот (? дж, дж ) текстовый знак ? дж, дж ∈ D р определяется следующим образом:

  1. Объекты категорий – попарно кратные [2] контексты Ф 1 дж , .

    , Ф н дж .

  2. Для каждой пары из нескольких объектов существует [2] набор морфизмов Ф ij : Ф я ij Ф дж , каждый морфизм соответствует уникальному Ф я И Ф дж .

  3. Для пары морфизмов Ф ij И Ф джк определен их состав (произведение квадратных матриц) Ф ij Ф джк , что, если Ф я = Ф ij Ф дж И Ф дж = Ф джк Ф к , Затем Ф я ij Ф джк Ф к (условие транзитивности).

  4. Для каждого объекта Ф я единичная матрица определяется как тождественный морфизм ?:Ф я = ЭФ я ? .

    Категориальная ассоциативность следует из ассоциативности умножения матриц.



Сокращение контекстов

Пересечением (в общих чертах) матричных словарей является их произведение:

Контекст категории

Доказательство следует из определяющего свойства матричных единиц (6) [2] и словарные определения (9) [2] и (15) [2] .

При перемножении матричных единиц словарей (индексы в каждой единице одинаковые) произведение их матричных слов (единиц) с разными индексами равно нулю.

В произведении (2) останутся только общие слова с совпадающими индексами из всех факторов (2).

Объединение любой пары словарей Д я И Д дж это их сумма минус пересечение (2)

Контекст категории

По свойствам (10) [2] в (3) всего Д я дж Повторы матричных единиц удалены.

Таким словарем является минимальный словарь фрагмента матричного текста.

Д р текст п , Что Д р И п взаимно кратны:

Контекст категории

Для взаимно кратных п И Д р ненулевые матрицы Ф НДР И Ф ДРП существовать.

Суммы матричных единиц Ф НДР И Ф ДРП существуют, если матричные единицы п И Д р содержат одинаковое количество вторых индексов (координат) и не содержат других вторых индексов.

Понятие минимального словаря вводится в связи с тем, что по свойствам матричных единиц всегда имеет место следующее:

Контекст категории

Где Д может состоять из слов (единиц матрицы), отсутствующих (одних и тех же) в Д р .

Например, для Ф 1 дж 1 дж Д , .

, Ф н дж н дж Д нР всегда выполняется:

Контекст категории

Минимальные словари Д минR1 , .

, Д минRn фрагменты Ф 1 дж , .

, Ф н дж не содержать матричных слов (вторых индексов матричных единиц), отсутствующих в соответствующем фрагменте текста.

Классы эквивалентности контекстов задаются общими минимальными правыми словарями.

Д минР .

Если пара контекстов имеет минимальный общий словарь, то эти контексты взаимно кратны.

Следовательно, существуют их взаимные преобразования (матрицы).

Если контексты Ф 1 дж , .

, Ф н дж слово-знак ? дж, дж иметь минимальный общий правильный словарный запас Д р , то они кратны друг другу.

В дальнейшем под словарями фрагментов текста подразумеваются их минимальные словари.

Если данные контексты Ф 1 дж , .

, Ф н дж умножить справа на такой словарь Д дж р что каждый полученный контекст будет иметь правильный словарь (минимальный) Д дж р , то они называются сокращенными контекстами:

Контекст категории

При сокращении (умножении справа) часть единиц матрицы со вторыми индексами, которых нет в Д дж р удаляется в каждом Ф 1 дж , .

, Ф н дж .

Если в каком-либо из полученных фрагментов отсутствует хотя бы один из индексов словаря, то его не следует включать в (4).



Категоризация

Контексты с общими словарями, например, после редукции (4) слова-знака.

? дж, дж , являются объектами знаковой категории Кот ( ? дж, дж ).

Все матричные тексты (4) по построению кратны друг другу в (20) [2] , имеют общий (и минимальный) словарь, следовательно, всегда существуют матрицы преобразования Ф дж 1,к как морфизмы категории знака Кот ( ? дж, дж ):

Контекст категории

Отношения (5) являются наименьшими транзитивными отношениями на множестве Ф 1 дж , .

, Ф н дж и являются транзитивным замыканием этого множества в силу того, что из контекстов Ф 1 дж , .

, Ф н дж операция (4) удаляет все матричные слова, которых нет в общем словаре Д дж р .

Остальные аксиомы категорий выполняются благодаря свойствам квадратных матриц одной размерности.

Транзитивное замыкание (5) может быть определено для любого подмножества (м < n) :

Контекст категории

просить Ф 1 дж , .

, Ф м дж (2) их общий словарный запас Д дж Мистер ⊇ Д дж р ( Д дж р является подмножеством Д дж Мистер по свойствам (2)).

В этом случае транзитивное замыкание (5) осуществляется с использованием словаря Д дж Мистер :

Контекст категории



Пример

В качестве примера матричного текста используется (5).

[2] , в котором есть четыре одинаковых знака для слова «набор» ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 .

Эти четыре знака, в свою очередь, имеют четыре контекста.

Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 :

Контекст категории

Где Д 1 1 , Д 1 2 , Д 1 3 , Д 1 4 являются словарями соответствующих контекстов, в последнем контексте Ф 1 14,17 второй индекс равен не номеру последнего повторения символа, отсутствующего в текстовом словаре, а номеру последнего слова в тексте, чтобы определить конец контекста.

Постановка задачи: вычислить сходство и различие слов.

? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 в зависимости от сходства и различия в некоторой мере (модуле) их контекстов Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 .

Сходство контекстов определяется наличием общих словарей, которые используются в качестве модуля сравнения контекстов.

Разница определяется выводами контекстов в одном модуле.

Остатки будут определять свои классы эквивалентности (классы остатков) и категории остатков, поскольку для них также может происходить транзитивное замыкание.

Общий словарь четырех контекстов Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 согласно (2):

Контекст категории

Транзитивное замыкание (4) над общим словарем-модулем приводит к удалению «лишних» слов:

Контекст категории

Таким образом, редуцированные (сокращенные) контексты знака-слова ? 1,1 («несколько») — четыре слова ? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 .

Эти слова имеют одинаковый знак ? 3,3 («объект») в объединенном (3) словаре для Д 1 1 , Д 1 2 , Д 1 3 , Д 1 4 :

Контекст категории

где каждая формула представляет собой последовательное попарное объединение словарей (3).

Слова ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 в смысле их сокращенных (редуцированных) контекстов ? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 могут быть одинаковыми или разными.

Установка меры сравнения ? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 определяет результат сравнения ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 .

В простейшем случае, если их принять одинаковыми ? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 , то они будут одинаковыми и ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 .

Это происходит, например, когда слова понимаются только как знаки-буквы в словаре-азбуке и их контекстная зависимость отсутствует. Для решения задачи сравнения значений слов полезно вычислить соответствующую категорию признаков этих слов.

Категория знака Кот ( ? 3,3 ) состоит из четырех уменьшенных объектов контекста (10):

Контекст категории

Морфизмы Кот ( ? 1,1 ) — четыре матрицы ? 6,3 ,? 11,6 ,? 11,3 И ? 15,3 :

Контекст категории

Композиция морфизмов – это отношение:

Контекст категории

Композиция (13) является выражением интервальной маркировки слова ? 3,3 (45) [2] на языке теории категорий, а редукция (10) является примером решения системы сравнений по модулю Ф м (39) [2] .

Полезность использования теории категорий состоит в том, что ее подход является более общим и позволяет использовать методы из разных разделов алгебры.

Таким образом, все четыре фрагмента текста Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 тождественный (эквивалентный) в смысле знакового слова ? 3,3 (сравнимый по модулю ? 3,3 ).

Существуют матричные морфизмы ? 15,11 ,? 11,6 ,? 6,3 ,? 15,3 , преобразуя эти тексты согласно (12) друг в друга.

По аналогии с библиотечным каталогом все четыре текста Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 (подписать объекты категории Кот ( ? 3,3 )) находятся в одном каталожном поле с названием вывески ? 3,3 .

Это пример грубой классификации текстов по ключевым словам.

Контекстное значение слов не учитывается, все такие слова как знаки одинаковы и все случаи их появления в тексте могут суммироваться для расчета значимости ключевых слов на основе частоты употребления.

Полученный результат означает, что в первом приближении все четыре слова «множество» контекстуально связаны со словом «объект».

Слова «многие» ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 могут быть одинаковыми или разными настолько, насколько одинаковы или различны их сокращенные (редуцированные) контексты ? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 .

В [2] Показано, что сравнения по модулю выполняются для матричных текстов.

Остатки деления фрагментов матричного текста на другие фрагменты (модули) могут иметь остатки (остатки), которые, как и модули, являются классифицирующими признаками.

Признаком делимости (кратности ⋮) фрагментов матричных текстов является делимость (кратность) их правых словарей (20) [2] .

Словарные остатки словарей (словарные вычитания) фрагментов представляют собой словари остатков от деления этих фрагментов.

Вычислить сходства и различия между словами.

? 3,3 ,? 6,3 ,? 11,3 И ? 15,3 нужно сравнить контексты Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 по модулю ? 3,3 .

Тогда остатки каждого контекста по модулю ? 3,3 равны:

Контекст категории

Из (14) следует, что все Ф 1 1,5 , Ф 1 5,10 , Ф 1 10,14 , Ф 1 14,17 (отсюда и слова «много» ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 ) несравнимы по модулю ? 3,3 .

Остатки не попарно кратны и не образуют попарно ни одного класса остатков.

Это означает, что все слова ? 1,1 ,? 5,1 ,? 10,1 ,? 14,1 разные по смыслу (контексту).

Сходство обнаруживается на следующем этапе (для остатков), если для пар остатков рассчитать общие словари по (2) и выполнить редукцию (4).

Общий словарь для всех выводов Д дж рез не с Теги: #Алгоритмы #Обработка естественного языка #Поисковые технологии #Семантика #теория категорий #категоризация #онтология #общая алгебра #общая алгебра

Вместе с данным постом часто просматривают: