Palantir — четвертая по крутости частная компания Кремниевой долины (после Uber, Xiaomi и Airbnb).
Пока Палантир собирает информацию обо всем, мы собираем информацию о нем.
IT-специалисты придумали, как эффективно «монетизировать математику и алгоритмы» (Сегалович, Бакунов), PayPal Mafia придумала, как монетизировать философские гаджеты Феанора (капитализация Palantir — $20 млрд).
В десятиминутной лекции сотрудник Palantir расскажет о центральной концепции своей системы — динамической онтологии.
0:00 Привет, я Ашер Синенски, инженер по внедрению технологий в Palantir. Я буду говорить о динамической онтологии.
0:08 Очевидно, сейчас эти два слова кажутся вам довольно расплывчатыми, надеюсь, что к концу разговора вы поймете, какой смысл мы под ними подразумеваем.
0:17 Прежде чем перейти к делу, позвольте уточнить: у многих людей возникают проблемы со словом «онтология».
Что мы подразумеваем под этим словом? 0:24 Если посмотреть на корни этого слова, то оно происходит от греческих «онтос» (бытие) и «логия» (учение о чем-то).
По сути, онтология — это категоризация мира.
0:34 Чтобы описать это, люди используют множество терминов: таксономия, схематизатор модели данных.
Но мы используем это в более широком смысле, как идею о том, что мы на самом деле каким-то образом классифицируем мир.
0:43 Идея построения онтологии для изучения мира не нова.
Первым, кто одобрил эту идею, был человек по имени Платон.
Идея реализма Платона в основном состоит в том, что есть реальные вещи, а есть наше представление о вещах.
1:02 В его модели вещи реального мира являются проявлением определенных образцов из идеального мира.
Узнайте больше о методологии тестирования, которую мы используем в проектах в Центре разработки программного обеспечения EDISON.
1:07 Он рассуждал об общем и частном; об онтологии и бытии как таковом; о форме и копии (возможно, идее и воплощении?).
У компьютерщиков, с другой стороны, есть класс и объект. 1:15 По сути, это идея о том, что существует концепция чего-то и сама эта вещь.
И то, что делает его яблоком, — это то, что приближает нас к тому, что представляет собой понятие яблока (поправьте меня, люди, близко знакомые с философией Платона).
1:29 Что ж, это классная философия, но теперь вопрос в том, как мы можем ее использовать, как она может помочь нам создать инструмент, который может быть полезен в информационном сообществе.
1:36 Отличным примером удобной онтологической структуры является таблица Менделеева.
У нас здесь есть число десять (указывает на мышьяк, на атомную массу), оно что-то говорит о весе, о массе, но то, что мы видим здесь, — это не само «десять», в нашем реальном мире это концептуализация того, что должно быть «десять».
иметь в виду.
1:56 Еще один известный пример онтологии, точнее таксономии: это линейная таксономия, с латинскими названиями животных, и это хороший пример иерархической онтологии.
2:06 Здесь можно спуститься к роду panthera, а можно воспользоваться делением на виды с латинскими названиями: leo, tigris, pardus. Вы можете создавать объекты «лев», «тигр», «леопард».
2:20 Очевидно, что panthera pardus — это не сам леопард, а концепция того, что такое леопард.
2:25 Ну вы понимаете, в реальном мире есть живой леопард, а в онтологии - panthera pardus.
2:29 Те же понятия можно применить и к более значимым областям, если мы говорим о человеке.
Например, вот модель онтологии человека (человека): мы начали с объектов, перешли к сущностям, потом к живым существам, потом к людям.
2:43 Если мы хотим охарактеризовать человека дальше, то можно добавить такие понятия, как: летчик, юрист и врач - эти понятия объединяет общая идея выделения подвидов.
Мы поговорим об этом позже.
2:53 Как же на самом деле моделировать онтологию? Как бы вы структурировали свою онтологию?
2:58 Люди пробовали несколько методов.
Я перечислю четыре наиболее известных подхода.
3:03 Верхний привязан к предметам.
В объектных моделях, например в таксономии животных по латинским названиям, мы имеем определенные объекты, которые являются понятиями, которые должны соответствовать объектам реального мира.
Вы можете добавить немного глубины, богатства, добавив функции, и таким образом получить объекты с функциями.
3:21 Для примера можно взять таблицу Менделеева, где у объектов есть вес и количество протонов.
3:28 Чего не хватает в этой таблице, так это указания на взаимоотношения.
Некоторые зависимости можно понять, анализируя структуру таблицы, но вы не можете знать, например, образуют ли эти два вещества сплав.
3:40 Еще один способ моделирования мира — через объекты и отношения.
Это означает, что у вас есть объекты и то, как они связаны друг с другом.
3:47 И здесь пропущены знаки, которые были в таблице Менделеева.
Представление об особенностях можно получить, если опираться на отношения между двумя объектами, например, один из объектов является объектом данных, а если вы хотите сказать, что Майк Фикри (вымышленный злодей из одного из первых Palantir видео) голубые глаза, вы создаете связь между объектами «Майк Фикри» и «голубые глаза».
4:08 Это будет немного странно, но вы получите довольно хорошее представление об объекте.
4:13 Наконец, самый показательный метод: использование объектов, связей и атрибутов.
Как вы можете догадаться, именно этот метод мы используем в Palantir. 4:22 Давайте посмотрим немного глубже на онтологию Palantir и на то, как она применяется.
5:08 (Онтология пронизывает практически каждую функцию в рабочем пространстве Palantir. Поэтому наличие правильно спроектированной онтологии имеет решающее значение для эффективного анализа.
)
5:15 Я сказал, что Палантир — это динамическая онтология, давайте поговорим о том, что я подразумеваю под динамическим.
5:21 Первое, что мы имеем в виду, когда говорим о динамике, — это то, что онтология в Palantir не запрограммирована жестко.
Например, так спроектированы осевой уровень, уровень интерпретации, надстройка базы данных, уровень анализа и взаимодействия с пользователем.
5:33 Есть некоторые понятия, которые жестко запрограммированы: объект, атрибут, связь.
Объекты также строго делятся на документы, сущности и события.
И это всё — вся онтология, заданная заранее.
На самом деле это нечто большее, чем онтологическая структура, к которой вы привязаны и которую привыкли использовать.
5:50 Почему мягкое кодирование? Почему бы не жестко запрограммировать онтологию? Я расскажу о паре недостатков этого подхода.
6:00 Проблема в том, что с жестко запрограммированной онтологией вы неизбежно попадаете в один из двух лагерей.
6:06 У вас либо очень общая онтология, либо очень специфическая, и вам нужно выбрать, где вы хотите быть.
6:12 В обобщенной онтологии вы на самом деле ничего не моделируете.
У вас есть объекты, атрибуты и отношения, и внутрь такой онтологии можно положить что угодно, но, в общем, всё, моделировать там нечего.
6:21 Некоторые люди пытаются создавать очень специализированные онтологии, в которых можно моделировать все, что угодно.
Проблема здесь в том, что семантика становится переопределенной.
6:30 Что мы подразумеваем под переопределенной семантикой? Это ситуация, когда становится слишком сложно понять, как что-то моделировать.
6:35 Можно ввести понятие «уведомление» (цитата – выписка, повестка в суд, упоминание), и тогда один скажет: «Ой, уведомление – это когда я получаю штраф за парковку», а другой скажет, что уведомление приходит, когда человек получает бонус.
6:48 Если вы хотите смоделировать похожие вещи в переопределённой онтологии, используя «уведомление», их становится сложно разделить.
6:54 Если вы используете мягкое кодирование, существует диапазон между нашими лагерями, и, начиная с общей модели, вы достигнете определенной точки, которая соответствует вашим целям (сладкая точка).
7:11 Еще одним важным преимуществом динамической онтологии является то, что это гибкая система: вы можете моделировать множество разных концепций или одну концепцию разными способами.
7:19 Гибкость.
Посмотрим, как это работает. Ответим на вопрос: «Как смоделировать профессию человекаЭ»
7:28 На слайде написано: «Трудовую функцию человека можно классифицировать посредством определения объектов».
Для начала рассмотрим объектную модель занятости человека.
Мы классифицировали рабочие функции как объекты, и вы уже видели этот слайд. 7:40 У нас есть человек наверху и пилот, юрист и врач внизу, так что это как модель животных с родами и видами.
7:47 Каковы преимущества и недостатки этого метода? Минусом будет то, что вы не сможете сделать человека адвокатом и врачом одновременно (как льва и тигра), вам придется выбирать.
7:56 Преимущество в том, что у вас есть множество атрибутов, специфичных для врача или юриста, и вы можете использовать эти атрибуты.
8:04 Медицинская специализация явно отличается от юридической, и эту разницу можно легко использовать при работе с объектами.
8:12 На слайде написано: «Трудовые функции человека можно классифицировать, выявив признаки его занятости» Вы можете использовать знаки, чтобы получить представление о том, насколько занят человек.
8:17 Можно сказать, что у человека может быть признак «занят» и разные значения этого признака.
8:24 Вы можете быть врачом, летчиком, юристом, и если у вас есть представление о множественности атрибута, то вы можете выбрать несколько значений.
В Палантире это возможно: врач и пилот, пилот и юрист, юрист и повар.
8:35 Минус здесь в том, что вам придется попытаться добавить юристу информацию о том, что он из такого-то университета, не привязывая навсегда эту информацию к этому атрибуту.
8:45 Наконец, вы можете получить представление о карьере человека, используя отношения.
Причина, по которой кого-то называют врачом, не в том, что он окончил медицинский институт, а в том, что этот человек лечит пациентов.
8:58 Таким образом, можно сказать, что человек 1 является врачом по отношению к человеку 2, человек 1 является пилотом, потому что он управляет самолетом, человек 1 является юристом, потому что он оказывает юридические услуги человеку 3. Так что, по сути, это определяется карьера.
9:08 Итак, мы видим, что здесь есть три концепции моделирования карьеры.
Вы не сможете этого сделать, если используете жестко запрограммированную онтологию, например нормы общества.
9:21 Я говорил о гибкости, о мягком кодировании, но не все это подразумевает динамику.
Так что же действительно динамичного в онтологии Palantir? 9:31 Дело в том, что в Палантире онтологию можно изменить после того, как она была развернута.
Таким образом, онтология может развиваться по мере развития видения мира вашей организацией.
9:41 Несколько примеров изменений, которые вы можете внести:
— любой объект, признак или взаимосвязь можно удалить или добавить;
— функциональность объектов, функций и отношений можно менять, и это, наверное, самое главное.
9:54 Это важно, потому что большинство людей взаимодействуют с онтологией, пытаясь понять, за что отвечают различные функции и так далее.
10:05 Вот на слайде, для примера, список того, что можно изменить:
- добавлять/редактировать генераторы ярлыков;
- добавлять/изменять псевдонимы;
- добавить/изменить парсеры;
- добавить/изменить параметры управления;
- добавить/изменить значки;
- добавить/изменить приблизительные значения;
- добавлять/изменять ограничения функций;
- добавлять/редактировать ограничения на подключение.
10:15 Теперь давайте быстро подведем итоги.
С помощью динамической онтологии вы можете моделировать все, что нужно вашей организации в интересующей вас области.
Эта онтология состоит не из жесткого, а из мягкого кода.
(За помощь в подготовке статьи отдельная благодарность Алексею Ворсину, российскому эксперту по системе Palantir) Подробнее о Палантире:
- Киберконтрразведка.
Как Палантир может поймать Сноудена
- Palantir: как обнаружить ботнет
- Палантир и отмывание денег
- Палантир: торговля оружием и распространение пандемии
- Палантир, мафия PayPal, спецслужбы, мировое правительство
- Palantir 101. Что простым смертным позволено знать о второй крутой частной компании Кремниевой долины
-
Почему Существует Высокий Спрос На Ноутбуки?
19 Oct, 24 -
Используйте Меньше Денег, Находя Купоны
19 Oct, 24