Сегодня вряд ли найдется компания, которая не использует IT-технологии в процессе своей деятельности.
Взрывной рост объемов корпоративной информации, хранящейся на серверах, в некотором смысле определил развитие рынка систем хранения данных и одновременно создал новые ниши.
Одной из таких ниш является корпоративный поиск.
Компании все чаще понимают, что их инфраструктура требует интуитивно понятной и знакомой панели поиска.
Корпоративный поиск — это инструмент для бизнеса, для сотрудников предприятия — конечных пользователей, не связанных с ИТ.
Прежде всего, это поиск информации на файловых серверах, где по сути нет структурирования, а также поиск на таких платформах, как Exchange и SharePoint. Таким образом, инструмент поиска, с одной стороны, должен быть простым в использовании и адаптированным к корпоративной специфике, а с другой стороны, он должен без ущерба интегрироваться с существующими системами и нормативными актами, уметь индексировать многие современные форматы данных и удовлетворять многим требованиям.
другие технические требования.
Итак, возьмем сотрудника юридического отдела, которому необходимо найти шаблон договора, составленного им самим или его коллегой.
Каким бы адекватным ни был поиск, на выходе все равно будет огромный выбор похожих документов для разных контрагентов, множество версий одного и того же документа, его копий в разных местах, в том числе самых неожиданных.
Пресловутая корпоративная специфика очевидна.
В идеале тогда вступит в силу расширенный поиск — некоторые фильтры на основе содержимого и метаданных файла.
В зависимости от содержимого файла вы можете: — задать слова и фразы, которые должны присутствовать в документе; — набор слов и словосочетаний, хотя бы одно из которых должно присутствовать в документе; — установить слова и фразы, которых НЕ должно быть в документе; — укажите, где именно искать термины: заголовок документа, текст документа.
Используя метаданные файла, вы можете указать: — формат документа; — язык документа; — временные рамки последнего изменения документа; — автор документа; — формат документа.
Также на основе индексов можно искать дубликаты и аналогичные документы.
После такой фильтрации нужный документ (версия) будет найден очень быстро.
Но теперь давайте посмотрим на проблему с другой стороны.
Найдёт ли сотрудник документы, к которым у него не должно быть доступа? Или, например, намеренно введет в поисковую строку фразы «паспортные данные», «для служебного пользования» и т.п.
В такой ситуации необходимо для поиска использовать базу метаданных, содержащую всю информацию о правах каждого пользователя, членстве в группах AD, статистику (логи) доступа к ресурсам предприятия.
Таким образом, каждый пользователь системы видит только ту информацию, которую ему следует видеть.
Более того, на уровне администрирования поискового ресурса можно исключить из результатов поиска информацию, подпадающую под правила классификации, например, паспортные данные.
Кроме того, использование метаданных дает ряд преимуществ: — инкрементная индексация: проверяя события, мы знаем, где произошли изменения и появились новые файлы; - высокая скорость повышения релевантности поиска и высокая релевантность поиска: аналитическое ядро использует данные аудита действий пользователей, а также данные из AD о членстве в группах.
Для каждого пользователя строится модель поведения: он принадлежит к таким-то группам, использует такие-то файлы.
Соответственно, «похожие» пользователи получают схожие образцы.
Например, сотрудники разных отделов (и одновременно члены разных групп безопасности) с течением времени видят разные выборки по одним и тем же запросам, при условии равных прав; — поддержка любых форматов данных, в том числе специфичных для конкретной области: для индексации используется полнотекстовый поиск на базе iFilter. Соответственно, если для формата существует реализация iFilter, то его можно индексировать.
Интеграция с AD значительно повышает безопасность поиска.
Например, только пользователи домена могут использовать поиск; все поисковые запросы протоколируются.
Служба информационной безопасности всегда сможет отследить, кто искал паспортные данные и т.д. В результате мы имеем простой и эффективный инструмент для бизнеса и в то же время кроссплатформенный, масштабируемый и безопасный инструмент для ИТ с возможностями аудита.
Теги: #поиск информации #файловые серверы #данные о торгах #информационная безопасность #данные компании #информационная безопасность #Поисковые технологии #Big Data
-
Ремонт Планшетов Android Apple Ipad
19 Oct, 24 -
Шахматные Компьютеры: Novag Carnelian Ii
19 Oct, 24 -
Насекомые
19 Oct, 24 -
Робокуб 2010 Завершился
19 Oct, 24 -
Так Он Растет Или Что?
19 Oct, 24 -
Выпущен Apache Fop 0.94
19 Oct, 24