Кластеризация может означать совместную работу двух или более компьютерных систем или нескольких серверов, связанных вместе с целью обработки переменных рабочих нагрузок, а также для обеспечения непрерывной работы в случае сбоя одной из них. Это также может относиться к кластеризации данных, которая представляет собой метод, используемый для анализа данных путем разделения набора данных на подмножества, элементы которых имеют общие черты. Кластеризация результатов поиска призвана изменить способ поиска людей в Интернете путем организации результатов поиска в папки, в которых группируются похожие элементы.
Зачем нужна кластеризация
Использование обширной информации, доступной в Интернете, не может быть максимально эффективно использовано без предоставления эффективных средств ее организации. Механизмы кластеризации объединяют результаты поиска на основе текстового и лингвистического сходства. Это базовое сходство поддерживается эвристикой, которую кодируют программисты, используя в качестве основы предпочтения пользователей относительно того, что они хотят видеть в кластерных документах. Кластеры представлены в виде папок и подпапок.
Когда поисковая система предоставляет миллионы результатов по определенному запросу, поисковик может либо просеивать бесконечные страницы результатов, либо зависеть от решения поисковой системы относительно наиболее релевантных результатов. Ни один из них не может гарантировать доступность целевой информации, поскольку она может оставаться скрытой под страницами результатов или не соответствовать критериям поисковой системы. Точно так же, как все остальные вещи группируются или организованы, мир веб-поиска станет более полезным, если получить преимущества организованных результатов поиска.
Механизмы кластеризации автоматически группируют результаты по категориям, которые были разумно выбраны из слов и фраз, содержащихся в результатах поиска. Категории предназначены для достижения точности человеческого уровня и предоставления возможностей иерархической детализации в знакомом интерфейсе в виде папок. Умопомрачительные списки не нужно пролистывать или игнорировать, поскольку основные темы просматриваются в первых 300–500 результатах прямо на первой странице. Предоставляется краткий обзор типов информации, доступной по конкретной теме, чтобы можно было сразу сосредоточить внимание на интересующей области.
Благодаря значительному улучшению способности поисковых систем выдавать большое количество релевантных результатов стало сложнее осмысленно перемещаться по всем результатам. Типичный поисковик не тратит время на просмотр результатов за пределами первой страницы, поэтому очень вероятно, что он пропустит результаты, которые были бы релевантны и полезны для его/ее поиска или запроса. Кластеры позволяют получить результаты, найденные на десятой странице, всего одним щелчком мыши. Связанные элементы также можно просматривать вместе без особых усилий. Он даже раскрывает неожиданные связи между словами, идеями и понятиями.
Хороший кластер считается таковым, если он имеет читаемое описание. Он должен помочь сузить поиск и найти точные результаты. Механизм кластеризации запрашивает несколько поисковых систем и объединяет результаты для кластеризации и отображения на одном экране. Каждый список результатов содержит информацию об общем количестве кластеризованных и полученных результатов. Собственная эвристика механизма кластеризации должна определять страницы, которым отдается предпочтение. Поисковые системы иногда возвращают несколько копий одной и той же страницы с немного разными URL-адресами, но это сводится к минимуму при кластеризации результатов поиска. Это связано с тем, что механизмы кластеризации не воспроизводят результаты со схожими описаниями. Кластеры достаточно специфичны, поэтому повторяющиеся документы встречаются очень редко. Некоторые из них могут предлагать расширенные функции поиска, которые позволяют поисковикам указать, какие источники следует искать, количество желаемых результатов, допустимое время ожидания, желаемый язык, который будет использоваться, и фильтрацию оскорбительного контента.
Поисковые системы, которые кластеризуются
Наборы Google не предоставляют результатов, а скорее помогают найти термины, похожие на введенные. Это позволяет пользователю создавать более сложные запросы в одной области и проводить мозговой штурм о том, как объединить поиск. Google Sets — это агент кластеризации Google Labs.
Wisenut — это полнотекстовая поисковая система, которая предоставляет связанные темы, помимо ряда результатов для любого введенного элемента поиска. Это называется WiseGuide. Некоторые результаты будут иметь подтемы, которые будут отображаться под сгруппированными результатами. Ссылку можно найти рядом с каждым кластеризованным результатом, ключевые слова которого можно использовать для выполнения другого поиска. В дополнение к результатам веб-страницы должен быть получен другой набор кластеризованных результатов. Эту поисковую систему купила компания LookSmart.
Teoma прозвали «убийцей Google» из-за ее очень интересной технологии кластеризации. Один поиск даст четыре набора результатов. Слева вверху — спонсируемые результаты, внизу — результаты, не спонсируемые веб-сайтом, справа вверху — предложения по уточнению результата, а справа внизу — расчеты ссылок от экспертов и энтузиастов. Коллекции ссылок подходят для общих информационных потребностей, а предложения предназначены для более конкретного поиска. Щелчок по любому из них будет сигнализировать о возобновлении поиска, при этом будет предоставлен другой набор результатов сайта. Teoma была куплена AskJeeves.
Infonetware.com — это скорее демонстрация технологии Real Term от Infonetware, чем поисковая система. Страница результатов имеет рамку, где в области слева представлены темы, связанные с поисковым запросом, а результаты поиска по веб-странице находятся в правой рамке. Работает с полным поиском.
Oingo использует открытый проект Directory в качестве источника поиска. На странице результатов поиска представлен раскрывающийся список потенциальных значений. Под ним можно найти список категорий в порядке их релевантности для поиска, а также результаты поиска в самом каталоге. Это более полезно для поиска по общим терминам или для поисковых запросов, относящихся к широкой категории.
Vivisimo — это метапоисковая система, которая группирует результаты. Он предоставляет очень простую главную страницу с результатами поиска, организованными в группы. Дизайн страницы позволяет легко исследовать несколько категорий, не теряя при этом места. Clusty — это сайт для поиска потребителей, созданный и принадлежащий Vivisimo. Он запрашивает результаты из Ask, MSN, Open Directory, LookSmart, Gigablast и WiseNut. Эти сайты были выбраны из-за их точных результатов и быстрой скорости возврата.
Query Server предлагает несколько типов поиска в левой части главной страницы. Каждый поиск имеет более или менее одинаковый интерфейс и все результаты кластеризации. Результаты поиска представлены в рамке в правой части сайта.
Surfwax предлагает как подписные, так и бесплатные услуги. Ссылку на фокус можно увидеть в верхнем левом углу после ввода поиска. Эти ключевые слова можно использовать в дополнение к поисковому запросу. Они разделены на более узкие или более широкие категории и содержат общие слова, а не ссылки на конкретных людей или места.
Поиск новостей Northern Light требует, чтобы поиск имел определенное количество результатов, чтобы их можно было сгруппировать в папки. Однако список папок не предоставляет информацию о содержимом конкретной папки, хотя для более широких тем предусмотрены подпапки. Результаты поиска перечислены в порядке даты.
Поисковые системы с кластеризацией разбивают несколько сотен результатов на управляемые пакеты. Предложения предоставляются для максимального использования информации и облегчения самого поиска. Поисковый запрос не всегда может быть достаточно конкретным, чтобы сразу найти нужную информацию.
-
14 Шагов К Надежному Веб-Сайту
19 Oct, 24 -
Оценка Лучших Компаний Сетевого Маркетинга
19 Oct, 24 -
Seoblogbuilder — Обзо?
19 Oct, 24 -
Приготовление Еды Из Ничего
19 Oct, 24 -
Зачем Получать Деньги За Свое Мнение
19 Oct, 24 -
Подходит Ли Вам Интернет-Бизнес
19 Oct, 24 -
Определение Характера Спроса
19 Oct, 24