Прошло более двух лет с тех пор, как была опубликована статья, лежащая в основе TrustRank, но даже сегодня, более двух лет спустя, вряд ли кто-либо за пределами основного мира интернет-маркетинга имеет представление о том, что это такое. Первоначальная концепция была простой и состояла всего из нескольких строк.
Борьба с веб-спамом с помощью TrustRank. Технический отчет, Стэнфордский университет, 2004 г.
На страницах веб-спама используются различные методы для достижения более высокого, чем заслуженного, рейтинга в результатах поисковых систем. Хотя эксперты-люди могут выявить спам, вручную оценивать большое количество страниц слишком дорого. Вместо этого мы предлагаем методы полуавтоматического отделения авторитетных и хороших страниц от спама. Сначала мы выбираем небольшой набор исходных страниц для оценки экспертом. Как только мы вручную определяем авторитетные начальные страницы, мы используем структуру ссылок в Интернете, чтобы обнаружить другие страницы, которые могут оказаться хорошими. В этой статье мы обсуждаем возможные способы реализации начального выбора и обнаружения хороших страниц. Мы представляем результаты экспериментов, проведенных во Всемирной паутине, индексируемой AltaVista, и оцениваем эффективность наших методов. Наши результаты показывают, что мы можем эффективно фильтровать спам из значительной части сети, основываясь на хорошем исходном наборе из менее чем 200 сайтов.
Исходный документ http://dbpubs.stanford.edu:8090/pub/2004-17.
Попробую объяснить доступным языком, о чем идет речь.
Прежде всего вам нужно будет понять, что такое хабы и авторитетные сайты в глазах Google. Сайты и страницы группируются по фразам и темам как часть веб-карты Google. Внутри этих кластеров Google определит свои текущие центры и органы власти. Хабы — это сайты, которые ссылаются на многие сайты в этом кластере, а авторитетные — это сайты в этом кластере, которые получают больше ссылок на него, чем другие.
Google уже вручную оценил эти сайты с точки зрения их содержания, сайтов, на которые они ссылаются, и их надежности.
Ярким примером может служить BBC. У них есть строгий набор правил, которых редакторы должны придерживаться в отношении ссылок на сайты в сети. У них также есть строгие правила, установленные и контролируемые органами, назначенными правительством. Этим исходным сайтам будет присвоен фактор доверия, который затем можно будет передать (или проголосовать) на другие сайты (например, рейтинг страницы) через их ссылки.
Большинство нишевых надежных сайтов будут содержать ссылки на похожий контент или ссылки на ссылки на похожий контент. НАПРИМЕР. Reuters может запустить новостную ленту, которую подхватит BBC, которая перепишет и процитирует исходный отчет Reuters. CNN может сослаться на более развитую версию BBC. ВСЕ эти сайты взаимосвязаны, и все они являются доверенными сайтами. Все они также могут ссылаться на веб-сайт, на котором изначально был опубликован официальный документ/обвинение/контент.
Итак, давайте применим это на практике.
Я выпускаю нишевый альтруистический веб-сайт, который хорошо принимается. Эту новость подхватывает BBC, которая дает на нее ссылку. Различные другие новостные сайты подхватывают это и также указывают ссылки на мой нишевый сайт. Со временем на меня ссылаются другие благотворительные и образовательные сайты, а также церковные сайты и т. д. Многие из этих сайтов будут либо доверенными, либо ссылаться на них. Чем ближе сайт, который ссылается на меня, к исходному сайту, тем больше TrustRank получит мой сайт альтруизма, чем дальше, тем меньше. По умолчанию, если мой TrustRank достигает определенного уровня (вызванного многочисленными сайтами, которые унаследовали TrustRank от голосов ), я вполне мог бы сам стать доверенным хабом, сделав ссылки с моего сайта очень ценными (с точки зрения TrustRank, а не в денежном выражении, хотя это тоже будет иметь место, но никто не будет знать TrustRank, чтобы знать его ценность)
Если вы хотите увидеть сырую версию TrustRank в действии, посмотрите систему голосования на форуме.
Если за вас голосует кто-то с красной (отрицательной) репутацией (хорошей или плохой), это не влияет на вашу репутацию, потому что в глазах системы ему не доверяют, потому что так сказали другие, которым ДЕЙСТВИТЕЛЬНО доверяют. В то время как голос (хороший или плохой) от человека с большим количеством квадратов репутации может поднять вас на высоту или обречь на огненную печь, в то время как голоса тех, у кого есть один или два квадрата репутации, будут учитываться, но не так уж и много. Это упрощенная форма TrustRank.
Я убежден, что TrustRank будет складываться так, что сумма целого будет больше, чем его части. поэтому, если сайт получил ссылки с исходного сайта, он будет стоить x, но сайт со ссылками с двух исходных сайтов может стоить x + y + составное значение доверия.
Ниже приведено графическое представление того, как это может работать, но я для простоты не добавлял сумму процентов и использовал круглые числа. Google PageRank использует целое число 1 в качестве основы для каждой страницы и «значение голосования», равное 0,85 значения PageRank. (Это результат применения коэффициента демпфирования 0,15 ко всем страницам при определении ценности исходящих ссылок со страницы).
http://www.umbrella-consultancy.co.uk/tr1.jpg (адрес изображения)
Это мой взгляд на TrustRank. Таким образом, старая поговорка о создании качественного контента, на который люди захотят ссылаться, сейчас значит больше, чем когда-либо.
И последнее: в жизни есть баланс, на каждый осколок света приходится тьма, на каждый белый Стетсон приходится черный. Если некоторым сайтам ДОВЕРЯЮТСЯ либо по начальному значению, либо по одобрению начального числа, то некоторым НЕ будет. Поэтому возможно, что ссылки с ненадежных (из-за неизвестного TrustRank) сайтов не получат никакой пользы от ссылок? Просто теория.
-
Новейший Дизайн Кожаной Косухи Этого Сезона
19 Oct, 24 -
Обучение Млм: 4 Варианта
19 Oct, 24 -
Вы Предприниматель
19 Oct, 24