Правильная версия файла robot.txt

M

Mar$hall

#1
приветствую форумчан!
Кучу материала перелопатил по этому вопросу и решил спросить об этом у знающих вебмастеров.
Какой он все таки ПРАВИЛЬНЫЙ robot.txt для блога на wordpress ??
 
Ф

Флоппи

#2
приветствую форумчан!

Кучу материала перелопатил по этому вопросу и решил спросить об этом у знающих вебмастеров.
Какой он все таки ПРАВИЛЬНЫЙ robot.txt для блога на wordpress ??

Robots.txt это просто инструмент и не зависит от CMS.

Все зависит от того, что именно вы хотите сообщить поисковикам. Все это делается в robots.txt

Важный момент ИМХО - это конечно указать основной домен яндексу, а также карту сайта. Все остальное на усмотрение.
 
S

Sutramana

#3
Зайдите на разные популярные блоги на вордпресс и смотрите как у них устроено. Сделайте выводы и применяйте к своему сайту.
 
S

Sutramana

#4
Я в таких случаях так и делаю.

Проверить cms сайта можно тут: 2ip.ru
а robots.txt любого сайта можно посмотреть domen.com/robots.txt

Ну и было бы неплохо прочитать руководства гугла и яндекса по настройке robots.txt
 
M

Mar$hall

#5
cms я указал лишь потому, что на нескольких ресурсах делали на этом акцент.


Все зависит от того, что именно вы хотите сообщить поисковикам
вот я и хочу узнать, что лучше показывать поисковикам, а что нельзя.
Прочитал, например что гугл чуть ли не требует доступа к файлам шаблона, а яндекс может выругаться на это.
Проблема в том, что все материалы которые я находил двухлетней и более давности.
 
M

Mar$hall

#6
Зайдите на разные популярные блоги на вордпресс и смотрите как у них устроено. Сделайте выводы и применяйте к своему сайту.
и почему вы думаете, что я этого не сделал до того как написал на форуме?:rolleyes:
 
W

Wmlogs

#7
вот я и хочу узнать, что лучше показывать поисковикам, а что нельзя.
То что должно быть индексировано ( статьи и изображения ) надо сообщить. Хотя достаточно адреса статей, картинки сам найдет гугл.
Остальное можно запретить. Хотя это не обязательно.
А карту сайта можно добавить сразу в консоли яндекса и гугла. Не обязательно сообщить в robots.txt, хотя не помешает.
 
M

Mar$hall

#9
User-agent: *
Allow: /wp-content/themes/frontend
Disallow: /wp-admin
Disallow: /wp-content
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: */trackback
Disallow: /xmlrpc.php
Disallow: */feed
Disallow: */author

User-agent: Googlebot-Image
Allow: /wp-content/uploads/

User-agent: YandexImages
Allow: /wp-content/uploads/
host: site.ru
Sitemap: https://site.ru/sitemap.xml

вот как один из вариантов, выделил жирным вторую строку, это папка с активной темой. Это если делать с учетом требований гугла
 
W

Wmlogs

#11
вот как один из вариантов, выделил жирным вторую строку, это папка с активной темой. Это если делать с учетом требований гугла
Там все нормально вроде бы, а Yandex и YandexImages разные боты. Их действительно нужно отделить, как указали выше.
 
M

Mar$hall

#13
ну видимо, для бота yandex действует общее условие, а для YandexImages отдельное. я еще плохо в этом разбираюсь
 
W

Wmlogs

#14
т.е. хотите сказать что акцент на картинки не обязательно делать?
Ну в той части, где Вы разрешили боту Yandex Images индексировать указанную директорию, Вы тем самым сообщили нужному боту где искать картинки.
 
W

Wmlogs

#15
ну видимо, для бота yandex действует общее условие, а для YandexImages отдельное. я еще плохо в этом разбираюсь

Дело не только в условиях, а в том, что yandex images индексирует только картинки. А основной бот остальное.
 
M

Mar$hall

#16
В общем решил остановиться на таком варианте

User-agent: *
Allow: /wp-content/themes/newsanchor/
Allow: /wp-content/plugins/
Allow: /wp-includes/js/
Allow: /wp-content/uploads/
Disallow: /wp-admin
Disallow: /wp-content
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: */trackback
Disallow: /xmlrpc.php
Disallow: */feed
Disallow: */author

host: site.ru

Sitemap: https://site.ru/sitemap.xml
 
W

Wmlogs

#17
В общем решил остановиться на таком варианте
host: понимает только Яндекс, лучше бы указать специально для Яндекс Бота. Хотя и так должно работать.
 
M

Mar$hall

#18
В общем решил остановиться на таком варианте
host: понимает только Яндекс, лучше бы указать специально для Яндекс Бота. Хотя и так должно работать.

тоже решил что и так должно работать
 
Get involved!

Here you can only see a limited number of comments. On СЕО Форум Вебмастеров you see all comments and all functions are available to you. To the thread