Руководитель «Яндекс.
Браузера» Роман Иванов запущен сервис поиска по архивам Живого Журнала, которые сохраняются в Поиске по блогам Яндекса.
В разговоре с vc.ru он рассказал, что это его личный некоммерческий проект, не связанный с поисковиком.
Проект предназначен для исследователей, которым будут интересны «культурные пласты 2000-х», а также пользователей Живого журнала, желающих найти информацию тех лет, говорит Иванов.
Сервис собирал данные с 2000 года по осень 2015 года — 340 миллионов заметок и 1 миллиард комментариев, всего более терабайта информации.
Я считаю, что практически вся русскоязычная культура 2000-х произошла или, по крайней мере, нашла отражение в ЖЖ.Сервис разработан самим Ивановым при поддержке волонтеров — в частности, дизайн сервиса создан основателем закрыто Сейчас сервисом «Эвитерры» является Николай Заярный.Культурное значение этого архива невозможно переоценить.
Когда Яндекс закрыл поиск по архиву, я очень расстроился, так как убеждён, что этот архив нужно сохранить для человечества.
Ну я попросил у Яндекса архивы.
А Яндекс вдруг согласился и подарил их.
Последние полгода я и еще несколько волонтеров программировали этот самый поиск и вроде бы довели его до вменяемого состояния.
— Роман Иванов
Хостом поисковой системы является сайт Servers.ru, который предложил Иванову бесплатную помощь.
Поскольку новые записи не индексируются, я ориентируюсь на исследователей.Теперь создатель сервиса планирует переиндексировать архив и добавить поиск по точным словоформам, а также дать возможность искать комментарий одного пользователя в журнале другого.Как в прямом смысле слова исследователи культурных пластов 2000-х, так и просто нынешние или бывшие пользователи ЖЖ, желающие найти что-то, что было написано в те годы.
Исходя из этого, например, я не ограничивал максимальное время выполнения поискового запроса — исследователь может подождать минуту-две выполнения сложного запроса.
При этом, конечно, простые запросы выполняются быстро, и если сервис обнаруживает, что запросов запрашивается много, он включает контролируемую деградацию, в том числе ограничивает таймаут запроса.
— Роман Иванов
Чтобы предотвратить претензии со стороны правоохранительных органов, Иванов решил не показывать сохраненные копии уже удаленных записей пользователей с российских IP-адресов.
«Так сказать, я заранее ограничил российских детей от возможной пропаганды суицида, гомосексуализма, наркотиков, воровства в магазинах, неуплаты штрафов и перехода в неположенном месте», — сказал он.
Администрация Живого Журнала, к которой Иванов обратился с предложением о сотрудничестве, не проявила интереса к проекту.
Представитель «Яндекса» Ася Мелкумова в разговоре с vc.ru не исключила, что компания может предоставить архивы «Поиска по блогам» другим пользователям, которые заинтересуются ими для своих услуг.
«Яндекс» объявлено о закрытии рейтинга блогеров в «Поиске по блогам» в апреле 2014 года — это произошло из-за инициативы приравнять к СМИ блоги с посещаемостью свыше трёх тысяч пользователей в день.
С сентября 2015 года обслуживание находясь в поиске только для материалов возрастом менее одного месяца.
В компании объяснили это тем, что «подавляющее большинство наших пользователей ищут свежие записи, а к архивам обращаются довольно редко».
-
Удаленная Работа В It: Личный Опыт
19 Oct, 24 -
Однофакторная Двухфакторная Аутентификация
19 Oct, 24 -
О Системах Поддержки Управленческих Решений
19 Oct, 24 -
Объяснение Необъяснимого
19 Oct, 24 -
Лучшие Практики Для Поисковой Выдачи
19 Oct, 24