Глава «Яндекс.браузера» Запустил Поиск В Архивах Живого Журнала По Данным «Яндекса»

Руководитель «Яндекс.

Браузера» Роман Иванов запущен сервис поиска по архивам Живого Журнала, которые сохраняются в Поиске по блогам Яндекса.

В разговоре с vc.ru он рассказал, что это его личный некоммерческий проект, не связанный с поисковиком.



Глава «Яндекс.
</p><p>
Браузера» запустил поиск в архивах Живого журнала по данным «Яндекса»

Проект предназначен для исследователей, которым будут интересны «культурные пласты 2000-х», а также пользователей Живого журнала, желающих найти информацию тех лет, говорит Иванов.

Сервис собирал данные с 2000 года по осень 2015 года — 340 миллионов заметок и 1 миллиард комментариев, всего более терабайта информации.

Я считаю, что практически вся русскоязычная культура 2000-х произошла или, по крайней мере, нашла отражение в ЖЖ.

Культурное значение этого архива невозможно переоценить.

Когда Яндекс закрыл поиск по архиву, я очень расстроился, так как убеждён, что этот архив нужно сохранить для человечества.

Ну я попросил у Яндекса архивы.

А Яндекс вдруг согласился и подарил их.

Последние полгода я и еще несколько волонтеров программировали этот самый поиск и вроде бы довели его до вменяемого состояния.

— Роман Иванов

Сервис разработан самим Ивановым при поддержке волонтеров — в частности, дизайн сервиса создан основателем закрыто Сейчас сервисом «Эвитерры» является Николай Заярный.

Хостом поисковой системы является сайт Servers.ru, который предложил Иванову бесплатную помощь.

Поскольку новые записи не индексируются, я ориентируюсь на исследователей.

Как в прямом смысле слова исследователи культурных пластов 2000-х, так и просто нынешние или бывшие пользователи ЖЖ, желающие найти что-то, что было написано в те годы.

Исходя из этого, например, я не ограничивал максимальное время выполнения поискового запроса — исследователь может подождать минуту-две выполнения сложного запроса.

При этом, конечно, простые запросы выполняются быстро, и если сервис обнаруживает, что запросов запрашивается много, он включает контролируемую деградацию, в том числе ограничивает таймаут запроса.

— Роман Иванов

Теперь создатель сервиса планирует переиндексировать архив и добавить поиск по точным словоформам, а также дать возможность искать комментарий одного пользователя в журнале другого.

Чтобы предотвратить претензии со стороны правоохранительных органов, Иванов решил не показывать сохраненные копии уже удаленных записей пользователей с российских IP-адресов.

«Так сказать, я заранее ограничил российских детей от возможной пропаганды суицида, гомосексуализма, наркотиков, воровства в магазинах, неуплаты штрафов и перехода в неположенном месте», — сказал он.

Администрация Живого Журнала, к которой Иванов обратился с предложением о сотрудничестве, не проявила интереса к проекту.

Представитель «Яндекса» Ася Мелкумова в разговоре с vc.ru не исключила, что компания может предоставить архивы «Поиска по блогам» другим пользователям, которые заинтересуются ими для своих услуг.

«Яндекс» объявлено о закрытии рейтинга блогеров в «Поиске по блогам» в апреле 2014 года — это произошло из-за инициативы приравнять к СМИ блоги с посещаемостью свыше трёх тысяч пользователей в день.

С сентября 2015 года обслуживание находясь в поиске только для материалов возрастом менее одного месяца.

В компании объяснили это тем, что «подавляющее большинство наших пользователей ищут свежие записи, а к архивам обращаются довольно редко».

Вместе с данным постом часто просматривают: