В книге "К вопросу индексации файловых хранилищ на базе протокола FTP" рассматривается система индексации серверов, основанных на протоколе FTP. Книга описывает набор функционала для индексации файлов и поисковой системы, а также подробно рассматривает основные проблемы, связанные с обработкой ответов на запросы по протоколу FTP, и методы их решения. Несмотря на то, что протокол FTP был создан более 34 лет назад, проблема индексации остается актуальной из-за огромного объема данных, хранящихся на существующих серверах. Разработанная система индексации состоит из трех основных частей: робота-индексатора, базы данных и веб-сервиса. Робот-индексатор способен работать с большинством типов FTP-серверов, обрабатывать возвращаемые ими данные, избегать ссылочные ловушки и сохранять результаты в базу данных. Веб-сервис принимает запросы от конечного пользователя и возвращает результаты поиска по базе данных. Пользователь может указать полное или частичное имя файла, тип файла и его размер. Отличительной особенностью системы является отслеживание истории изменений файлов и серверов.
В данной книге рассматривается система индексации FTP-серверов (протокола передачи файлов).
Электронная Книга «К вопросу индексации файловых хранилищ на базе протокола FTP» написана автором П. П. Кейно в 2019 году.
Минимальный возраст читателя: 0
Язык: Русский
Серии: Прикладная информатика. Научные статьи
Описание книги от П. П. Кейно
Рассматривается система индексации серверов на базе протокола FTP. В статье описан набор функционала для индексации файлов и поисковой системы. Подробно рассмотрены основные проблемы, встречающиеся при обработке ответов на запросы по протоколу FTP и методы их решения. Несмотря на эволюцию файловых хранилищ, прошедшую за 34 года после создания протокола FTP, проблема индексации остается актуальной благодаря огромному массиву данных, хранящихся на существующих серверах. Разработанная система индексации состоит из трех основных частей: робота-индексатора, базы данных и Web-сервиса. Робот-индексатор способен работать с большинством типов FTP серверов и обрабатывать возвращаемые ими данные, избегая ссылочные ловушки и сохраняя результаты в базу данных. Web-сервис принимает запросы от конечного пользователя и возвращает результат поиска по базе данных. Пользователь может указать полное или частичное имя файла, тип файла и его размер. Ключевым отличием от существующих систем является отслеживание истории изменений файлов и серверов.