"Automated Data Collection with R" - это практическое руководство по сбору данных из интернета и анализу текстов для начинающих и опытных пользователей R. В книге вводятся основные концепции архитектуры веба и баз данных, рассматриваются темы HTTP, HTML, XML, JSON, SQL. Предоставляются базовые техники для запроса веб-документов и наборов данных (XPath и регулярные выражения). Представлены обширные упражнения, которые помогут читателю освоить каждую технику. В книге рассматриваются как наблюдаемые (supervised), так и ненаблюдаемые (unsupervised) методы анализа данных, а также продвинутые методы, такие как сбор данных и управление текстом. В качестве примеров для каждой техники приводятся кейс-стади и код на языке R. Код и решения упражнений из книги представлены на сайте-поддержке.

Электронная Книга «Automated Data Collection with R» написана автором Peter Meißner в году.

Минимальный возраст читателя: 0

Язык: Английский

ISBN: 9781118834787


Описание книги от Peter Meißner

A hands on guide to web scraping and text mining for both beginners and experienced users of R Introduces fundamental concepts of the main architecture of the web and databases and covers HTTP, HTML, XML, JSON, SQL. Provides basic techniques to query web documents and data sets (XPath and regular expressions). An extensive set of exercises are presented to guide the reader through each technique. Explores both supervised and unsupervised techniques as well as advanced techniques such as data scraping and text management. Case studies are featured throughout along with examples for each technique presented. R code and solutions to exercises featured in the book are provided on a supporting website.



Похожие книги

Информация о книге

  • Рейтинг Книги:
  • Автор: Peter Meißner
  • Категория: Базы данных
  • Тип: Электронная Книга
  • Язык: Английский
  • Издатель: John Wiley & Sons Limited
  • ISBN: 9781118834787