Сбор данных в Интернете на языке R
Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов...
Main Author: | |
---|---|
Format: | Book |
Language: | Russian |
Published: |
Москва
ДМК Пресс
2017
|
Online Access: | https://e.lanbook.com/book/97350 https://e.lanbook.com/img/cover/book/97350.jpg |
Summary: | Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга. Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных. Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете. |
---|---|
Physical Description: | 280 с. |
Audience: | Книга из коллекции ДМК Пресс - Информатика |
Bibliography: | Библиогр.: доступна в карточке книги, на сайте ЭБС Лань |
ISBN: | 978-5-97060-459-5 |