Инструменты анализа Web

- КиТ :: Будь в СЕТИ!

В конце 90-х годов европейскими учеными были предложены термины Web Mining (WM) и Web Analytics (WA), соотносящиеся примерно так же, как Data Mining (DM) и Data Analytics — WM в большей мере относится к формальным методам выделения по заданным шаблонам полезных данных из сырых, а WA ближе к семантике — извлечение полезной информации из данных

Однако в таком контексте эти различия не имеют существенного значения, поэтому, говоря об извлечении полезных сведений из WWW, будем иметь в виду и то и другое. WM — программное обеспечение, предназначенное для извлечения знаний из данных, обычно из документов и сопровождающих их гиперссылок, из сведений о пользователях и их активности, зафиксированных в разного рода журналах, короче, из всего, что может быть доступно в Сети. Первые публикации на тему WM датируются серединой 90-х годов, когда мирно сосуществовали два подхода — процессный (process-centric view), представляющий WM как последовательность выполняемых задач, и дата-центричный (data-centric view), привязанный к типам данных. В дальнейшем преимущественное распространение получил второй. Переломным в судьбе WM стал 2008 год, приведший к началу коммерциализации технологий WM, — компания Google предложила сервис Google Flu Trends (GFT), средствами которого удалось, например, предсказывать эпидемии гриппа, что дало основание для неумеренного оптимизма и веры в бесконечные возможности анализа Больших Данных. Однако избранная специалистами Google модель распространения эпидемий оказалась тогда недостаточно достоверной — в ней обнаружились серьезные погрешности, и незамедлительно начался массовый откат. Вполне ожидаемо главным критиком, а скорее стимулятором негатива, оказался не кто иной, как Билл Гейтс, вполне обоснованно видящий в Google своего стратегического конкурента.
ПодпискаБудь в СЕТИ! Новости социальных сетей - всегда актуальное
Группы: ВК|OK|Tg