Содержание
Data Mining
Интеллектуальный анализ данных, глубинный анализ данных, до́быча данных.
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.
Dan Ariely, Duke University
Определить, что такое Data Mining лучше всего апофатически, т.е. через отрицание (чем Data Mining не является):
- Data Mining — это не статистика, параметрическая или непараметрическая, сколь бы изощренной она не была. В этом смысле, к Data Mining'у не относится ни описательная статистика, ни обобщенный метод моментов, ни модели множественного выбора, ни анализ временных рядов методом автокорреляции и распределенного лага (ADL), ни анализ ссылок (связей). Хотя во всех вышеприведенных случаях могут использоваться элементы Data Mining'а к решению проблемы: решение задачи классификации и группировки переменных до применения непосредственно математико-статистических методов.
- Data Mining — это не применение программирования к статистике. Прежде всего потому что, любая исследовательская задача, оперирующая количественными данными по определению должна решаться с использованием того или иного программного средства (от MS Excel до UNIX Stat).