Это старая версия (1.12) DataMining.

Содержание

Data Mining

Интеллектуальный анализ данных, глубинный анализ данных, до́быча данных.

Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it.

Dan Ariely, Duke University

Определить, что такое Data Mining лучше всего апофатически, т.е. через отрицание (чем Data Mining не является):

  • Data Mining — это не статистика, параметрическая или непараметрическая, сколь бы изощренной она не была. В этом смысле, к Data Mining'у не относятся ни описательная статистика, ни обобщенный метод моментов, ни модели множественного выбора, ни анализ временных рядов методом автокорреляции и распределенного лага (ADL), ни анализ ссылок (связей). Хотя во всех вышеприведенных случаях могут использоваться элементы Data Mining'а: решение задачи классификации и группировки переменных до применения непосредственно математико-статистических методов, кластеризация для корректного применения.
  • Data Mining — это не применение программирования к статистике. Прежде всего потому что, любая исследовательская задача, оперирующая количественными данными по определению должна решаться с использованием того или иного программного средства (от MS Excel до UNIX Stat). Если кто-то говорит о себе как о статистике и при этом щелкает по меню Excel'я, то бейте его руками, ногами и арматурой, гоните в шею, режьте на ломти. Это не аналитик, а продукт пищеварения высших млекопитающих.