WhatsApp +7(499) 113-2062 info@adg.ru Okhotnyi Ryad str.2 Moscow, Russia
Folow us on social

Data Mining

Услуги Анализа Данных

Мы можем помочь вам использовать ваши собственные данные в связке с важными внешними данными (экономическими показателями, данными ЖКХ, финансовыми индексами, климатическими индикаторами и др.) для прогнозирования ваших будущих результатов.

c

Лог файлы, тексты,
CSV/XML/Excel файлы,
базы данных,
API веб-сервисов,
бизнес-приложения,
и т.д.

Сортировка,
очистка,
предобработка,
связывание,
систематизация и
консолидация данных

Объединение
наборов данных
и отбор факторов для
машинного обучения,
прогнозирование,
сложные расчеты

Визуальная
интерпретация
(графики и диаграмы)
результатов
многомерного
анализа

Data Collection

Сбор данных

После формулирования задачи, специалисты компании приступают к предварительному исследованию данных, необходимых для решения поставленной задачи.

Со стороны заказчика может потребоваться участие для выяснения, например, смысла исследуемых данных или погружения в специфику.

Иструменты и методы

Языки: Python, R, shell, PHP, SQL
Методы: API, ODBC
Инструментарий: Power Pivot, Excel, MSSQL, MySQL

Наборы данных

База данных и файловые архивы заказчика

Публичные наборы данных и API открытых баз данных

Очистка данных

На данном этапе специалисты компании подготавливают данные для их дальнейшего анализа. Для этого используется весь спектр методов подготовки данных, в каждом конкретном случае специалисты выбирают наиболее подходящие методы.

Иструментарий

Языки: Python, R, shell, PHP, SQL
Методы: API, ODBC
Программы: Power Pivot, Excel, MSSQL, MySQL, Loginom, IBM SPSS

Наборы данных

Базы данных и файловые архивы заказчика

Публичные наборы данных и API к открытым базам данных

f
c

Моделирование

Непосредственно анализ данных. Это полностью технический процесс, который специалисты компании проводят как с помощью собственных алгоритмов, так и с применением ПО мировых лидеров анализа и проверки гипотез.

Иструментарий

Языки: Python, R
Методы: API
Программы: Statistica TIBCO, IBM SPSS/Watson

Наборы данных

Базы данных и файловые архивы заказчика

Публичные наборы данных и API открытых баз данных

Открытые сервисные API (Google, Yandex и др.)

Список применяемых методов для анализа и поиска «скрытых» знаний

Нейронные сети;

Группировка и разведочный анализ;

Таблицы частот и таблицы сопряженности;

Анализ Множественного отклика;

Непараметрические статистики;

Методы Анализа мощности;

Общие линейные модели (GLM);

Общие регрессионные модели (GRM);

Факторный анализ;

Обобщенные линейные модели (GLZ);

Общие модели частных наименьших квадратов (PLS);

Методы дисперсии и смешанных моделей ANOVA/ANCOVA;

Анализ выживаемости;

Общее нелинейное оценивание;

Анализ временных рядов / Прогнозирование;

Моделирование структурными уравнениями (SEPATH);

Методы кластерного анализа;

Анализ главных компонент и классификация;

Канонический корреляционный анализ;

Надежность и позиционный анализ;

Анализ соответствий;

Дискриминантный анализ;

Общие модели дискриминантного анализа (GDA);

и другие методы.

Визуализация

Специалисты компании занимаются интерпретацией и визуализацией полученных знаний и закономерностей. Найденные знания представляются в удобной и понятной форме с использованием инструментов бизнес-аналитики

Иструментарий

Программы: Power BI, Tableau, Google Data Studio, Loginom, IBM SPSS, Power Pivot, Excel, etc.

Наборы данных

Базы данных и файловые архивы заказчика

Публичные наборы данных и API открытых баз данных

Открытые сервисные API (Google, Yandex и др.)

v