1. Алгоритм — это:
*указание на выполнение действий
*процесс выполнения вычислений, приводящих к решению задачи
*система правил, описывающая последовательность действий, которые необходимо выполнить для решения задачи
2. Бизнес процесс – это:
*Взаимосвязанные виды деятельности, преобразующие входы в выходы
*Cовокупность взаимосвязанных и взаимодействующих видов деятельности, преобразующая входы в выходы, представляющие ценность для клиента
*Cовокупность разнородных и существенных видов деятельности, преобразующая входы в выходы, которые могут быть полезны для клиента
*Множество видов деятельности, объединенных производством одного продукта, услуги
3. Большинство методов Data mining были разработаны в рамках …
*теории искусственного интеллекта
*классического анализа данных
*теории баз данных
4. В каких из приведенных ниже случаев речь идет структурированных данных:
*Данные о продажах фирмы, представленные в виде отчётов в MS Excel
*Таблица с ежедневными показаниями температуры помещения за год в файле формата CSV
*Текст книги, представленный в формате PDF
*Фильмы, представленных в формате mpeg на одном жестком диске
5. Горизонтальная масштабируемость при обработке Big Data – это:
*Расширение механизма обработки данных при росте объема данных
*Увеличение скорости обработки при росте объема данных
*Спад скорости обработки при росте объема данных
*Изменение масштабов представления результатов обработки данных
6. Деревья решений относятся к группе (группам) …
*статистических методов
*кибернетических методов
*логических методов
*методов кросс-табуляции
7. Заказчик бизнес-процесса – это должностное лицо:
*Имеет в своем распоряжении средства для заказа выхода бизнес - процесса
*Имеет в своем распоряжении материальные и информационные ресурсы бизнес - процесса, управляет его ходом, несет ответственность за результат и эффективность
*Имеет в своем распоряжении ресурсы и полномочия для принятия решений о проведении работ по описанию, регламентации или аудиту бизнес - процесса
*имеет в своем распоряжении необходимый инструментарий для проектирования бизнес - процессом и его управления
8. К основным характеристикам Big Data относятся:
*Virtualization, Volume, Variability, Vehicle
*Variety, Velocity, Volume, Value
*Verification, Volume, Velocity, Visualization
*Video, Value, Variety, Volume
9. Как в R обозначаются пропущенные значения?
10. Как можно получить помощь в R:
*В R-Studio можно поставить курсор на название функции и нажать F1
*перед названием функции можно напечатать знак вопроса;
*можно воспользоваться функцией help()
11. Как назвается в R тип данных «булевы»?
12. Как назвается в R тип данных «строки»?
13. Как назвается в R тип данных «целые числа»?
14. Как назвается в R тип данных «числа с плавающей точкой»?
15. Какая функция dplyr служит для вертикального объединения таблиц?
*bind()
*bind_rows()
*left_join()
*union()
*bind_cols()
*join()
16. Какие циклы доступны в базовом синтаксисе языка R?
*For
*Which
*Repeat
*While
*Next
*goto
17. Каким образом можно объявить переменную «а» на языке R:
* а =
*а<-
* а >-
*a !=
18. Локальность данных Big Data – это:
*Расширение механизма обработки данных при росте объема данных
*Обработка и хранение происходит на одной машине
*Время коммуникации не может быть выше времени обработки
*Данные не стоит обрабатывать на сервере их хранения
19. Медианой для выборки 1,__,3,7,10,15,16,18 является:
*7,714286
*7
*8,5
*рассчитать медиану невозможно из-за пропущенных значений
20. На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
*Понимание бизнеса (Business understanding)
*Понимание данных (Data Understanding)
*Моделирование (Modeling)
*Оценка (Evaluation)
21. Назовите сложности иерархических методов кластеризации:
*Ограничение объема набора данных
*Выбор меры близости
*Негибкость полученных классификаций
*Наличие предположений относительно числа кластеров
22. Неверно, что ден