• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-исследовательский семинар "Статистические и эмпирические методы компьютинга"

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты

Преподаватели

Программа дисциплины

Аннотация

Учебная дисциплина "Статистические и эмпирические методы компьютинга"; направлена формирование у студентов профессиональных компетенций, связанных с использованием методов теории вероятностей и математической статистики в области программной инженерии и получение практических навыков применения статистических и эмпирических методов. В результате освоения данной дисциплины студент получит навыки самостоятельной исследовательской работы, предполагающей изучение специфических методов математической статистики, инструментов и средств, необходимых для решения прикладных задач.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Статистические и эмпириче-ские методы компьютинга» является:  получение высшего профессионального профилированного (на уровне бака-лавра) образования, позволяющего выпускнику успешно работать в избран-ной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда:  формирование у студентов профессиональных компетенций, связанных с использованием методов теории вероятности и математической статистики в области программной инженерии;  получение практических навыков применения статистических и эмпирических методов компьютинга в области разработки и экспериментального исследования программных приложений;  развитие умений, основанных на полученных теоретических знаниях, позволяющих на творческом и репродуктивном уровне применять и создавать эффективное ПО для решения задач обработки информации;  получение студентами навыков самостоятельной исследовательской работы, предполагающей изучение специфических методов математической статистики, инструментов и средств, необходимых для решения актуальной, в аспекте программной инженерии, задачи оценки и прогнозирования результатов различных видов деятельности.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает основные принципы работы программы и обработки статистических данных на R
  • Знает о типах данных языка R и умеет импор тировать данные в R
  • Знает об инструментах для работы с диаграммами рассеяния, размахов и точечных диаграмм
  • Умеет применять различные функции к мат рицам и таблицам данных
  • Умеет анализировать описательные статистики, применять выборочные функции распреде- ления и строить оценки плотности
  • Знает как оценивать параметры функции рас пределения генеральной совокупности
  • Знает о доверительных интервалах для выборок большого объема в R.
  • Знает основной принцип метода статистических гипотез, Умеет применять основные критерии проверки статистических гипотез: о равенстве генеральных средних, однородности дисперсий и выборок, о независимости выборок и о соотвествии выборки данному закону распределения.
  • Знает типы регрессий, умеет подгонять регрессивные модели при помощи функций языка R.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Программа обработки статистических данных R
    Установка программы обработки статистических данных R на персональный ком-пьютер. Основные принципы работы программы. Применение, преимущества и не-достатки R. Как начать работать в R (запуск, выход, загрузка и сохранение дан-ных). Скрипты, пакеты, функции, устройства.
  • Представление данных в R
    Типы данных языка R . Векторы, матрицы, факторы, пропущенные данные, списки и таблицы. Импортирование данных в R (ввод с клавиатуры, импорт из текстового файла с разделителем, импорт из Excel).
  • Базовые графические возможности в R. Работа с графиками и диаграммами.
    Построение графиков и параметры графических функций (символы и линии, цвета, характеристики текста размеры диаграммы и полей). Добавление текста, настройка параметров осей и условные обозначения (заголовки, оси, опорные линии, легенда, аннотации). Базовая функция построения графиков plot(). Базовые диаграммы в R (Столбчатые диаграммы, оптимизация столбчатых диаграмм. Круговые диаграммы. Гистограммы. Диаграммы ядерной оценки функции плотности. Диаграммы размахов, использование диаграмм размахов для сравнения групп между собой. Точечные диаграммы. Категоризованные графики.
  • Управление данными в R
    Числовые и текстовые функции. Математические функции. Статистические функ-ции. Функции распределения. Другие полезные функции. Применение функций к матрицам и таблицам данных.
  • Описательные статистики. Выборочные функции распределения. Оценки плотности.
    Выборочная функция распределения. Выборочные числовые характеристики. Оценка плотности распределения. Частотное распределение. Многомерные частот-ные распределения. Вычисление выборочных числовых характеристик и выбороч-ной функции распределения с использованием специальных функций в программе R. Использование функций summary(), hist(), boxplot(), qqnorm(), qqplot() и допол- нительных пакетов. Анализ выбросов. Заполнение пропущенных значений в таб-лицах данных. Воспроизводимость результатов при использовании генератора слу-чайных чисел. Законы распределения вероятностей, реализованные в R. Подбор за-кона и параметров распределения в R.
  • Точечные оценки неизвестных параметров.
    Оценка параметров функции распределения генеральной совокупности. Оценка параметров функции распределения генеральной совокупности и доверительного интервала с помощью функций программы R. Метод моментов. Функции uniroot(), uniroor.all(), multiroot(). Функции mmedist(), fitdist() пакета fitdistplus. Метод макси-мального правдоподобия. Функции fitdist(), mledist() пакета fitdistplus. Функция mle2() пакета bbmle. Функция mle() пакета ststs4. Функция maxLik() пакета maxLik.
  • Доверительные интервалы.
    Доверительные интервалы для выборок большого объема в R. Доверительные ин-тервалы для выборок небольшого объема в R. Экспериментальная проверка дове-рительного интервала для выборочного среднего. Тестовое испытание для алго-ритма сортировки поиском минимума. Импорт данных. Вычисление границ дове-рительного интервала при неизвестной дисперсии с заданной доверительной веро-ятностью (для значений вероятности 0,80; 0,85; 0,90; 0,95) при фиксированной длине входа. Повторные эксперименты и подсчет числа попаданий выборочного среднего в найденные доверительные интервалы. Определение экспериментальной частоты попаданий выборочного среднего для построенных доверительных интер-валов.
  • Проверка статистических гипотез в R для двух и более выборок.
    Проверка гипотез о нормальности выборки в R. Тест Шапиро-Уилка. Критерии со-гласия в R. Критерии Колмогорова-Смирнова, 2 Пирсона, t-тест Стьюдента. Гипотеза о равенстве средних двух генеральных совокупностей. Гипотеза об однородности дисперсий. Проверка гипотезы о законе распределения.
  • Регрессия, основанная на методе наименьших квадратов, в R.
    Типы регрессии (простая линейная, полиноминальная, множественная линейная, мно-гомерная, логистическая и другие). Подгонка регрессивных моделей при помощи функции lm(). Функции, позволяющие получать дополнительную информацию о по-догнанной модели summary(), coefficients(), confint(), fitted(), residuals(), plot().
Элементы контроля

Элементы контроля

  • неблокирующий контрольная работа
  • неблокирующий контрольная работа
  • неблокирующий работа у доски, анализ домашних заданий
  • неблокирующий экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.2 * контрольная работа + 0.2 * контрольная работа + 0.1 * работа у доски, анализ домашних заданий + 0.5 * экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Теория вероятностей и математическая статистика, учебное пособие для бакалавров, 12-е изд., 478 с., Гмурман, В. Е., 2014

Рекомендуемая дополнительная литература

  • Наглядная математическая статистика, учебное пособие, 3-е изд., испр., 472 с., Лагутин, М. Б., 2013