We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Python for Data Science

2023/2024
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Course type:
Compulsory course
When:
3 year, 3, 4 module

Instructor


Senina, Anna

Программа дисциплины

Аннотация

Курс «Python для извлечения и обработки данных» имеет целью обучить студентов не только работе в Python, но и основам программирования вообще, поскольку наиболее базовые принципы являются схожими почти во всех языках программирования. При решении ряда задач исследователи часто сталкиваются с необходимостью работать с большими массивами данных. Для того чтобы эффективно работать с разными типами данных, необходимо знать основы программирования, так как именно навыки программирования позволяют автоматически собирать необходимую информацию за достаточно быстрое время. В качестве языка программирования в данном курсе используется Python. Язык Python на данный момент является очень популярным, в том числе в исследованиях в рамках социальных наук. Дисциплина подразделяется на два блока. Первый блок посвящен основам программирования и включает необходимые для дальнейшей работы в Python темы: переменные и типы данных, списки и кортежи, словари, условные конструкции, циклы и функции. Второй блок посвящен решению прикладных задач в Python и включает темы, связанные со сбором и анализом данных: выгрузка данных с сайтов, парсинг веб-страниц, работа с таблицами.
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение базовыми навыками программирования на языке Python, методами сбора и обработки данных для решения политологических и социально-экономических задач
Планируемые результаты обучения

Планируемые результаты обучения

  • Умеет работать с текстом, структурированными файлами (csv), xlsx-файлами и листами в них
  • Решает задачи на ввод-вывод и целочисленную арифметику
  • Применяет списки, кортежи, множества, методы работы с отдельными элементами и всеми структурами
  • Применяет цикл for, функцию range, решает задачи с использованием локальных и глобальных переменных
  • Применяет логические выражения, условный оператор, оператор цикла while
  • решает задачи на работу с вещественными числами, применяет функции работы со строками
  • Работать со строками, применять индексацию и форматирование строк
  • Создавать переменные, считывать информацию в переменные, обращаться к переменным
  • Корректно определять типы данных Python и конвертировать их
  • Работать со строками, применять индексацию и форматирование
  • Понимать ошибки, выданные программой, и исправлять их
  • Писать собственные условные конструкции
  • Использовать логический тип данных, операторы сравнения, логические операторы
  • Использовать циклы для обработки повторяющихся действий, прекращать работу цикла по условию
  • Понимать логику работы цикла
  • Использовать циклы для перебора последовательностей
  • Различать изменяемые и неизменяемые типы данных, понимать, какие методы работают с ними
  • Проводить операции над множествами, содержательно интерпретировать результаты
  • Создавать словарь и добавлять в него информацию, осуществлять поиск по словарю
  • Хранить и обращаться к данным внутри вложенных структур
  • Импортировать готовые функции и применять их
  • Сортировать последовательности, сортировать словари по ключам и по значениям
  • Открывать и создавать текстовые файлы
  • Считывать, обрабатывать и анализировать информацию из файлов
  • Писать собственные функции и применять их
  • Работать с инструментами обработки естественного языка
  • Применять регулярные выражения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1
  • Раздел 2
  • Раздел 3
  • Раздел 4
  • Раздел 5
  • Раздел 6
  • Раздел 7
  • Раздел 8
  • Раздел 9
  • Раздел 10
  • Раздел 11
Элементы контроля

Элементы контроля

  • неблокирующий Домашняя работа
    Требуется написать программу на любую тему, решающую проблему студента. В программе должны быть использованы: переменные контейнеры, циклы или функции, работа с файлами. Задание сдается в виде тетрадки с кодом с комментариями
  • неблокирующий Контрольная работа 2
    Контрольная на основе независимого экзамена: А4, 6, 8, В5-8, С2-4
  • неблокирующий Контрольная работа 1
    Контрольная на основе независимого экзамена: А1-3, 5, 7, В1-4, С1
  • неблокирующий Тесты
  • неблокирующий Контрольная работа 2 анализ данных
  • неблокирующий Тесты на лекциях
  • неблокирующий Контрольная работа 1 анализ данных
  • неблокирующий Исследовательский проект
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.2 * Домашняя работа + 0.3 * Контрольная работа 1 + 0.3 * Контрольная работа 2 + 0.2 * Тесты на лекциях
  • 2023/2024 учебный год 4 модуль
    0.3 * Исследовательский проект + 0.2 * Контрольная работа 1 анализ данных + 0.2 * Контрольная работа 2 анализ данных + 0.3 * Тесты
Список литературы

Список литературы

Рекомендуемая основная литература

  • Bhasin, H. (2019). Python Basics : A Self-Teaching Introduction. Dulles, Virginia: Mercury Learning & Information. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1991381
  • Nelli, F. (2015). Python Data Analytics : Data Analysis and Science Using Pandas, Matplotlib and the Python Programming Language. [Berkeley, CA]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1056488
  • Основы алгоритмизации и программирования на Python : учеб. пособие / С.Р. Гуриков. — М. : ФОРУМ : ИНФРА-М, 2019. — 343 с. — (Среднее профессиональное образование). - Режим доступа: http://znanium.com/catalog/product/970143

Рекомендуемая дополнительная литература

  • Сузи, Р. А. Язык программирования Python : учебное пособие / Р. А. Сузи. — 2-е изд. — Москва : ИНТУИТ, 2016. — 350 с. — ISBN 5-9556-0058-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100546 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Антропова Анна Александровна
  • Ткаченко Николай Александрович
  • Сенина Анна Васильевна