Skip to content

Лабораторная работа: Основы обработки данных с помощью Pandas

Notifications You must be signed in to change notification settings

MTUCI-Labs/Lab1-Pydantic

Repository files navigation

Лабораторная работа: Основы обработки данных с помощью Pandas

Цель лабораторной работы: Познакомиться с основными возможностями библиотеки Pandas для анализа и обработки данных. Научиться выполнять загрузку данных, их очистку, трансформацию, анализ и визуализацию.

Необходимые инструменты: Python, Pandas, Matplotlib или Seaborn для визуализации.

Данные для анализа: Для выполнения лабораторной работы можно использовать набор данных о пассажирах Титаника (Titanic dataset), который легко найти в открытом доступе, например, на платформе Kaggle.

Задача 1: Загрузка и первичный анализ данных

  • Импортируйте необходимые библиотеки (Pandas, Matplotlib/Seaborn).
  • Загрузите данные о пассажирах Титаника из CSV-файла в DataFrame.
  • Выведите первые 10 записей из таблицы.
  • Определите размерность данных, количество пустых значений в каждом столбце и типы данных.

Задача 2: Очистка и подготовка данных

  • Удалите столбцы, которые не будут использоваться в анализе.
  • Заполните пропущенные значения в столбце возраста (например, медианным значением возраста).
  • Преобразуйте категориальные переменные в числовые (например, пол пассажиров).

About

Лабораторная работа: Основы обработки данных с помощью Pandas

Topics

Resources

Stars

Watchers

Forks