Цель лабораторной работы: Познакомиться с основными возможностями библиотеки Pandas для анализа и обработки данных. Научиться выполнять загрузку данных, их очистку, трансформацию, анализ и визуализацию.
Необходимые инструменты: Python, Pandas, Matplotlib или Seaborn для визуализации.
Данные для анализа: Для выполнения лабораторной работы можно использовать набор данных о пассажирах Титаника (Titanic dataset), который легко найти в открытом доступе, например, на платформе Kaggle.
- Импортируйте необходимые библиотеки (Pandas, Matplotlib/Seaborn).
- Загрузите данные о пассажирах Титаника из CSV-файла в DataFrame.
- Выведите первые 10 записей из таблицы.
- Определите размерность данных, количество пустых значений в каждом столбце и типы данных.
- Удалите столбцы, которые не будут использоваться в анализе.
- Заполните пропущенные значения в столбце возраста (например, медианным значением возраста).
- Преобразуйте категориальные переменные в числовые (например, пол пассажиров).