Основные операции: сортировка, добавление и удаление столбцов в pandas

Мы рассмотрим сортировку данных, добавление новых столбцов и удаление существующих. Давайте начнем с примеров кода для каждой из этих операций.

Сортировка данных в DataFrame

Одной из основных операций с DataFrame является сортировка данных по определенным критериям. В pandas для этого можно использовать методы sort_values() и sort_index(). Давайте посмотрим на пример сортировки по значениям в столбце:

import pandas as pd

# Создаем DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 22, 28],
    'salary': [50000, 60000, 45000]
}

df = pd.DataFrame(data)

# Сортировка по возрасту
sorted_df = df.sort_values(by='age', ascending=True)
print(sorted_df)

Метод sort_values() позволяет сортировать DataFrame по значениям в указанном столбце или столбцах. В примере мы сортируем DataFrame по столбцу 'age' в порядке возрастания.

Добавление новых столбцов

Часто возникает необходимость добавить новый столбец на основе существующих данных. В pandas это можно сделать очень просто, например:

# Добавление нового столбца
df['income'] = df['salary'] * 12
print(df)

Здесь мы создаем новый столбец 'income', вычисляя его значения как произведение значений в столбце 'salary' на 12.

Удаление столбцов

Иногда бывает нужно удалить столбец, который больше не нужен для анализа данных. Для этого в pandas используется метод drop():

# Удаление столбца 'salary'
df = df.drop('salary', axis=1)
print(df)

Метод drop() позволяет удалить столбцы (axis=1) или строки (axis=0) из DataFrame.

В примере мы удаляем столбец 'salary'.

Заключение

В этой статье мы рассмотрели основные операции с DataFrame в pandas. Сортировка, добавление и удаление столбцов - это важные инструменты для работы с данными. Надеюсь, эти примеры помогут вам лучше понять, как использовать эти операции в ваших проектах. Удачи в работе с pandas!