Основные операции: сортировка, добавление и удаление столбцов в pandas
Мы рассмотрим сортировку данных, добавление новых столбцов и удаление существующих. Давайте начнем с примеров кода для каждой из этих операций.
Сортировка данных в DataFrame
Одной из основных операций с DataFrame является сортировка данных по определенным критериям. В pandas для этого можно использовать методы sort_values()
и sort_index()
. Давайте посмотрим на пример сортировки по значениям в столбце:
import pandas as pd
# Создаем DataFrame
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 22, 28],
'salary': [50000, 60000, 45000]
}
df = pd.DataFrame(data)
# Сортировка по возрасту
sorted_df = df.sort_values(by='age', ascending=True)
print(sorted_df)
Метод sort_values()
позволяет сортировать DataFrame по значениям в указанном столбце или столбцах. В примере мы сортируем DataFrame по столбцу 'age' в порядке возрастания.
Добавление новых столбцов
Часто возникает необходимость добавить новый столбец на основе существующих данных. В pandas это можно сделать очень просто, например:
# Добавление нового столбца
df['income'] = df['salary'] * 12
print(df)
Здесь мы создаем новый столбец 'income', вычисляя его значения как произведение значений в столбце 'salary' на 12.
Удаление столбцов
Иногда бывает нужно удалить столбец, который больше не нужен для анализа данных. Для этого в pandas используется метод drop()
:
# Удаление столбца 'salary'
df = df.drop('salary', axis=1)
print(df)
Метод drop()
позволяет удалить столбцы (axis=1) или строки (axis=0) из DataFrame.
В примере мы удаляем столбец 'salary'.
Заключение
В этой статье мы рассмотрели основные операции с DataFrame в pandas. Сортировка, добавление и удаление столбцов - это важные инструменты для работы с данными. Надеюсь, эти примеры помогут вам лучше понять, как использовать эти операции в ваших проектах. Удачи в работе с pandas!