Назад к вопросам
Middle
24
Как Pandas обрабатывает пропущенные данные?
Компании, где спрашивали
FOM GROUP
Ответ от нейросети
sobes.tech AI
В Pandas пропущенные данные обычно представлены значением NaN (Not a Number). Pandas предоставляет несколько способов обработки таких данных:
isna()илиisnull()— для обнаружения пропущенных значений.dropna()— удаление строк или столбцов с пропущенными значениями.fillna()— заполнение пропущенных значений заданным значением или стратегией (например, средним, медианой).
Пример:
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8]
})
# Найти пропущенные значения
print(df.isna())
# Заполнить пропуски нулями
filled_df = df.fillna(0)
# Удалить строки с пропусками
clean_df = df.dropna()
Таким образом, Pandas предоставляет гибкие инструменты для обнаружения и обработки пропущенных данных в таблицах.