Sobes.tech
Назад к вопросам
Middle
24

Как Pandas обрабатывает пропущенные данные?

Компании, где спрашивали
FOM GROUP

Ответ от нейросети

sobes.tech AI

В Pandas пропущенные данные обычно представлены значением NaN (Not a Number). Pandas предоставляет несколько способов обработки таких данных:

  • isna() или isnull() — для обнаружения пропущенных значений.
  • dropna() — удаление строк или столбцов с пропущенными значениями.
  • fillna() — заполнение пропущенных значений заданным значением или стратегией (например, средним, медианой).

Пример:

import pandas as pd
import numpy as np

df = pd.DataFrame({
    'A': [1, 2, np.nan, 4],
    'B': [5, np.nan, np.nan, 8]
})

# Найти пропущенные значения
print(df.isna())

# Заполнить пропуски нулями
filled_df = df.fillna(0)

# Удалить строки с пропусками
clean_df = df.dropna()

Таким образом, Pandas предоставляет гибкие инструменты для обнаружения и обработки пропущенных данных в таблицах.