Back to questions
Junior — Middle
71
Какими инструментами для извлечения, трансформации и загрузки данных вы работали или знакомы?
Answer from AI
sobes.tech AI
Для ETL (извлечение, трансформация, загрузка) в Python часто используют следующие инструменты:
- Pandas — для обработки и трансформации данных в памяти.
- Airflow — для оркестрации и автоматизации ETL-процессов.
- Luigi — похожий инструмент для построения пайплайнов.
- Apache Spark (через PySpark) — для обработки больших объёмов данных.
- SQLAlchemy — для взаимодействия с базами данных.
Например, с помощью Pandas можно загрузить CSV, преобразовать данные и сохранить в базу:
import pandas as pd
df = pd.read_csv('data.csv')
df['new_column'] = df['old_column'] * 2
df.to_sql('table_name', con=engine, if_exists='replace')