ETL (Extract-Transform-Load)

«ETL является одновременно и простым и сложным предметом. Почти все понимают основную миссию системы ETL: "extract" - получить данные из источника и "load" - загрузить их в хранилище данных. Более, большинство экспертов начинают понимать необходимость по пути еще очищать и преобразовывать данные – "transform". Все это на первый взгляд. Но в жизни оказывается, что следующий же шаг в проектировании системы ETL распадается на тысячи подслучаев (subcase), зависящих от ваших причудливых источников данных, правил бизнеса, имеющегося в наличии программного обеспечения и необычного применения отчетности.

Настоящие испытания и вызов для всех нас заключаются в том, чтобы реализовать все тысячи подслучаев (subcases), но не потерять из виду общую миссию ETL системы...»

Ralph Kimball, Joe Caserta; «The Data Warehouse ETL Toolkit»

Этот раздел посвящен вопросам, связанным с такой одновременно простой и сложной темой как ETL: что такое ETL, проектирование ETL, организация, проблемам и их решению.

Статьи раздела «ETL (Extract-Transform-Load)»

Проектирование процессов перегрузок данных (часть 1-ая) - Автор Сергей Коломиец

Проектирование процессов перегрузок данных (часть 2-ая) - Автор Сергей Коломиец.