ViXtract
Удобный ETL инструмент с открытым исходным кодом на основе Python.
ViXtract – это сборка на основе популярных открытых инструментов обработки данных, которая помогает аналитикам BI самостоятельно выгружать, очищать и преобразовывать данные без помощи ETL разработчиков. Главные принципы ViXtract – удобство работы аналитика и неограниченные возможности развития. В основе ViXtract лежат три ключевых компонента: Jupyter – интерактивная среда для работы с Python, PETL – простая в освоении библиотека преобразования данных, и Cronicle – надежный планировщик с удобным интерфейсом.
ENG
Что вы можете сделать с ViXtract?
Любые файловые источники и СУБД, а также API. AmoCRM, Google Analytics, 1С – огромное количество готовых Python библиотек и примеров к вашим услугам.
Подключиться к любым источникам данных
Очищайте, объединяйте, обогащайте данные простыми командами, которые можно выполнять в произвольном порядке или соединять в пайплайны.
Интерактивно преобразовать данные
Подготовленные данные легко выгрузить в любой формат или напрямую в BI систему при наличии коннектора.
Выгружать данные в любую BI систему
Добавляйте задания в планировщик, настраивайте цепочки исполнения и уведомления об успешном/неуспешном выполнении, отслеживайте статистику использования серверных ресурсов.
Автоматизировать созданные задания ETL
Почему ViXtract?
Подобранное на основе опыта лучших специалистов в области ETL, BI, DWH и Data Science. Продуманная интеграция всех компонентов.
ЛУЧШЕЕ ИЗ МИРА OPEN-SOURCE
Установка осуществляется одной командой, а для использования нужен только веб-браузер. Из коробки поддерживается HTTPS и разграничение доступа пользователей.
ПРОСТАЯ УСТАНОВКА И НАСТРОЙКА
Постоянно пополняемая коллекция обучающих видеороликов и демо-примеров, а еще Telegram-чат сообщества, в котором можно получить помощь и совет.
СООБЩЕСТВО И ПОДДЕРЖКА
1
2
3
Начните изучение ViXtract с просмотра видеозаписи вебинара и прохождения уроков (tutorials) по системе
Каждый специалист в области анализа данных знает, что самое трудоемкое и сложное в этой работе – это выгрузка и преобразование данных, или ETL (Extract-Transform-Load). Есть множество инструментов, но все они имеют свои недостатки. Миссия сообщества ViXtract – в том, чтобы аналитики направляли силы именно на анализ данных, а рутинные технические задачи закрывал бы простой и понятный инструмент.

ViXtract был создан и развивается командой профессионалов в области ETL, BI, DWH и Data Science при поддержке ряда коммерческих компаний. На сегодняшний день это:

ViXtract – это открытый проект под лицензией BSD-3, он создан, чтобы приносить пользу сообществу специалистов по управлению на основе данных. Каждый желающий может внести свой вклад:

– Внести свои доработки проекта. На текущий момент наибольшая потребность заключается в написании автотестов и создании базы примеров интеграций с различными системами. Внести доработки можно, открыв Pull request на GitHub.

– Поделиться обратной связью: сообщением о найденном баге или идее улучшения, открыв Issue на GitHub

– Популяризировать ViXtract и сам подход к ETL на основе экосистемы Python. Поделитесь информацией в профильных сообществах!

С любыми идеями и вопросами вы можете обратиться к мэйнтейнерам проекта, заполнив форму ниже.

Maintainer
Contributor
С любыми идеями и вопросами вы можете обратиться к мейнтейнерам проекта, заполнив форму
Нажимая на кнопку «Отправить», я даю согласие на обработку своих персональных данных и соглашаюсь с политикой конфиденциальности.
НАЧНИТЕ ИСПОЛЬЗОВАТЬ ViXtract ПРЯМО СЕЙЧАС!
Вы можете зарегистрироваться, чтобы получить доступ к публичному демо-серверу.

ПОПРОБОВАТЬ В ОБЛАКЕ
Для использования требуется компьютер с Linux, желательно чистая установка Ubuntu 18.04 LTS.
СКАЧАТЬ НА
GITHUB
Рекомендуем начать работу с ViXtract с прохождения уроков (tutorials) по системе, а также с ознакомления с демо-примерами. Уроки и примеры доступны на демо-сервере сразу при регистрации, а для локальной установки их можно взять в папках docs/tutorials и docs/examples соответственно.