ETL и ELT: разница в том, как…

Содержание

Подробное описание процесса elt
Ul and etl certification marks: what’s the difference?
Временная метка. немного трюков
Данные из xlsx-файла
Для чего нужны сертификаты ul?
Сравнение etl и elt

Подробное описание процесса elt

Что такое ELT?

ELT означает «Извлечь, загрузить и преобразовать». В этом процессе данные для основных преобразований используются через хранилище данных. Это означает, что нет необходимости в промежуточном размещении данных. Для всех типов данных, включая структурированные, неструктурированные, полуструктурированные и даже необработанные данные ELT использует облачные решения для их хранения.

Процесс ELT также работает рука об руку с озерами данных. «Озера данных» – это особые виды хранилищ данных, которые, в отличие от хранилищ OLAP, принимают любые структурированные или неструктурированные данные. Озера данных не требуют преобразования данных перед их загрузкой.

Перед анализом данных с помощью платформы бизнес-аналитики все еще необходимо преобразование данных. Однако очистка, обогащение и преобразование данных происходят после загрузки данных в озеро данных. Вот некоторые подробности о работе ELT и озерах данных для общего понимания процесса:

Новая технология, ставшая возможной благодаря высокоскоростным облачным серверам: ELT – это относительно новая технология, ставшая возможной благодаря современным облачным серверным технологиям. Облачные хранилища данных предлагают практически безграничные возможности хранения и масштабируемую вычислительную мощность. Например, такие платформы, как Amazon Redshift и Google BigQuery, делают возможными конвейеры ELT благодаря своим невероятным возможностям обработки.
Принимайте данные, как только они становятся доступными: ELT в сочетании с озером данных позволяет сразу же принимать постоянно расширяющийся пул необработанных данных, как только они становятся доступными. Нет необходимости преобразовывать данные в специальный формат перед их сохранением в озере данных.
Преобразует только те данные, которые вам нужны: ELT преобразует только данные, необходимые вам для конкретного анализа. Хотя оно может замедлить процесс анализа, озеро данных предлагает вам большую гибкость, потому что вы можете преобразовывать данные разными способами на лету и так создавать различные типы метрик, прогнозов и отчетов. И наоборот, с ETL весь конвейер ETL, и структура данных в хранилище OLAP, может потребовать модификации, если ранее принятая структура не позволяет проводить новый тип анализа.
ELT менее надежен, чем ETL: важно отметить, что инструменты и системы ELT все еще развиваются, поэтому они не так надежны, как ETL в сочетании с базой данных OLAP. Хотя для настройки требуется больше усилий, ETL обеспечивает более точную информацию при работе с огромными пулами данных. Кроме того, разработчиков ELT, которые знают, как использовать технологию ELT, труднее найти, чем разработчиков ETL.

Самые значительные преимущества ELT

Основное преимущество ELT перед ETL связано с гибкостью и простотой хранения новых неструктурированных данных. С помощью ELT вы можете хранить любой тип информации, даже если у вас нет времени или возможности сначала преобразовать и структурировать ее, обеспечивая немедленный доступ ко всей вашей информации, когда вы этого захотите.

Вот еще несколько преимуществ ELT:

ПРЕИМУЩЕСТВО №1: Высокая скорость

Когда дело доходит до доступности данных, ELT – более быстрый вариант. ELT позволяет всем данным немедленно поступать в систему, и оттуда пользователи могут определять точные данные, которые им необходимы для преобразования и анализа.

ПРЕИМУЩЕСТВО №2: низкие эксплуатационные расходы

С ELT пользователям, как правило, не нужно иметь план обслуживания с высокой степенью сложности. Поскольку ELT является облачным, он использует автоматизированные решения вместо того, чтобы полагаться на пользователя, инициирующего обновления вручную.

ПРЕИМУЩЕСТВО №3: Более быстрая загрузка

Поскольку этап преобразования не происходит до тех пор, пока данные не поступят в хранилище, это сокращает время, необходимое для загрузки данных в их финальное место хранения. Нет необходимости ждать, пока данные очистятся или иным образом будут изменены, и им нужно только один раз войти в целевую систему.

Лучшие способы использования ELT

Как указано в этой статье, обсуждение преимуществ ETL и ELT все еще продолжается. Итак, при каких обстоятельствах вы могли бы рассмотреть возможность использования ELT вместо ETL? Вот некоторые из возможных случаев:

СЛУЧАЙ ИСПОЛЬЗОВАНИЯ №1:

Компания с огромным объемом данных. ELT лучше всего работает с огромными объемами данных, как структурированных, так и неструктурированных. Если целевая система – облачная, вы, вероятно, сможете быстрее обрабатывать эти огромные объемы данных с помощью решений ELT.

СЛУЧАЙ ИСПОЛЬЗОВАНИЯ №2:

Организация, располагающая ресурсами для необходимой вычислительной мощности. При использовании ETL большая часть обработки происходит на этапе, пока данные еще находятся в конвейере, до того, как они попали в ваше хранилище. ELT выполняет действие после того, как данные поступили в озеро данных.

СЛУЧАЙ ИСПОЛЬЗОВАНИЯ №3:

Компания, которой нужны все данные в одном месте как можно скорее. Когда преобразования происходят в конце процесса, ELT отдает приоритет скорости передачи почти всему остальному, а это означает, что все данные, хорошие, плохие и другие, попадают в озеро данных для последующего преобразования.

Ul and etl certification marks: what’s the difference?

Third party testing and certification is one of the most important and expensive decisions you’ll make in the product development process. Certification marks — whether UL, ETL or some other entity — demonstrate that the testing facility has tested samples of the product and found that it met that entities’ requirements. The mark guarantees the safety of the product, but not its performance or quality.

Going after the certification can be challenging, and it will require you to focus on a few things that might remind you a lot of your college days:

Research
Money
Time Management
Documentation

Let’s take a deeper dive.

Research – It’s up to you to find out whether or not your product is required to actually have certification marks or whether the market “requires” it. Because of consumer expectation, it could be that your product won’t sell if a UL mark isn’t on it, whether it’s required or not. Or you might be pleasantly surprised to learn that spending thousands of dollars on a UL mark isn’t necessary at all. But do your homework and don’t make assumptions. Here’s a link to a list of products that require certification from Nationally Recognized Testing Laboratories (more on that below), and here’s a list of some products that ALWAYS require require testing and certification:

Electrical cables and mains powered equipment – These products must meet international electrical codes
Industrial components – These products must meet building codes, for example building materials are made to be water or mold resistant or to be able to bear a certain amount of weight. Some products are manufactured with flame retardant properties.
Any consumer goods that may present a safety risk.

Про сертификаты: Общий курс дрессировки собак: испытания, нормативы ОКД, описания.

Money – Getting your product certified is expensive. It will run into the thousands of dollars. It can also be an ongoing expense when you make changes to your product. Keep in mind: Any change to the design or material requires re-certification. Think carefully about design changes. Will the change significantly enhance the performance or life of the product? Have customers clamored for a change?

Time Management – Certifying your product will take time, sometimes (usually) it takes longer than you expect. It is possible to pay a fee to expedite the process, but that obviously adds to the product development cost. The best plan is to work with your manufacturer and the testing lab to develop a testing and production timeline that works for all parties.

Documentation – You need to keep up with all the paperwork that goes into getting and maintaining UL and other certification marks. Be as thorough and detailed as possible. If the lab requests a particular format, provide the information in that format. Don’t try to take shortcuts, you’ll only end up having to re-do it which slows down the process.

Which Third Party Lab Should You Choose?

CBM_PRESELECT_untoned-9135

There are two labs that are primarily used: Underwriters Laboratories (UL) and Electrical Testing Labs/Intertek (ETL). They’re both qualified by the Nationally Recognized Testing Laboratories (NRTL, which is OSHA certified). And if you’re developing a product that requires certification, you only want testing done at an NRTL.

In answer to the question what’s the difference between UL and ETL certification marks? The answer is, not much. UL pretty much wrote the industry standards, but you have options about which third-party testing lab you choose — it just has to be an NRTL facility.

In addition to UL and ETL, here’s a pretty exhaustive list of certification marks.

As for which certification your product needs? That depends on the answers to some basic questions:

Where are you making your product?
Who will be using your product?
How will your product be used?
Will your product be exposed to extreme temperatures, prolonged use or extreme environments during use?
Could someone be injured while using your product?
Does the marketplace expect your product to have a certification?
What are the industry standards?
What do your customers want?

Your contract manufacturer will ask these and many other questions to help you determine which certification mark your product needs. In fact, your contract manufacturer probably already knows whether your product does or doesn’t require a certification mark, and which one they would advise. This is where having an experienced and trustworthy contract manufacturing partner can make a world of difference.

Download-Free-Checklist-to-Address-Quality-Issues-with-Supplier

Временная метка. немного трюков

Начнем с временной метки. Временные показатели исполнения, естественно, будут зависеть от мощности машины. Поэтому приводимые показатели важны для сопоставительного анализа.

Воспользуемся базовыми функциями R, на сгенерированном датасете получаем примерно 130 секунд. Большинство аналитиков (неважно, на каком языке пишут) скажут, что это вполне нормальная ситуация, нет смысла хотеть бОльшего.

tic("straightforward as.POSIXct")
dt[, timestamp := as.POSIXct(paste(date, time), 
                                  format = "%Y%m%d %H%M%S")]
toc()

Но не будем на этом останавливаться. Вдруг данных будет немного больше (это же IoT по постановке задачи). 50М или 500М? Поменяем библиотеку с пониманием того, как она устроена внутри и как устроен POSIXct.

Получаем 3.5 секунды на нашем датасете.

tic("straightforward lubridate")
dt[, timestamp := lubridate::ymd_hms(paste(date, time))]
toc()

Останавливаемся? А почему, собственно, да? Можно попробовать другие библиотеки. Но мы пойдем другим способом. Так уже получается, что у нас есть весь загруженный датасет в память. Давайте пользоваться спецификой предметной области и спецификой преобразуемых данных.

Преобразование строки в дату — очень трудозатратная операция. Зачем прикидываться, что мы ничего не знаем о данных и делать эту операцию для каждой строки? Можно же сделать преобразование только для уникальных значений временных меток. Таковых оказывается на порядки меньше, сказывается специфика задачи.

> uniqueN(dt, by = c("date", "time")) # почти в 100 раз меньше!
[1] 53424
> uniqueN(dt, by = "date")
[1] 1113
> uniqueN(dt, by = "time")
[1] 48

Используем этот подход меняем библиотеку.Вариант через групповую обработку — получаем 2.9 сек.

tic("anytime")
# не забываем следить про таймзону
dt[, timestamp := anytime::anytime(stri_c(.BY[[1]], .BY[[2]], sep = " ")), 
   by = .(date, time)]
toc()

Для потоковых преобразований ограниченных подмножеств наилучшим подходом является предварительное создание словаря “входное значение — преобразованное значение”. Тогда вся трансформация будет сводится выборке из этого словаря. Вариант через слияние по ссылкам со словарем дает чуть лучший результат 1.3 сек:

tic("inverse dictionary")
time_dict <- unique(dt[, .(date, time)]) %>%
  .[, timestamp := anytime::anytime(stri_c(date, time, sep = " "))]

dt[time_dict, on = .(date, time), timestamp := i.timestamp]
toc()

Это все? Потенциально, если расщепить словари даты и времени, то можно сократить объем преобразований еще примерно в 10 раз (1113 48 против 53K). Таймзоны в исходных данных не наблюдаются, городов тоже, значит все условно можно считать в UTC.

В таком варианте получаем примерно 0.7 сек.

tic("split   anytime")
dt[, secs := {
  tm <- as.integer(.BY[[1]]);
  (tm %% 100L)   ((tm %/% 100L) %% 100L) * 60L   (tm %/% 10000L) * 3600L}, 
  by = time] %>%
  .[, timestamp := anytime::anytime(.BY[[1]])   secs, by = date]
toc()

Итого, путем краткого исследования исходной задачи и незначительных манипуляций получаем ускорение со 130 сек (которые многие аналитики сочли приемлемым) до 0.7 сек. (~ 180 раз) в базовом варианте, или с 3.5 сек до 0.7 сек (~ 5 раз) в варианте с lubridate. Можно, конечно, разбрасываться ресурсами, но если это делать на каждом шагу, то ресурсов и времени может легко не хватить.

Про сертификаты: Сертификат соответствия РОСС RU С-RU.НВ34.В.00033/19 | Стеклопакеты для наземного транспорта (кроме используемых для колесных транспортных средств).

Данные из xlsx-файла

Рассмотрим работу с petl на наборе результатов летних олимпиад по странам. Нам понадобится файл datasets/summer_olympics.xlsx, посмотрим на первые строки, пока не сохраняя таблицу в переменную.

etl.fromxlsx('datasets/summer_olympics.xlsx')

Видим, что данные загрузились без ошибок, однако заголовки столбцов не определились, потому что в начале файла есть лишняя пустая строка. Исправим это, используя функцию skip и поместим результат в переменную olympics

olympics = etl.fromxlsx('datasets/summer_olympics.xlsx').skip(1)

Теперь заголовки у столбцов корректные, однако не достаточно информативны, исправим это, задав заголовки вручную.

olympics2 = olympics.setheader(['country','games','gold','silver','bronze'])

Мы начали выстраивать цепочку преобразования таблицы, это удобно, так как можно просмотреть результат работы на каждом этапе. Иногда, наоборот, удобнее объединить цепочку сразу в одной команде. Например, совместим изменение заголовка с сортировкой по количеству золотых медалей.

olympics2 = olympics.setheader(['country','games','gold','silver','bronze']).sort('gold', reverse=True)

Теперь мы можем посчитать общее количество медалей и сохранить его в новом столбце, используя функцию addfield.

Мы также применим мощный инструмент Python – Анонимные функции. Анонимная функция (функция без имени) – это запись вида lambda x: <функция от x>. Читается как: “То, что было подано на вход этого выражения, будет положено в x, а результатом исполнения будет <функция от x>.

В PETL это часто применяется, чтобы выполнить быстрое преобразования значения какого-либо из полей. Например, если нужно все значения таблицы table в поле field умножить на два, это можно написать как table.convert(‘field’, lambda x : x * 2). В примере ниже функция применяется не к отдельным значениям, а к строке целиком.

olympics2.addfield('total', lambda row : row['gold']   row['silver']   row['bronze'])

Вместо того, чтобы получить суммы, мы просто склеили значения. Чтобы такого не происходило, будем преобразовывать формат данных в целочисленные. Выясним, какая страна смогла набрать наибольшее число медалей, отсортировав сразу таблицу по новому столбцу по убыванию, с помощью функции sort. Также используем символ , чтобы разбить команду на несколько строк для улучшения читаемости.

olympics3 = olympics2
    .addfield('total', lambda x: int(x['gold'])   int(x['silver'])   int(x['bronze']))
    .sort('total', reverse=True)

Видим, что в таблице есть сумма по всем странам, что нас не интересует в данной задаче. Можем выбрать из таблицы все строки, кроме строки со значением country == Totals. Воспользуемся функцией select.

Кроме того, дополнительно рассчитаем новый показатель – результативность страны, определив её как среднее число медалей за игру.

olympics4 = olympics3
    .select(lambda x: x.country != 'Totals')
    .addfield('effectiveness', lambda x: round(x['total'] / float(x['games']), 2))

Сохраним полученные результаты в новый xlsx-файл.

olympics4.toxlsx('olympics.xlsx')

Для чего нужны сертификаты ul?

В обзорах на некоторые дешевые приборы автоматизации таких как например «smart» розетка Orvibo WiWo smart socket или одна из последних Sonoff & Slampher WiFi и RF переключатель и выключатель света и активные участники форума упомянули, что гнездо WIWO S20 вряд ли будет совместимо с CE до 10А, так как в ней нет заземляющих контактов, и что Sonoff & Slampher, вероятно, не соответствует UL сертификации. Почему это важно? На рисунке ниже можете посмотреть подсказку. Догадались?

House_in_Fire

UL и CE сертификаты используются для уверенности в том, что устройство соответствует требованиям правил техники безопасности, а в некоторых случаях даже гораздо надёжнее пользоваться сертифицированной продукцией которая соответствует заявленной спецификации. И если вы думаете, что защищены, потому что вы имеете страховку дома, вполне вероятно,её(страховку) аннулируют, если эксперт найдёт не-совместимое с вашими розетками устройство на месте пожара.

И всё бы было просто если бы стандартов UL и CE не было так много. Что бы быть уверенными что вам не приёдет устройство с поддельным сертификатом( а такое вполне возможно) то спрашивайте у продавцов эти сертификаты, но вы должны знать какой соответствует именно вашему устройству, так как вам могу предъявить или прислать поддельный, напечатанный сертификат.

Недавно hoverboards опубликовали новость в США, что некоторые из их устройств не безопасны, а Amazon даже попросил клиентов выбрасывать опасные устройства hoverboards и пообещал вернуть деньги за них.

Hoverboard_explosion

The Verge написал о устройствах которые проигнорировали сертификаты

Amazon просто отправил уведомление всем продавцам “hoverboard” “С требованием предоставить документацию, подтверждающую их безопасность и соответствие стандартам: UN 38.3 (Батарея), UL 1642 (батарея), и UL 60950-1 (зарядное устройство).”

UN 38.3 это не UL, но UN стандарт для транспортировки литиевых батарей при подтверждении соответствия которому проводится 8 тестов. UL 1642, является специфичным стандартом для пользователей техникой сменный литиевых батарей содержащих до 5 граммов лития, в то время как Стандарт UL 60950-1 относится к «Информационным технологиям и оборудованию, в том числе и электрическому торговому оборудованию, с номинальным напряжением не превышающим 600 V «Эту информацию практически невозможно проверить покупателю, получается, что вопрос безопасности это вопрос прежде всего доверия к продавцу. Даже Amazon не может гарантировать соблюдение стандартов безопасности, хоть уже и предпринял некоторые шаги.

Что же касается цены сертификта для производителя? Я думаю порядка 5000$. Для крупных игроков рынка это не так много так что за них думаю не нужно переживать, а вот производители в нижнем ценовом сегменте ($5, $40, $20) могут «забивать» на сертификацию, так как подобное не является юридическим требованием. Другим вариантом может быть получение ими сертификата ETL что получается намного дешевле. Вот в чём заключаются различия между UL и ETL:

UL и ETL сертификаты получаются в одной и той же лаборатории (Nationally Recognized Testing Laboratories (NRTL)). NRTLs это места где проверяется и подтверждается безопасность электронной продукции посредством проведения испытаний и сертификации (особенно это касается устройств на 240V). UL разработан как формат тестирования и проводит испытания. ETL тесты просто используют стандарты UL . Для того, чтобы инспектор подписал необходимо разрешение установки EVSE, Национальный электрический кодекс требует что бы EVSE был в списке NRTL (в США, ETL или UL). ClipperCreek используют обе лаборатории; выбор которых зависит от того где компания предоставляет лучшие условия для проведения испытаний.

Про сертификаты: Настройка SSL для WSUS

Эти сертификаты безопасности очень важны для устройств с высокой мощностью, например электроприборам, и вы должны попросить продавца предоставить вам сертификаты безопасности перед покупкой таких устройств, но даже не соответствующее зарядное устройство для смартфона, которое не его родное, может вызвать проблему. Одну женщину ударило током когда она поставила на зарядку свой Айфон, но зарядное устройство было не оригинальное

Сравнение etl и elt

	ETL	ELT
Внедрение технологии и наличие инструментов и экспертов	ETL – это хорошо отлаженный процесс, который используется более 20 лет, и эксперты по ETL всегда под рукой.	ELT – это новая технология, поэтому может быть сложно найти экспертов, и разработать конвейер ELT тоже сложнее, по сравнению с конвейером ETL.
Доступность данных в системе	ETL преобразует и загружает только те данные, которые (по вашему мнению) будут необходимы при создании хранилища данных и процесса ETL. Следовательно, будет доступна только эта информация.	ELT может сразу загрузить все данные, а пользователи смогут позже определить, какие данные из них преобразовать и проанализировать.
Можно ли добавить вычисления?	Вычисления либо заменят существующие столбцы, либо вы можете добавить набор данных, чтобы передать результат вычислений в целевую систему данных.	ELT добавляет вычисляемые столбцы непосредственно в существующий набор данных.
Совместимы ли данные с озерами данных?	ETL не является популярным решением для озер данных. Оно преобразует данные для интеграции с системой структурированного реляционного хранилища данных.	ELT предлагает конвейер для озер данных для приема неструктурированных данных. Затем он по мере необходимости преобразует данные для анализа.
Соответствие	ETL может редактировать и удалять конфиденциальную информацию, прежде чем помещать ее в хранилище данных или облачный сервер. Это упрощает соблюдение стандартов GDPR, HIPAA и CCPA. Это также защищает данные от взлома и непреднамеренного воздействия.	ELT требует, чтобы вы загрузили данные перед редактированием/удалением конфиденциальной информации. Это может нарушить стандарты GDPR, HIPAA и CCPA. Конфиденциальная информация будет более уязвима для взлома и непреднамеренного раскрытия. Вы также можете нарушить некоторые стандарты соответствия, если облачный сервер находится в другой стране.
Размер данных и сложность преобразований	ETL лучше всего подходит для работы с небольшими наборами данных, требующими сложных преобразований.	ELT лучше всего подходит для работы с огромными объемами структурированных и неструктурированных данных.
Поддержка хранилищ данных	ETL работает с облачными и локальными хранилищами данных. Оно требует реляционного или структурированного формата данных.	ELT работает с облачными хранилищами данных для поддержки структурированных, неструктурированных, полуструктурированных и необработанных типов данных.
Требования к оборудованию	Облачные ETL-платформы не требуют специального оборудования. Наследованные локальные процессы ETL требуют обширных и дорогостоящих решений по оборудованию, но сегодня они не так популярны.	Процессы ELT основаны на облаке и не требуют специального оборудования.
Чем отличаются агрегаты?	Агрегация усложняется по мере увеличения размера набора данных.	Если у вас есть мощная облачная целевая система данных, вы можете быстро обрабатывать огромные объемы данных.
Сложность реализации	При создании конвейера ETL легко найти экспертов по ETL. Для облегчения этого процесса доступны высокоразвитые инструменты ETL.	Как новая технология, инструменты для реализации решения ELT все еще развиваются. Более того, бывает сложно найти экспертов с необходимыми знаниями и навыками ELT.
Требования к обслуживанию	Автоматизированные облачные решения ETL, не требуют значительного обслуживания. Однако локальное решение ETL, использующее физический сервер, потребует частого обслуживания.	ELT основан на облаке и, как правило, включает автоматизированные решения, поэтому требуется очень немного обслуживания.
Порядок извлечения, преобразования, загрузки	Преобразование данных происходит сразу после извлечения в промежуточной области. После преобразования данные загружаются в хранилище данных.	Данные извлекаются, а затем загружаются в целевую систему данных. Только после этого некоторые данные преобразуются «по мере необходимости» для аналитических целей.
Расходы	Облачные платформы SaaS ETL, которые выставляют счет по модели ценообразования с оплатой за сеанс, они предлагают гибкие планы, которые начинаются примерно от 100 долларов и затем увеличиваются в зависимости от требований использования. Между тем, локальное ETL-решение на уровне компании, такое как Informatica, может обойтись даже в 1 миллион долларов в год!	Платформы SaaS ELT на основе облачных вычислений, которые выставляют счет по модели ценообразования с оплатой за сеанс, предлагают гибкие планы, которые начинаются примерно с 100 долларов США, а затем постепенно растут. Ценовое преимущество ELT заключается в том, что вы можете загружать и сохранять свои данные без больших комиссий, а затем преобразовывать их по мере необходимости. Это может сэкономить вам деньги на первоначальных затратах, если вы просто хотите загрузить и сохранить информацию. Однако финансово ограниченные компании могут никогда не позволить себе вычислительную мощность, необходимую для получения всех преимуществ своего озера данных.
Процесс преобразования	Преобразования происходят в промежуточной области за пределами хранилища данных.	Преобразования происходят внутри самой системы данных, и промежуточной области не требуется.
Поддержка неструктурированных данных	ETL можно использовать для структурирования неструктурированных данных, но нельзя использовать для передачи неструктурированных данных в целевую систему.	ELT – это решение для загрузки неструктурированных данных в озеро данных и предоставления неструктурированных данных системам бизнес-аналитики.
Время ожидания для загрузки информации	Время загрузки ETL превышает ELT, потому что это многоступенчатый процесс: (1) загрузка данных в промежуточную область, (2) преобразования, (3) загрузка данных в хранилище данных. После загрузки данных анализ информации происходит быстрее, чем у ELT.	Загрузка данных происходит быстрее, потому что нет ожидания преобразований, и данные загружаются в целевую систему данных только один раз. Однако анализ информации происходит медленнее, чем ETL.
Время ожидания для выполнения преобразований	Преобразование данных изначально занимает больше времени, потому что каждый фрагмент данных перед загрузкой требует преобразования. Кроме того, по мере увеличения размера системы данных преобразования занимают больше времени. Однако после преобразования в систему анализ выполняется быстро и эффективно.	Поскольку преобразования происходят после загрузки по мере необходимости, а вы преобразовываете только данные, которые нужно анализировать в данный момент, преобразования происходят намного быстрее. Однако необходимость постоянного преобразования данных снижает общее время, необходимое для запросов/анализа.