weise написал(а):
Не верю я в честную агрегацию на лету - Хана не умеет нарушать законы физики, более менее серьезный объем данных современные компьютеры не могут обработать онлайн. Да и зачем, когда можно прошлые периоды один раз рассчитать и постоянно использовать?
thebestsaper написал(а):
там вроде фишка, что данные в оперативной памяти и из-за этого быстро обрабатываются......правда непонятно как поместить такой объем.......короче, как говорится "will see"
Агрегация всегда ведется в разрезе того или иного измерения: дате, группе (клиентов, товаров) и т.д.
В результате агрегации мы теряем детальную аналитику. Если нам необходимо "развернуть" аналитику, это еще куда ни шло - кубик ну или запрос к базе и пошли курить, а вот если надо переагрегировать с учетом наложенных фильтров - это, фактически, пересчет куба.
HANA - это, в частности, поколоночное хранение данных, за счет чего достигается очень высокая скорость выборки данных (ну и агрегации в различных разрезах). На дисках данный вариант невозможен за счет низкой скорости вставки данных, поэтому все современные поколоночные СУБД - inmemory.
Насколько я понял, в HANA реализована гибридная модель - данные записываются и хранятся в реляционной СУБД, а оттуда выборочно реплицируются в аналитическую модель, которая как раз в памяти.
С Уважением,
Георгий