Исследователи кафедры компьютерных систем представили доклад в рамках Республиканского научного семинара «Методы моделирования».
Доцент кафедры компьютерных систем Роман Классен и аспирант кафедры компьютерных систем Игорь Казанцев представили доклад на тему «Адаптация операций SELECT-PROJECT-JOIN для выполнения аналитических запросов к базам данных объемом 1 ТБ и более».
Базы данных объемом 1 ТБ и более уже не редкость, но вопрос их обработки стоит все так же остро. Многие организации используют кластерные системы для обработки накопленных данных. Процесс обработки может занимать от нескольких часов до нескольких дней на один запрос. Над ускорением обработки больших данных работает множество коллективов во всем мире. Они смогли создать множество систем как открытых (бесплатных), так и коммерческих.
К сожалению, в РФ нет отечественных систем такого класса.
В докладе рассматривается возможность обработки аналитических запросов на кластерной платформе к БД объемом 1 ТБ и более. Предлагаются методы адаптации операций SELECT-PROJECT-JOIN для работы с таким объемом данных в рамках системы Clusterix-New. Демонстрируется реализация простого бинарного хранилища данных, ставшим основой для собственного движка merge-join и модуля доступа к данным. Модуль доступа к данным строится на основе открытого ПО Calcite и позволяет выполнять простые SQL запросы вида SELECT-PROJECT. Приводятся результаты экспериментального исследования.
Следующий доклад Республиканского научного семинара «Методы моделирования» при КНИТУ-КАИ будет представлен 23 ноября в 15:00, ауд. 428 (7 здание КНИТУ-КАИ). Р.Р. Нигматуллин (КНИТУ-КАИ) и А.А. Хамзин (КФУ) выступят с лекцией «Обобщенный метод NAFASS: как подогнать дискретный апериодический сигнал под конечный набор гармонических составляющих?»
- Автор:
- Кафедра компьютерных систем