Сервис дедупликации данных

Цель работы состоит в реализации системы оптимального хранения данных за счет использования подхода дедупликации данных и проведении тестирования для измерения производительности созданного прототипа.

Описание проекта

Данный проект выполнялся в рамках курсовой работы по дисциплине "Системы анализа больших данных". Основные работы над данной частью проекта производились с сентября по ноябрь 2024 года. Целью всего проекта является сбор и анализ метаданных статей с платформы

Основная страница с документацией

Документация doxygen

Стек технологий

C++ 20
PostgreSQL 15 сайт
libpqxx 7.9 GitHub
libglog GitHub
gtest/gmock 1.15.2 GitHub
FFF(Fake Function Framework) GitHub
libssl сайт
Асинхронный пул потоков из библиотеки Leopard GitHub
Qt6 Widgets сайт
Docker 27.1 сайт
Doxygen сайт

Описание провдимых мероприятий

Реализован механизм runtime преобразования PostgreSQL типов по значению OID(см. models.h);
Применён Model/View подход для визуализации данных;
Реализован набор workflow для сборки проекта, тестирования, временных измерений и равёртывания документации;
Были изучены особенности написания документации на базе Doxygen.
Применены подходы блочной вставки и потоковых запросов для ускорения вставки файла в БД.
Создан docker образ и workflow для сборки данного образа и отправки его в HUB.
Разработан потокобезпоасный шаблонный класс массива таймеров для сбора временных метрик.
Произведено smoke тестирование
полученной реализации таймера и сервисов работы с файлами;

Name		Name	Last commit message	Last commit date
Latest commit History 181 Commits
.github/workflows		.github/workflows
conf		conf
doc		doc
fff @ 5111c61		fff @ 5111c61
include		include
lib		lib
resources/styleshhets		resources/styleshhets
src		src
test		test
.gitignore		.gitignore
.gitmodules		.gitmodules
CMakeLists.txt		CMakeLists.txt
Dockerfile		Dockerfile
LICENCE		LICENCE
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Сервис дедупликации данных

Описание проекта

Стек технологий

Описание провдимых мероприятий

Задачи

About

Uh oh!

Releases 1

Packages

Uh oh!

Languages

License

AlexanderMeynik/data_deduplication_service

Folders and files

Latest commit

History

Repository files navigation

Сервис дедупликации данных

Описание проекта

Стек технологий

Описание провдимых мероприятий

Задачи

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Languages

Packages