Platforma zarządzania danymi dla badań naukowych
Branża
Technologie
Kraj

O Kliencie
Centogene to firma biotechnologiczna specjalizująca się w diagnostyce genetycznej chorób rzadkich, odkrywaniu biomarkerów oraz wsparciu badań klinicznych. Oferuje testy genetyczne, identyfikuje i waliduje biomarkery oraz pomaga w rekrutacji pacjentów z rzadkimi chorobami genetycznymi do badań klinicznych. Platforma wspiera naukowców w zarządzaniu eksperymentami metabolomicznymi opartymi na spektrometrii masowej. System organizuje dane eksperymentalne w sposób hierarchiczny, wspiera procesy kontroli jakości oraz zawiera techniki przetwarzania danych, takie jak korekcja dryfu, mapowanie pików i analiza statystyczna, z myślą o odkrywaniu biomarkerów.
Potrzeby Klienta
Przejrzysta wizualizacja danych
Integracja kontroli jakości
Dedykowane algorytmy uczenia maszynowego
Narzędzia analizy statystycznej
Centogene potrzebowało systemu do wizualizacji, zarządzania i analizy danych metabolomicznych ze spektrometrii mas. Musiał obsługiwać złożone struktury danych eksperymentalnych, wspierać kontrolę jakości i prowadzić techniki przetwarzania danych potrzebne przy odkrywaniu biomarkerów.
Dostarczone Usługi
Pipeline przetwarzania danych: Implementacja algorytmów do korekcji dryfu, mapowania pików i normalizacji danych.
Integracja kontroli jakości: Możliwość śledzenia próbek QC i oznaczania anomalii w danych.
Dedykowane algorytmy ML: Opracowanie algorytmów do klasteryzacji i selekcji cech w danych metabolomicznych.
Narzędzia analizy statystycznej: Integracja narzędzi do obliczania współczynnika RSD, wskaźników wykrywalności i innych kluczowych metryk.
Zakres Prac
Zaprojektowaliśmy hierarchiczny model danych odwzorowujący struktury eksperymentów – serie, pomiary i próbki.
Wdrożyliśmy mechanizmy kontroli jakości umożliwiające śledzenie próbek QC i identyfikację anomalii w danych.
Opracowaliśmy algorytmy przetwarzania danych, w tym korekcję dryfu, mapowanie pików i normalizację.
Stworzyliśmy dedykowane algorytmy uczenia maszynowego do klasteryzacji i selekcji cech w danych metabolomicznych.
Zaimplementowaliśmy narzędzia analizy statystycznej umożliwiające obliczanie kluczowych metryk, takich jak RSD i wskaźniki wykrywalności.
Technologie
React: Użyty do budowy interfejsu użytkownika, zapewniając łatwą nawigację i wygodę pracy dla badaczy.
Python: Wykorzystany do opracowania algorytmów przetwarzania danych i backendu systemu.
PostgreSQL: Używana do przechowywania i zarządzania strukturalnymi danymi eksperymentalnymi.
Docker: Konteneryzacja aplikacji dla spójnego wdrażania w różnych środowiskach.
Redis: Wykorzystywany jako broker wiadomości do obsługi zadań w tle i cache’owania.
Współpraca
Projekt rozpoczął się od dogłębnej analizy wymagań Centogene w zakresie zarządzania danymi spektrometrii masowej. Zaprojektowaliśmy hierarchiczny model danych reprezentujący serie, pomiary i próbki. W trakcie rozwoju skupiliśmy się na integracji mechanizmów kontroli jakości, implementacji algorytmów przetwarzania danych oraz zapewnieniu bezpiecznego dostępu użytkowników za pomocą tokenów API. Opracowaliśmy także dedykowane algorytmy uczenia maszynowego wspierające proces odkrywania biomarkerów.
common.checkClutchWork