Platforma zarządzania danymi dla badań naukowych

Branża

Biotechnologia i opieka zdrowotna

Technologie

reactpythonpostgresqldockerredis

Kraj

Niemcy

O Kliencie

Centogene to firma biotechnologiczna specjalizująca się w diagnostyce genetycznej chorób rzadkich, odkrywaniu biomarkerów oraz wsparciu badań klinicznych. Oferuje testy genetyczne, identyfikuje i waliduje biomarkery oraz pomaga w rekrutacji pacjentów z rzadkimi chorobami genetycznymi do badań klinicznych. Platforma wspiera naukowców w zarządzaniu eksperymentami metabolomicznymi opartymi na spektrometrii masowej. System organizuje dane eksperymentalne w sposób hierarchiczny, wspiera procesy kontroli jakości oraz zawiera techniki przetwarzania danych, takie jak korekcja dryfu, mapowanie pików i analiza statystyczna, z myślą o odkrywaniu biomarkerów.

Potrzeby Klienta

Przejrzysta wizualizacja danych

Przejrzysta wizualizacja danych

Integracja kontroli jakości

Integracja kontroli jakości

Dedykowane algorytmy uczenia maszynowego

Dedykowane algorytmy uczenia maszynowego

Narzędzia analizy statystycznej

Narzędzia analizy statystycznej

Centogene potrzebowało systemu do wizualizacji, zarządzania i analizy danych metabolomicznych ze spektrometrii mas. Musiał obsługiwać złożone struktury danych eksperymentalnych, wspierać kontrolę jakości i prowadzić techniki przetwarzania danych potrzebne przy odkrywaniu biomarkerów.

Dostarczone Usługi

Pipeline przetwarzania danych: Implementacja algorytmów do korekcji dryfu, mapowania pików i normalizacji danych.

Integracja kontroli jakości: Możliwość śledzenia próbek QC i oznaczania anomalii w danych.

Dedykowane algorytmy ML: Opracowanie algorytmów do klasteryzacji i selekcji cech w danych metabolomicznych.

Narzędzia analizy statystycznej: Integracja narzędzi do obliczania współczynnika RSD, wskaźników wykrywalności i innych kluczowych metryk.

Zakres Prac

  1. Zaprojektowaliśmy hierarchiczny model danych odwzorowujący struktury eksperymentów – serie, pomiary i próbki.

  2. Wdrożyliśmy mechanizmy kontroli jakości umożliwiające śledzenie próbek QC i identyfikację anomalii w danych.

  3. Opracowaliśmy algorytmy przetwarzania danych, w tym korekcję dryfu, mapowanie pików i normalizację.

  4. Stworzyliśmy dedykowane algorytmy uczenia maszynowego do klasteryzacji i selekcji cech w danych metabolomicznych.

  5. Zaimplementowaliśmy narzędzia analizy statystycznej umożliwiające obliczanie kluczowych metryk, takich jak RSD i wskaźniki wykrywalności.

Technologie

React: Użyty do budowy interfejsu użytkownika, zapewniając łatwą nawigację i wygodę pracy dla badaczy.

Python: Wykorzystany do opracowania algorytmów przetwarzania danych i backendu systemu.

PostgreSQL: Używana do przechowywania i zarządzania strukturalnymi danymi eksperymentalnymi.

Docker: Konteneryzacja aplikacji dla spójnego wdrażania w różnych środowiskach.

Redis: Wykorzystywany jako broker wiadomości do obsługi zadań w tle i cache’owania.

Współpraca

Projekt rozpoczął się od dogłębnej analizy wymagań Centogene w zakresie zarządzania danymi spektrometrii masowej. Zaprojektowaliśmy hierarchiczny model danych reprezentujący serie, pomiary i próbki. W trakcie rozwoju skupiliśmy się na integracji mechanizmów kontroli jakości, implementacji algorytmów przetwarzania danych oraz zapewnieniu bezpiecznego dostępu użytkowników za pomocą tokenów API. Opracowaliśmy także dedykowane algorytmy uczenia maszynowego wspierające proces odkrywania biomarkerów.

common.checkClutchWork