Hallo, ich bin Sakib

Data Science Masterstudent an der TU Dortmund

Datenenthusiast mit einem Hintergrund in Informatik und Ingenieurwesen, spezialisiert auf NLP und KI.

Kontaktieren Sie mich

Über mich

Meine Einführung

Data-Science-Masterstudent mit einem Hintergrund in Informatik, leidenschaftlich daran interessiert, durch KI und maschinelles Lernen wertvolle Erkenntnisse zu gewinnen. Kürzlich habe ich ein Masterseminar an der TU Dortmund abgeschlossen über den Einsatz von Transformermodellen zur Erkennung von Depressionen und Verhaltensanalysen in sozialen Medien (Note: 2.0). Meine Bachelorarbeit konzentrierte sich auf Echtzeit-Sprachübersetzung von Bengalisch ins Englische und erreichte dabei einen BLEU-Score von 48,98 (Note: 1,3). Als ehemaliger wissenschaftlicher Mitarbeiter bei der Economic Research Group (ERG) arbeitete ich an Datenanalysen und entwickelte prädiktive Modelle. Dabei entdeckte ich mein Interesse an Daten, NLP, KI und Textanalyse – und vertiefe nun mein Wissen in Statistik und Datenanalyse weiter.

9 Datenprojekte
abgeschlossen
2 Artikel
geschrieben
2 Laufende
Projekte

Skills

My Technical Level

Development

All About the Core

Python

90%

SQL

85%

MS Excel

70%

JavaScript

60%

R

50%

Android

40%

Frameworks

Jeder braucht Unterstützung

NumPy

90%

pandas

90%

scikit-learn

85%

Pytorch

85%

streamlit

80%

matplotlib

70%

seaborn

70%

OpenCV

65%

NLTK

60%

Flask

50%

Machine Learning

Theorie, Theorie!

Ensemble Models

90%

Exploratory Data Analysis

90%

Natural Language Processing

85%

Linear and Logistic Regression

80%

Decision Trees

80%

Convolutional Neural Networks

80%

Recommender Systems

75%

Clustering

65%

Graph Neural Networks

60%

Multi-modal Learning

60%

Time Series

20%

Cloud and Engineering

Flieg schnell und hoch!

Docker

60%

AWS EC2

50%

AWS ECR

50%

Azure

40%

Databases and Viz

Wow! Faktor

MySQL

85%

Tableau

50%

Power BI

50%

Qualifikation

Meine persönliche Reise
Ausbildung
Berufserfahrung

Master of Science in Data Science

Technische Universität Dortmund, Dortmund, Deutschland
2023-2026

Exchange - Data Science (laufend)

Ruhr-Universität Bochum, Bochum, Deutschland
2025

B.Sc. in Informatik und Ingenieurwesen

North South University, Dhaka, Bangladesch
2017-2021

Höhere Sekundarschule in Wissenschaft

Chattogram, Bangladesch
2014-2016

Wissenschaftlicher Mitarbeiter

Economic Research Group
Sep 2021 - Mär 2022
Was ich hier gemacht habe

  • Durchführung umfassender Datenanalysen mit Python zur Unterstützung von wirtschaftswissenschaftlichen Forschungsprojekten.

  • Verwendung von MLflow zur Entwicklung einer End-to-End-Vorhersagemodell-Suite, die die Prognosegenauigkeit um 15 % verbesserte.

  • Leitung der Implementierung von ML-Workflows, wodurch die Bearbeitungszeit für politische Handlungsempfehlungen um 2 Tage verkürzt wurde.

Wissenschaftlicher Mitarbeiter

North South University
Mai 2021 - Mär 2022
Was ich hier gemacht habe

  • Co-Entwicklung eines Echtzeit-Sprachübersetzungssystems mit einem BLEU-Score von 48,98 unter Verwendung der Transformer-Architektur.

  • Durchführung der Datenvorverarbeitung, Modelltraining und Hyperparameter-Optimierung für ein NLP-System.

Portfolio

Meine Projekte

Bayesian Approach For Smoking Prediction

Bayesianische Datenanalyse

  • Vorhersage des Rauchverhaltens auf Basis individueller Faktoren (Alter, Geschlecht, Einkommen) und regionaler Unterschiede.

  • Alter korrelierte negativ mit dem Rauchen – jüngere Personen neigten eher zum Rauchen.

  • Einkommen zeigte einen nichtlinearen Trend – sowohl in den höchsten als auch niedrigsten Einkommensgruppen war die Raucherquote hoch. Bildung spielte eine Rolle – der Einfluss variierte jedoch stark je nach Region.

  • Tech Stack


    Verwendete Forschungsarbeiten

    Code ansehen Bericht ansehen

    Pneumonia Detection Classification with MLFLOW DVC and CI/CD

    🧠 MLOps (Machine Learning Operations)

  • Implementierung von CI/CD-Workflows zur Automatisierung von Modellverfolgung, Versionierung und Deployment auf AWS unter Nutzung von EC2 und ECR.

  • Tech Stack


    Code ansehen

    Kidney Diseases Classification MLFLOW DVC

    Computer Vision

  • Nutzung von CI/CD-Workflows zur Automatisierung der Modellverfolgung, Versionierung und Bereitstellung auf AWS mit EC2 und ECR.

  • Manuelle Eingriffe um 40 % reduziert durch Integration von Docker und selbstgehosteten Runnern für kontinuierliche Bereitstellung. Effizienz des Experiment-Trackings um 25 % gesteigert durch Einsatz von MLFLOW zur Protokollierung und Verwaltung von Modell-Metadaten.

  • Tech Stack


    Code ansehen

    End To End Resume ATS Tracking LLM Project With Google Gemini Pro

    Natural Language Processing (NLP)

  • Entwicklung und Implementierung eines vollständigen ATS-Scansystems für Lebensläufe unter Einsatz von LLMs, inkl. Google Gemini Pro. Optimierte Verfolgung und Filterung zur Verbesserung der Genauigkeit und Effizienz im Bewerbungsprozess.

  • Online bereitgestellt über Streamlit

  • Tech Stack

    Code ansehen

    HR-Analyse

    Data Science

  • Erstellung eines Dashboards in Power BI zur Analyse von Anwesenheitsdaten über drei Monate für die Personalabteilung von AtliQ.

  • Mit einer Genauigkeit von etwa 94,04 % im April übertrifft AtliQ die anderen drei Monate.

  • Etwa 93,21 % der Montage sind die aktivsten Tage bei AtliQ, was sie ideal für wöchentliche Meetings macht.

  • Tech Stack

    Code ansehen

    Messenger Chat Analyser

    Explorative Datenanalyse & NLP

  • Die Grundlage dieser App basiert auf grundlegender Datenanalyse, wie der Ermittlung der Uhrzeiten, zu denen Nachrichten gesendet wurden, oder der Anzahl der monatlich gesendeten Nachrichten.

  • Implementierung einer Sentiment-Analyse.

  • Tech Stack

    Code ansehen

    Speech Recognition with python and Goolgle cloud api

    Natural Language Processing

  • Spracherkennung von bengalischer Audioeingabe zu Text.

  • Teil des Abschlussprojekts an der North South University.

  • Verbesserte die Leistung der Anwendung durch den Einsatz der Transformer-Architektur als Maschinelles Übersetzungsmodell (BLEU 48.98), das eine Echtzeitübersetzung ermöglicht.

  • Tech Stack

    Verwendete Forschungsarbeiten

    Code ansehen

    COVID-19 Spread Forcasting in Bangladesh on weekly and monthly basis.

    Datenwissenschaft (Maschinelles Lernen – Zeitreihenprognose)

  • Prophet ist ein Verfahren zur Vorhersage von Zeitreihendaten basierend auf einem additiven Modell, bei dem nichtlineare Trends mit jährlicher, wöchentlicher und täglicher Saisonalität sowie Feiertagseffekten modelliert werden.

  • Prophet-Publikation: Sean J. Taylor, Benjamin Letham (2018) „Forecasting at scale“. The American Statistician 72(1):37-45 hier verfügbar

  • Tech Stack

    Code ansehen

    Portfolio-App

    Android-Entwicklung

  • Entwickelte eine Android-Anwendung, die als persönliches Portfolio dient.

  • Ein Spaßprojekt, um meine Fähigkeiten weiterzuentwickeln.

  • Tech Stack

    Code ansehen

    Zertifikate

    Zusätzliche Kurse, die ich absolviert habe

    C# Fundamentals for absolute beginners

    Expiry Date: Does not expire

    Zertifikate

    Create Your First Web App with Python and Flask

    Expiry Date: Does not expire

    Zertifikate

    Natural Language Processing with Attention Models

    Expiry Date: Does not expire

    Zertifikate

    Improving Deep Neural Networks: Hyperparameter Tuning, Regularization and Optimization

    Expiry Date: Does not expire

    Zertifikate

    Neural Networks and Deep Learning

    Expiry Date: Does not expire

    Zertifikate

    Structuring Machine Learning Projects

    Expiry Date: Does not expire

    Zertifikate

    Artificial Intelligence

    Expiry Date: Does not expire

    Zertifikate

    Blog

    Meine technischen Artikel

    Can a Bayesian Model Predict Who Smokes?

    Using Probabilistic Thinking to Decode Health Behaviors.

    Smoking remains a significant global public health problem, and more insight into the demographic and socioeconomic determinants that influence smoking status is required to design effective, targeted interventions.

    Lesen Sie es!

    Can AI Decode Silent Cries for Help? Transformers vs. Machine Learning in the Race to Detect Depression

    🌐”I don’t want to live anymore.”
    🌐 ”I’ve been feeling empty for weeks.”
    🌐 ”Why does everything hurt?”
    These aren’t just social media posts — they’re digital SOS signals from 280 million people battling depression worldwide. As suicide claims 700,000 lives annually, researchers are deploying AI as a linguistic lifeguard. But which approach dives deeper: transformer models or traditional machine learning? Let’s dissect two groundbreaking studies reshaping mental health tech.

    Lesen Sie es!

    A Concept of DVC and MLFLOW

    Kommt gleich!

    Lesen Sie es!

    Kontaktiere mich

    Nimm Kontakt auf

    Ruf mich an

    +49 176 634877 67

    Standort

    Dortmund, Deutschland