🧠 Data Science Projects Repository

This repository contains a collection of practical data science projects covering the complete machine learning workflow, including:

🧹 Data Cleaning
🧪 Data Preprocessing
📊 Data Visualization
🏗️ Model Building & Compilation
🏃 Model Training & Evaluation

These projects aim to help learners and practitioners understand each phase of working with data and machine learning models.

📁 Project Structure

1. 🧼 Data Cleaning Project

Objective:
Clean and standardize a raw dataset with missing values, duplicates, incorrect data types, and inconsistent formatting.

Techniques Used:

Handling missing data (mean, median, drop)
Removing duplicates
Converting data types
String formatting and trimming
Date and time conversion

Tools: pandas, numpy

📄 File: data_cleaning.py

2. ⚙️ Data Preprocessing Project

Objective:
Prepare clean data for machine learning algorithms by transforming features and labels.

Techniques Used:

Feature scaling (StandardScaler, MinMaxScaler)
Encoding categorical variables (OneHotEncoder, LabelEncoder)
Train-test split
Data balancing (optional: SMOTE)

Tools: pandas, scikit-learn, numpy

3. 📈 Data Visualization Project

Objective:
Understand the dataset using visual exploration techniques and identify patterns or anomalies.

Techniques Used:

Histograms, box plots, scatter plots
Correlation heatmaps
Pair plots
Class distribution graphs

Tools: matplotlib, seaborn, pandas

4. 🧠 Model Compilation & Training Project

Objective:
Build a machine learning or deep learning model, compile it with appropriate configurations, and train it on prepared data.

Steps Covered:

Defining a model (ML or DL)
Choosing loss function, optimizer, metrics
Model training with validation
Accuracy and loss plots

Tools: scikit-learn, keras / tensorflow, matplotlib

5. 🔍 Evaluation & Testing

Objective:
Evaluate model performance using appropriate metrics and visualize the results.

Evaluation Metrics:

Accuracy, precision, recall, F1-score
Confusion matrix
ROC-AUC (for classification)

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
Final_Project.ipynb		Final_Project.ipynb
MNIST_Classification.ipynb		MNIST_Classification.ipynb
README.md		README.md
Tensorflow.ipynb		Tensorflow.ipynb
data-cleaning-and-visualisation.ipynb		data-cleaning-and-visualisation.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🧠 Data Science Projects Repository

📁 Project Structure

1. 🧼 Data Cleaning Project

2. ⚙️ Data Preprocessing Project

3. 📈 Data Visualization Project

4. 🧠 Model Compilation & Training Project

5. 🔍 Evaluation & Testing

About

Uh oh!

Releases

Packages

Languages

WhereisHussain/Data-Science

Folders and files

Latest commit

History

Repository files navigation

🧠 Data Science Projects Repository

📁 Project Structure

1. 🧼 Data Cleaning Project

2. ⚙️ Data Preprocessing Project

3. 📈 Data Visualization Project

4. 🧠 Model Compilation & Training Project

5. 🔍 Evaluation & Testing

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages