Benchmarking Supervised Learning Algorithms

📄 Read the full report (PDF)

Comparative analysis of four supervised learning algorithm families on two classification tasks, evaluating Decision Trees, k-Nearest Neighbors, Support Vector Machines, and Neural Networks (scikit-learn and PyTorch).

Datasets

Dataset	Samples	Features	Task	Metric
Adult Income	45,222	14 (→104 after encoding)	Binary classification	F1 Score
Wine Quality	6,497	13	8-class classification	Macro-F1

Results Summary

Algorithm	Adult F1	Wine Macro-F1
Decision Tree	0.670	0.432
k-Nearest Neighbors	0.642	0.455
SVM (best kernel)	0.654	0.467
Neural Network (sklearn)	0.681	0.285
Neural Network (PyTorch)	0.673	0.309

Key Findings

Neural networks achieve the highest F1 on Adult (0.681), but the margin over simpler models is small — confirming that the high-dimensional one-hot encoded space is approximately linearly separable.
SVM (RBF) wins on Wine (Macro-F1 = 0.467), where non-linear decision boundaries are critical for separating overlapping quality classes.
kNN surprises on Wine (0.455) due to the low-dimensional continuous feature space, but fails on Adult due to the curse of dimensionality.
SGD-only neural networks struggle on small, imbalanced data (Wine), demonstrating the importance of adaptive optimizers for practical deep learning.

Project Structure

├── report/
│   ├── main.tex          # Full LaTeX report
│   ├── main.pdf          # Compiled report
│   └── figures/          # All learning curves, confusion matrices, etc.
├── notebooks/
│   └── analysis.ipynb    # Complete analysis notebook
├── data/
│   ├── adult.csv
│   └── wine.csv
└── requirements.txt

Tech Stack

Python, PyTorch, scikit-learn, Optuna, Pandas, NumPy, Matplotlib, Seaborn

Running

pip install -r requirements.txt
jupyter notebook notebooks/analysis.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
notebooks		notebooks
report		report
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Benchmarking Supervised Learning Algorithms

Datasets

Results Summary

Key Findings

Project Structure

Tech Stack

Running

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Benchmarking Supervised Learning Algorithms

Datasets

Results Summary

Key Findings

Project Structure

Tech Stack

Running

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages