Titanic - PyTorch MLP (Kaggle)

A reproducible PyTorch MLP pipeline for the Kaggle Titanic dataset.

This project demonstrates:

Modular feature engineering
Clean training loop separation
Ensemble inference
Reproducible submission generation

Project Structure

src/
- model.py # MLP architecture definition
- train.py # training loop (optimizer, loss, logging)
- features.py # feature engineering (fit / transform pipeline)
scripts/
- make_submission.py # production entry point
data/
- raw/
  - train.csv
  - test.csv
outputs/
- submission/
  - submission.csv
requirements.txt
README.md

Setup

Install dependencies:

pip install -r requirements.txt

Data

Download Titanic dataset from Kaggle: titanic
Place the files here: data/raw/train.csv data/raw/test.csv

Run Submission Pipeline

From project root: python scripts/make_submission.py
Output file: outputs/submissions/submission.csv

Feature Pipeline

Preprocessing is fitted on training data only.
All statistics (median, quantile bins, encoders) are stored as artifacts.
The same artifacts are reused for validation and test transformation.
This ensures: No data leakage Stable feature space Reproducible inference

Model

PyTorch MLP
Configurable depth
Dropout regularization
Adam optimizer
Ensemble across multiple random seeds

Reproducibility

Randomness is controlled via: Numpy seed PyTorch seed Deterministic train / validation split

Notes

The submission script is intentionally clean (no plotting or experiment logic).

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Titanic - PyTorch MLP (Kaggle)

Project Structure

Setup

Data

Run Submission Pipeline

Feature Pipeline

Model

Reproducibility

Notes

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
data		data
outputs		outputs
reports		reports
scripts		scripts
src		src
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Titanic - PyTorch MLP (Kaggle)

Project Structure

Setup

Data

Run Submission Pipeline

Feature Pipeline

Model

Reproducibility

Notes

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages