Проект был разработан командой из 3 человек в рамках хакатона Nuclear-IT-Hack
Проект по классификации тканей мозга (control / endo / exo) по Рамановским спектрам в двух диапазонах:
- 1500 (белки, амиды и др.)
- 2900 (липиды, CH-растяжения)
Модель определяет класс каждого пикселя спектрального изображения, а затем выдаёт наиболее вероятный диагноз для всего среза (по большинству голосов пикселей).
predict.py - Основной скрипт для предсказания на новых данных
Model_Training.ipynb - Обработка, обучение, валидация, feature importance
model_1500.pkl - Обученная модель LightGBM для спектра 1500
model_2900.pkl - Обученная модель LightGBM для спектра 2900
cols_1500.pkl - Список длин волн (столбцов), на которые интерполируются спектры 1500
cols_2900.pkl - Список длин волн для диапазона 2900
ML_Raman_Diagnosis_HSP70.pdf - Статья, отчет по работе
-
Положите обученные модели и списки колонок в ту же папку, где будет
predict.py -
Запустите скрипт одним из способов:
# Способ 1 — через аргумент командной строки
python predict.py "путь/к/файлу.txt(.csv)"
# Способ 2 — без аргументов и он попросит ввести путь
python predict.py