Skip to content

igor688-hub/Nuclear-IT_Hack

Repository files navigation

Проект был разработан командой из 3 человек в рамках хакатона Nuclear-IT-Hack

Проект по классификации тканей мозга (control / endo / exo) по Рамановским спектрам в двух диапазонах:

  • 1500 (белки, амиды и др.)
  • 2900 (липиды, CH-растяжения)

Модель определяет класс каждого пикселя спектрального изображения, а затем выдаёт наиболее вероятный диагноз для всего среза (по большинству голосов пикселей).

Основные файлы в репозитории

predict.py - Основной скрипт для предсказания на новых данных
Model_Training.ipynb - Обработка, обучение, валидация, feature importance
model_1500.pkl - Обученная модель LightGBM для спектра 1500
model_2900.pkl - Обученная модель LightGBM для спектра 2900
cols_1500.pkl - Список длин волн (столбцов), на которые интерполируются спектры 1500
cols_2900.pkl - Список длин волн для диапазона 2900
ML_Raman_Diagnosis_HSP70.pdf - Статья, отчет по работе

Как запустить предсказание на новом файле

  1. Положите обученные модели и списки колонок в ту же папку, где будет predict.py

  2. Запустите скрипт одним из способов:

# Способ 1 — через аргумент командной строки
python predict.py "путь/к/файлу.txt(.csv)"

# Способ 2 — без аргументов и он попросит ввести путь
python predict.py

About

Machine learning for Raman spectra analysis of brain tissue with robust preprocessing, classification, and interpretable biomarker discovery

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors