Medical OCR Service

Flask-basierter Dokumenten-Import-Service mit OCR und KI-gestützter Metadaten-Extraktion. Verarbeitet medizinische Dokumente (PDF, Bilder, DOCX) per Tesseract OCR, extrahiert Metadaten via LLM (Ollama) und reiht die Ergebnisse in eine Medidok-kompatible Import-Warteschlange ein.

Features

OCR – Texterkennung für PDF und Bilddateien (optimiert für deutsche Dokumente)
LLM-Extraktion – Automatische Metadaten-Erkennung (Patient, Absender, Datum, Fachrichtung) via Ollama
Staging-System – Sichere Dateibearbeitung mit Commit/Rollback vor dem endgültigen Import
Import-Queue – Sequenzielle Warteschlange für externe Import-Dienste (Medidok)
PDF-Bearbeitung – Kombinieren, Splitten und Rotieren von PDFs
DOCX-Support – Automatische Konvertierung und Verarbeitung von Word-Dokumenten
Live-Logging – Echtzeit-Status via Server-Sent Events (SSE)
Dark Theme – Modernes, dunkles UI-Design

Architektur

Browser ──► Flask (Port 5000) ──► Tesseract OCR ──► LLM (Ollama)
                │                                        │
                ▼                                        ▼
         Staging-System ──► Import-Queue ──► Medidok-Verzeichnis

Stack

Komponente	Technologie
Backend	Python 3.12 / Flask 3.1
OCR	Tesseract (via Subprocess)
LLM	Ollama (z.B. `qwen2.5:14b`)
PDF-Handling	PyMuPDF, img2pdf, WeasyPrint
DOCX	python-docx
Deployment	Docker + Docker Compose

Voraussetzungen

Docker und Docker Compose
Ollama auf dem Host-System (oder erreichbar via Netzwerk) mit einem kompatiblen Modell
SMB/CIFS-Netzlaufwerk (optional, für Medidok-Integration)

Installation

1. Repository klonen

git clone https://github.com/kilroy-fr/ocr-service.git
cd ocr-service

2. Umgebungsvariablen konfigurieren

cp .env.example .env

Die .env-Datei anpassen:

# SMB/CIFS-Netzlaufwerk (Pfad zum Medidok-Share)
SMB_SHARE=//server/Medidok
SMB_USERNAME=dein_username
SMB_PASSWORD=dein_passwort

# Flask Secret Key (zufälligen Wert verwenden!)
SECRET_KEY=ein-sicherer-zufaelliger-schluessel

# Startseiten-URL
HOME_URL=http://localhost:5000

# Zeitzone
TZ=Europe/Berlin

3. Ollama vorbereiten

Auf dem Host-System Ollama installieren und das Modell herunterladen:

# Ollama installieren: https://ollama.com
ollama pull qwen2.5:14b

4. Docker-Container starten

docker compose up --build -d

Der Service ist danach unter http://localhost:5000 erreichbar.

Verwendung

Web-Oberfläche

Dateien auswählen – Dokumente vom Netzlaufwerk laden oder per Upload hochladen
OCR starten – Texterkennung und LLM-Analyse werden automatisch durchgeführt
Metadaten prüfen – Extrahierte Daten (Patient, Datum, Absender) kontrollieren und korrigieren
Commit/Ablehnen – Geprüfte Dokumente in die Import-Queue einreihen oder verwerfen

Verzeichnisstruktur (Container)

Verzeichnis	Beschreibung
`/app/medidok/`	Quelldateien vom Netzlaufwerk
`/app/medidok/staging/`	Session-Arbeitsverzeichnisse
`/app/medidok/output/`	Zwischenlager nach Commit, vor Import
`/app/medidok/import/`	Import-Warteschlange für externen Dienst
`/app/medidok/trash/`	Papierkorb für verworfene Dateien
`/app/medidok/errors/`	Fehlerfälle bei der Verarbeitung
`/app/uploads/`	Temporäre Uploads

Konfiguration

LLM-Modell

Das Standard-Modell und die Ollama-URL werden in config.py konfiguriert:

MODEL_LLM1  = "qwen2.5:14b"
OLLAMA_URL  = "http://host.docker.internal:11434/api/generate"

Im Docker-Setup verbindet sich der Container über host.docker.internal mit der Ollama-Instanz auf dem Host. Für andere Setups die OLLAMA_URL entsprechend anpassen.

Prompt-Template

Das LLM-Prompt-Template ist in prompt.txt definiert und kann für andere Dokumenttypen oder Sprachen angepasst werden.

Entwicklung

Mit Docker (empfohlen)

docker compose up --build

Hot-Reload ist aktiv: Quelldateien sind per Volume in den Container gemountet. Änderungen an Python-Dateien und Templates werden automatisch übernommen.

Ohne Docker (nur zum Testen)

pip install -r requirements.txt
python app.py

Erfordert Tesseract im PATH und Ollama auf localhost:11434.

Projektstruktur

ocr-service/
├── app.py                  # Flask-App, OS-Patching, Startup-Lifecycle
├── config.py               # Pfade und Modell-Konfiguration
├── prompt.txt              # LLM-Prompt-Template
├── routes/
│   ├── main_routes.py      # Index, SSE-Stream
│   ├── file_routes.py      # Datei-Upload und -Auswahl
│   ├── control_routes.py   # OCR-Steuerung, Commit, Ablehnen
│   ├── analysis_routes.py  # LLM-Analyse-Endpunkte
│   └── admin_routes.py     # Admin-Funktionen
├── services/
│   ├── ocr.py              # OCR-Pipeline (Tesseract, Bild→PDF, LLM)
│   ├── import_queue.py     # Sequenzielle Import-Warteschlange
│   ├── file_utils.py       # Staging-Filesystem (StagingFS)
│   ├── session_manager.py  # Session-Registry
│   ├── ollama_client.py    # Ollama HTTP-Client
│   ├── summarizer.py       # PDF-Text-Extraktion für LLM
│   └── logger.py           # Zentrales Logging + SSE-Queue
├── static/                 # Frontend (JS, CSS)
├── templates/              # Jinja2-Templates
├── Dockerfile
├── docker-compose.yml
└── requirements.txt

Staging-System

Eine Besonderheit dieses Projekts ist das Staging-System: app.py patcht os.rename, os.remove und os.unlink global, sodass alle Dateioperationen innerhalb des Eingabe- verzeichnisses zunächst nur im Staging-Manifest geplant werden. Erst beim „Commit" durch den Benutzer werden die Änderungen tatsächlich auf dem Dateisystem ausgeführt. Dies verhindert versehentlichen Datenverlust bei der Verarbeitung medizinischer Dokumente.

Lizenz

MIT License – siehe LICENSE für Details.

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
certs		certs
routes		routes
services		services
static		static
templates		templates
.env.example		.env.example
.gitignore		.gitignore
BUGFIX_EINZELDATEI.md		BUGFIX_EINZELDATEI.md
BUGFIX_QUEUE_MONITOR.md		BUGFIX_QUEUE_MONITOR.md
CODE_CLEANUP_2025.md		CODE_CLEANUP_2025.md
Caddyfile		Caddyfile
DATEI_LEBENSZYKLUS.md		DATEI_LEBENSZYKLUS.md
Dockerfile		Dockerfile
FINAL_OUTPUT_AENDERUNG.md		FINAL_OUTPUT_AENDERUNG.md
FRONTEND_INTEGRATION.md		FRONTEND_INTEGRATION.md
FRONTEND_INTEGRATION_FERTIG.md		FRONTEND_INTEGRATION_FERTIG.md
IMPORT_QUEUE_DOKUMENTATION.md		IMPORT_QUEUE_DOKUMENTATION.md
LICENSE		LICENSE
LLM_EMPFEHLUNG.md		LLM_EMPFEHLUNG.md
NOTIFICATIONS_UEBERSICHT.md		NOTIFICATIONS_UEBERSICHT.md
README.md		README.md
TESTERGEBNISSE.md		TESTERGEBNISSE.md
VERSION		VERSION
app.py		app.py
app.py.backup		app.py.backup
claude.md		claude.md
config.py		config.py
docker-compose.yml		docker-compose.yml
log.txt		log.txt
logo_OK.jpg		logo_OK.jpg
prompt.txt		prompt.txt
reconnect-medidok.ps1		reconnect-medidok.ps1
replace_alerts.py		replace_alerts.py
requirements.txt		requirements.txt
test_models.py		test_models.py
test_qwen3.py		test_qwen3.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Medical OCR Service

Features

Architektur

Stack

Voraussetzungen

Installation

1. Repository klonen

2. Umgebungsvariablen konfigurieren

3. Ollama vorbereiten

4. Docker-Container starten

Verwendung

Web-Oberfläche

Verzeichnisstruktur (Container)

Konfiguration

LLM-Modell

Prompt-Template

Entwicklung

Mit Docker (empfohlen)

Ohne Docker (nur zum Testen)

Projektstruktur

Staging-System

Lizenz

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Medical OCR Service

Features

Architektur

Stack

Voraussetzungen

Installation

1. Repository klonen

2. Umgebungsvariablen konfigurieren

3. Ollama vorbereiten

4. Docker-Container starten

Verwendung

Web-Oberfläche

Verzeichnisstruktur (Container)

Konfiguration

LLM-Modell

Prompt-Template

Entwicklung

Mit Docker (empfohlen)

Ohne Docker (nur zum Testen)

Projektstruktur

Staging-System

Lizenz

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages