Ce document compile les inspirations tirées de l'analyse des ressources externes (DaVinci Resolve, CapCut, Hacks de Montage) pour améliorer les capacités vidéo et IA de StoryCore-Engine.
L'objectif est de réduire le temps de montage manuel en utilisant des modèles IA spécifiques.
| Fonctionnalité Inspiration | Description | Application StoryCore |
|---|---|---|
| Ripple Delete Silence | Suppression automatique des silences dans les dialogues. | Nettoyage automatique des narrations générées ou enregistrées. |
| AI Music Remix/Editor | Ajustement transparent de la durée d'une musique sans couper brutalement (Live Trim). | Adaptation automatique de la bande son à la durée du scénario généré. |
| Beat-Synced Editing | Marquage visuel des beats pour caler les changements de scène. | Synchronisation automatique des transitions "cut" avec le rythme de la musique de fond. |
| Magic Mask / Rotoscopie | Isolation automatique d'un sujet (personnage) en un clic. | Permettre de placer du texte ou des effets visuels derrière les personnages sans masque manuel. |
| AI Voice Isolation | Suppression du bruit de fond et isolation de la voix. | Améliorer la clarté des dialogues enregistrés par l'utilisateur ou générés. |
| Smooth Cut Transition | Utilisation de l'IA pour créer des frames intermédiaires entre deux coupes (évite les jump cuts). | Rendre les transitions entre deux prises de vue générées plus fluides. |
| Character Consistency Sheets | Génération de planches d'images (face, profil, dos) pour un personnage. | Garantir que le visage et les habits du personnage ne changent pas entre deux scènes. |
| Multi-Angle Camera AI | Demander à l'IA la même scène sous différents angles (plongée, drone, contre-plongée). | Créer des montages dynamiques sans multiplier les prompts de base. |
Inspirations pour donner un look "professionnel" instantané aux vidéos produites par StoryCore.
- Hellation / Bloom Effect: Ajouter un halo lumineux autour des sources de lumière pour un look pellicule anamorphique.
- Color Isolation (HSL Qualifier): Outil simplifié pour isoler une couleur (ex: rouge uniquement) et désaturer le reste pour un effet stylistique fort (Style Sin City / Pub Luxe).
- Face Tracking Dynamique: Verrouillage de la caméra sur le visage du personnage principal pour créer des plans "POV" ou des suivis sportifs/dynamiques.
- Vignette & Grain de Pellicule: Intégration par défaut de réglages de contraste et de grain pour simuler différents styles de caméras.
- 3D-to-AI Layout Rendering: Utiliser une mise en scène 3D simplifiée (depth map/outline) comme "guide" pour l'IA afin de générer des visuels complexes avec gestion physique (fumée, eau, débris).
- Style Visual Correlation (Thumbnail hook): Animer une miniature (Thumbnail) pour les premières secondes de la vidéo afin de créer une accroche visuelle immédiate.
- Transcription-Based Navigation: Pouvoir cliquer sur un mot dans la transcription pour aller directement au moment exact sur la timeline.
- Soundly "Place It" (Environnements Audio): Appliquer instantanément des filtres pour simuler que le son vient d'un téléphone, d'un stade, d'une grotte, etc. (Audio Worldization).
- Presets d'Animation sans Keyframes: Proposer des animations pré-configurées (Whip, Spin, Zoom intelligent) que l'utilisateur glisse sur ses éléments.
- Keyframe System Simplifié: Permettre de poser des points clés manuels pour l'opacité, l'échelle (zoom) et la position directement dans l'UI.
- Auto-Ducking Audio: Baisser automatiquement le volume de la musique de fond au passage d'une narration ou d'un dialogue.
- AI Start-to-End Frame: Générer une animation fluide entre deux poses de combat ou deux situations clés définies par l'utilisateur.
- Auto-Trim Silence: ✅ Implémenté dans
ffmpeg_service.pyet exposé via/api/ai/audio/auto-trim. - Beat Detection: ✅ Implémenté via
librosa/energy-baseddansai_audio_service.pyet exposé via/api/ai/audio/detect-beats. - Hellation Plugin: ✅ Ajouté comme type d'amélioration dans
video_enhancement_service.pyet exposé via/api/ai/enhance.
- Transcription-Based Navigation: ✅ Service
TranscriptionServicedansai_audio_service.pyavec support Whisper/Vosk.- Endpoint:
/api/ai/audio/transcribe- Transcription avec timestamps mot par mot - Endpoint:
/api/ai/audio/transcribe/search- Recherche dans la transcription - Endpoint:
/api/ai/audio/transcribe/timestamp- Obtention du timestamp d'un mot
- Endpoint:
- Beat-Synced Editing: ✅
get_beat_aligned_cuts()dansBeatDetectionServicepour aligner les coupes sur les beats.- Endpoint:
/api/ai/audio/beat-aligned-cuts- Calcul des points de coupe alignés
- Endpoint:
- Audio Worldization: ✅ Service
AudioWorldizationServicepour simuler des environnements audio.- Endpoint:
/api/ai/audio/worldize- Application d'effets d'environnement - Environnements: phone, stadium, cave, concert_hall, small_room, bathroom, car, forest, underwater
- Endpoint:
- Smooth Cut Transition: ✅ Service
SmoothCutServicepour créer des transitions fluides entre coupes.- Endpoint:
/api/ai/video/smooth-cut- Création de transition smooth entre deux vidéos - Endpoint:
/api/ai/video/interpolate-frames- Interpolation de frames pour motion fluide
- Endpoint:
- Face Tracking Dynamique: ✅ Service
SmartCropServiceavec détection MediaPipe/OpenCV.- Endpoint:
/api/ai/video/smart-crop- Recadrage intelligent avec suivi de visage - Endpoint:
/api/ai/video/detect-faces- Détection des visages dans une vidéo
- Endpoint:
- Multi-Angle Camera AI: ✅ Service
MultiAngleServicepour génération de prompts multi-angles.- Endpoint:
/api/ai/video/multi-angle- Génération de prompts pour différents angles - Endpoint:
/api/ai/video/shot-list- Génération de shot list complet - Endpoint:
/api/ai/video/camera-angles- Liste des angles disponibles - Endpoint:
/api/ai/video/scene-sequences/{scene_type}- Séquences recommandées par type
- Endpoint:
- Auto-Ducking Audio: ✅ Service
AutoDuckingServiceavec sidechain compression FFmpeg.- Endpoint:
/api/ai/audio/auto-duck- Ducking automatique musique/dialogue - Endpoint:
/api/ai/audio/auto-duck-video- Ducking sur vidéo avec voix détectée - Endpoint:
/api/ai/audio/detect-speech-segments- Détection des segments de parole
- Endpoint:
- AI Voice Isolation: ✅ Service
AudioCleaningServiceavec plusieurs méthodes.- Endpoint:
/api/ai/audio/isolate-voice- Isolation vocale (spectral/wiener/demucs) - Endpoint:
/api/ai/audio/reduce-noise- Réduction de bruit simple
- Endpoint:
- Color Isolation (HSL Qualifier): ✅ Filtre
hsvholdFFmpeg dansVideoEnhancementService. - Smart Pan & Scan: ✅ Service
SmartCropServiceavec suivi MediaPipe/OpenCV. - Dynamic Vignette & Grain: ✅ Textures cinéma via
_apply_vignette_grain.
- Multi-Angle Camera AI: ✅ Service
MultiAngleServicecomplet. - Character Consistency Sheets: ✅ Service
CharacterConsistencyServicecomplet.- Endpoint:
/api/ai/video/character-sheet- Génération de prompts pour character sheet - Endpoint:
/api/ai/video/consistency-prompt- Prompt avec référence pour cohérence - Endpoint:
/api/ai/video/turnaround-prompt- Prompt pour turnaround sheet - Endpoint:
/api/ai/video/character-views- Vues disponibles - Endpoint:
/api/ai/video/expressions- Expressions disponibles
- Endpoint:
- Image Preview Integration: ✅ Boutons interactifs dans
ImagePreviewPanel.tsx.
- GPU Acceleration (NVIDIA/AMD/Intel): ✅ Détection matérielle et encodeurs
nvenc/amf/qsvdansGPUService. - Transparents Export (WebM Alpha): ✅ Support WebM avec canal alpha.
- Sprite Generation: ✅
SpriteServicepour extraction automatique. - Global AI Cache: ✅
AICacheServicepour éviter les re-calculs.
-
Animation Presets sans Keyframes: ✅ Service
AnimationPresetsServiceavec 18 presets prêts à l'emploi.- Endpoint:
/api/ai/creative/animate- Application de preset à image/vidéo - Endpoint:
/api/ai/creative/animations- Liste des presets disponibles - Presets: zoom_in, zoom_out, spin, ken_burns, whip_pan, pulse, shake, glitch, flash, bounce, fade, dissolve, etc.
- Catégories: transition, motion, effect, entrance, exit
- Endpoint:
-
AI Start-to-End Frame (Pose Interpolation): ✅ Service
AIPoseInterpolationServicepour animation entre poses.- Endpoint:
/api/ai/creative/pose-interpolate- Création d'animation entre deux poses - Endpoint:
/api/ai/creative/pose-detect- Détection de keypoints MediaPipe - Endpoint:
/api/ai/creative/pose-prompts- Génération de prompts pour animation - Support MediaPipe pour détection de 33 points du corps
- Endpoint:
-
AI Music Remix: ✅ Service
AIMusicRemixServicepour adaptation de durée musicale.- Endpoint:
/api/ai/creative/music-remix- Remix intelligent - Endpoint:
/api/ai/creative/music-analyze/{path}- Analyse BPM et sections - Endpoint:
/api/ai/creative/music-stretch- Time-stretch avec préservation du pitch - Modes: stretch, cut, remix, loop
- Détection automatique du BPM avec librosa
- Endpoint:
-
Thumbnail Hook Animation: ✅ Service
ThumbnailHookServicepour miniatures animées.- Endpoint:
/api/ai/creative/thumbnail-hook- Création de miniature animée - Endpoint:
/api/ai/creative/thumbnail-animations- Types d'animation disponibles - Animations: zoom_breath, parallax, pulse, glitch, ken_burns
- Support ajout de texte avec position configurable
- Endpoint:
-
Magic Mask / Rotoscopie: ✅ Service
MagicMaskServicepour isolation automatique de sujets.- Endpoint:
/api/ai/advanced/mask/generate- Génération de masque pour image - Endpoint:
/api/ai/advanced/mask/rotoscope- Rotoscopie complète de vidéo - Endpoint:
/api/ai/advanced/mask/types- Types de masques disponibles - Types: person, face, body, hair, hands, background
- Support MediaPipe selfie segmentation et OpenCV GrabCut
- Endpoint:
-
Depth Map Generation: ✅ Service
DepthMapServicepour cartes de profondeur.- Endpoint:
/api/ai/advanced/depth-map- Génération de depth map - Endpoint:
/api/ai/advanced/depth-prompt- Prompt pour génération guidée - Méthodes: simple (gradients), midas (MiDaS neural network)
- Support PyTorch/MiDaS pour estimation précise
- Endpoint:
-
Bloom/Anamorphic Effect: ✅ Service
BloomEffectServicepour effets cinématiques.- Endpoint:
/api/ai/advanced/bloom- Effet bloom lumineux - Endpoint:
/api/ai/advanced/anamorphic-flare- Flare anamorphique - Endpoint:
/api/ai/advanced/bloom-presets- Présets disponibles - Intensités: subtle, moderate, strong, anamorphic
- Endpoint:
-
AI Subtitle Generator: ✅ Service
AISubtitleServiceavec Whisper.- Endpoint:
/api/ai/advanced/subtitles/generate- Génération et burn - Endpoint:
/api/ai/advanced/subtitles/transcribe- Transcription seule - Endpoint:
/api/ai/advanced/subtitles/translate- Traduction de sous-titres - Endpoint:
/api/ai/advanced/subtitle-styles- Styles disponibles - Styles: default, netflix, youtube, cinematic, minimal, bold, outline, glow
- Endpoint:
-
Background Replacement: ✅ Service
BackgroundReplacementService.- Endpoint:
/api/ai/advanced/background/replace- Remplacement de fond - Endpoint:
/api/ai/advanced/background/colors- Couleurs prédéfinies - Support image ou couleur comme nouveau fond
- Color matching et lighting matching automatiques
- Endpoint:
-
AnimationPresetsPanel: ✅ Composant React pour drag & drop de presets d'animation.
- 18 presets disponibles (zoom_in, spin, ken_burns, glitch, etc.)
- Configuration durée, intensité, easing
- Catégories: motion, transition, effect, entrance, exit
-
MagicMaskTool: ✅ Composant React pour isolation de sujet en un clic.
- Types: person, face, body, background
- Edge refinement et feathering
- Manual refinement avec brush tools
-
SubtitleEditor: ✅ Composant React pour génération de sous-titres AI.
- Styles: default, netflix, youtube, cinematic, etc.
- Customisation: font size, colors, outline
- Traduction automatique
-
WebSocket Progress Manager: ✅ Service
WebSocketProgressManagerpour suivi temps réel.- Endpoint:
/api/ai/performance/jobs/create- Création de job - Endpoint:
/api/ai/performance/jobs/{job_id}- Statut du job - Endpoint:
/api/ai/performance/jobs/{job_id}/progress- Mise à jour progression - Callbacks pour notifications temps réel
- Endpoint:
-
AI Cache Service: ✅ Service
AICacheServicepour cache intelligent.- Endpoint:
/api/ai/performance/cache/stats- Statistiques cache - Endpoint:
/api/ai/performance/cache/get- Récupération cached - Endpoint:
/api/ai/performance/cache/set- Mise en cache - Endpoint:
/api/ai/performance/cache/invalidate- Invalidation - Memory cache + disk cache avec TTL configurable
- Endpoint:
-
Batch Processing Service: ✅ Service
BatchProcessingServicepour traitement parallèle.- Endpoint:
/api/ai/performance/batch/process- Traitement batch - Endpoint:
/api/ai/performance/batch/{batch_id}- Statut batch - Parallel processing avec semaphore
- Progress callbacks
- Endpoint:
-
Job Queue Service: ✅ Service
JobQueueServicepour queue asynchrone.- Endpoint:
/api/ai/performance/queue/submit- Soumettre job - Endpoint:
/api/ai/performance/queue/{job_id}- Statut job - Endpoint:
/api/ai/performance/queue/stats- Statistiques queue - Priority queue avec workers configurables
- Endpoint:
-
Color Grading & LUTs: ✅ Service
ColorGradingServicepour étalonnage professionnel.- Endpoint:
/api/ai/pro/color-grade- Application color grading - Endpoint:
/api/ai/pro/color-grade/presets- Liste des presets - Endpoint:
/api/ai/pro/color-grade/luts- Liste des LUTs disponibles - Presets: cinematic, vintage, teal_orange, noir, warm, cool, hdr
- Support LUT .cube, .3dl, .mga, .csp
- Ajustements: contrast, saturation, gamma, temperature, tint
- Endpoint:
-
Speed Ramping: ✅ Service
SpeedRampingServicepour variations de vitesse.- Endpoint:
/api/ai/pro/speed-ramp- Application speed ramping - Endpoint:
/api/ai/pro/speed-ramp/curve- Génération courbe - Types: linear, ease_in, ease_out, ease_in_out, exponential
- Preserve pitch et frame interpolation
- Endpoint:
-
AI Scene Detection: ✅ Service
SceneDetectionServicepour détection de scènes.- Endpoint:
/api/ai/pro/scene-detect- Détection de scènes - Endpoint:
/api/ai/pro/scene-detect/methods- Méthodes disponibles - Méthodes: threshold, content (OpenCV), adaptive
- Export JSON des timestamps
- Endpoint:
-
Keyframe System Backend: ✅ Service
KeyframeServicepour animations.- Endpoint:
/api/ai/pro/keyframes/add- Ajouter keyframe - Endpoint:
/api/ai/pro/keyframes/value- Valeur interpolée - Endpoint:
/api/ai/pro/keyframes/tracks- Liste des tracks - Endpoint:
/api/ai/pro/keyframes/export- Export JSON - Easing: linear, ease_in, ease_out, ease_in_out, bezier
- Interpolation: linear, step, bezier
- Endpoint:
-
Pipeline Chaining: ✅ Service
AIWorkflowOrchestratorpour enchaîner les opérations AI.- Endpoint:
/api/ai/workflow/run- Lancer un workflow - Endpoint:
/api/ai/workflow/{workflow_id}- Statut du workflow - Endpoint:
/api/ai/workflow/templates/available- Templates prédéfinis - 30+ types d'étapes disponibles
- Endpoint:
-
Step Types: ✅ 30+ types d'étapes supportées.
- Generation: generate_image, generate_video, generate_audio, generate_music, generate_voiceover
- Identity: extract_identity, apply_identity, character_sheet
- Video: color_grade, apply_vfx, add_subtitles, speed_ramp, smooth_cut
- Audio: auto_duck, isolate_voice, beat_sync, audio_worldize
- AI Tools: magic_mask, depth_map, scene_detect, background_replace
- Animation: animation_preset, pose_interpolate, thumbnail_hook
- Post-Production: lip_sync, batch_render, export_final
-
Control Flow: ✅ Étapes de contrôle de flux.
- PARALLEL_GROUP: Exécuter plusieurs étapes en parallèle
- CONDITIONAL: Branchement conditionnel (if/else)
- WAIT: Attente durée ou autre workflow
-
Predefined Templates: ✅ 7 templates prêts à l'emploi.
cinematic_hero: Generate → Extract → Video → Color Grade → Exportbatch_promo: Extract Identity → Batch Render → Color Grade → Exportmusic_video: Generate → Beat Sync → VFX → Color Grade → Exportsocial_content: Generate → Subtitles → Thumbnail Hook → Exportfull_production: Pipeline complet 8 étapesparallel_audio_video: Traitement parallèle audio/vidéoconditional_vfx: VFX conditionnel
-
Condition Evaluation: ✅ Syntaxe de conditions.
context.video_path exists- Vérifier existencecontext.identity_id == 'abc123'- Égalitécontext.duration > 60- Comparaison numériquecontext.status in ['completed', 'pending']- Appartenance
Tip
De nombreuses fonctionnalités comme le Color Grading et le VFX Node-based sont déjà esquissées dans le PLAN_DAVINCI_RESOLVE_INTEGRATION.md. L'ajout de ces "micro-fonctionnalités" d'automatisation (Speed Warp, Remix Audio) rendra l'outil StoryCore beaucoup plus accessible pour les non-monteurs.