Persona.AI - Master Your Communication Skills

An advanced AI-powered communication coaching platform that provides real-time feedback on presentation skills using multi-modal analysis.

Features

Real-time AI Analysis: Advanced computer vision and audio analysis using MediaPipe and TensorFlow.js
Multi-modal Feedback: Analyzes facial expressions, posture, voice quality, speech clarity, and content engagement
Category-specific Coaching: Tailored analysis for job seekers, professionals, speakers, sales teams, remote workers, and students
Privacy-first: All processing happens locally in the browser with optional backend analysis
Comprehensive Metrics: Eye contact, posture, gesture analysis, speech patterns, and emotional recognition

Technologies Used

Frontend: React 18, TypeScript, Vite
UI Framework: ShadCN/UI, Tailwind CSS, Radix UI
AI/ML: MediaPipe (Face Mesh, Pose, Gesture), TensorFlow.js, Hugging Face Transformers
Audio Processing: Web Audio API, YIN Pitch Detection, SNR Analysis
Backend: Supabase (optional for extended analysis)
State Management: TanStack Query, React Router

Project Structure

src/
├── components/          # Reusable UI components
├── pages/              # Main application pages
├── lib/                # Core analysis algorithms
│   ├── visionAnalysis.ts    # MediaPipe-based vision analysis
│   ├── audioAnalysis.ts     # Audio processing and analysis
│   ├── speechRecognition.ts # Speech-to-text and analysis
│   ├── contentAnalysis.ts   # NLP content analysis
│   └── fusionAlgorithm.ts   # Multi-modal metric fusion
├── hooks/              # Custom React hooks
├── integrations/       # External service integrations
└── types/              # TypeScript type definitions

Key Components

Vision Analysis

Face Detection: MediaPipe Face Mesh (468 landmarks)
Emotion Recognition: FACS-based emotion detection with blendshapes
Eye Contact Tracking: Iris position analysis with gaze vector calculation
Posture Analysis: 3D pose estimation with joint angle analysis

Audio Analysis

Pitch Detection: YIN algorithm for fundamental frequency
Voice Quality: SNR (Signal-to-Noise Ratio) for clarity
Speech Patterns: Filler word detection, WPM calculation

Content Analysis

NLP Processing: TF-IDF keyword extraction, sentiment analysis
Readability Metrics: Sentence complexity and vocabulary richness
Named Entity Recognition: Pattern-based entity extraction

License

This project is licensed under the MIT License.

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
public		public
src		src
supabase		supabase
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
bun.lockb		bun.lockb
components.json		components.json
eslint.config.js		eslint.config.js
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
postcss.config.js		postcss.config.js
setup-db.js		setup-db.js
tailwind.config.ts		tailwind.config.ts
tsconfig.app.json		tsconfig.app.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vercel.json		vercel.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Persona.AI - Master Your Communication Skills

Features

Technologies Used

Project Structure

Key Components

Vision Analysis

Audio Analysis

Content Analysis

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Persona.AI - Master Your Communication Skills

Features

Technologies Used

Project Structure

Key Components

Vision Analysis

Audio Analysis

Content Analysis

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages