Latent Perceptual Transduction for Physical Phenomenon State Estimation
製造業における設備の状態把握は、長年にわたり熟練職人の暗黙知に依存してきた。本プロジェクトでは、AIの潜在表現を「物理現象のあるべき姿との乖離」という意味を帯びた感覚信号へ直接変換するアーキテクチャの構築を目指す。
従来の「潜在表現 → 物理量への逆変換 → 認知理解」という迂回路に対し、「潜在表現 → 感覚信号 → 身体的応答」 という短絡経路が原理的に優位であるという仮説を出発点とする。
熟練職人は設備の状態を「音が違う」「振動の感じが変わった」という知覚的判断によって把握している。こうした判断は言語化・形式化が困難であり、後継者育成の壁となっている。
| 変数種別 | 内容 |
|---|---|
| 観測 | 金属の膨張量・抵抗値(時系列) |
| 行動 | 電流量(時系列) |
| コンディション | 金属組成・板厚 |
熟練工はこれらを統合的に「感じて」判断している。
- 計測制約 — 逆変換先の物理量がそもそも計測不可能なケースが多い(内部温度分布など)
- モデル整合の困難 — 潜在空間の構造と物理モデルの構造は必ずしも対応しない
- 情報欠落 — スカラー物理量への射影は複合的な文脈情報を不可逆的に失う
RSSM(Recurrent State Space Model)を用いて、観測・行動・コンディションを統合的にエンコードし、潜在空間 z ∈ ℝⁿ に圧縮する。潜在空間は以下を内包する:
- 現在の設備状態(正常/異常の連続的なグラデーション)
- 時系列の文脈(過去の状態遷移の記憶)
- あるべき姿からの乖離(モデルが予測する基準状態との差)
潜在表現 z → 感覚信号 → 身体的応答
写像の設計には数学・工学・認知科学に加え、音響芸術・感覚表現の知見 を横断的に援用する。
- ソニフィケーション — 潜在次元を音高・音色・リズムへ写像。乖離の大きさを音として「聴く」
- 視覚化 — 潜在空間の軌跡を色・形・動きで表現。状態遷移のパターンを「見る」
本プロジェクトは、製造業AIと音響芸術の交差点に位置する。
| 領域 | 貢献 |
|---|---|
| 製造工学 | 物理現象のモデリング、実データ提供 |
| 機械学習(RSSM) | 潜在空間の構築と学習 |
| 音響芸術・ソニフィケーション | 写像設計、知覚評価 |
| 認知科学 | 身体的応答の評価フレームワーク |
.
├── README.md
├── docs/
│ └── latent_perception.pptx # 説明資料(東京藝大 後藤研 向け)
├── data/
│ └── .gitkeep # 実データ(別管理)
├── models/
└── rssm/ # RSSMモデル実装
---
## 設計上の未解決問題
- **Q1 写像設計** — 潜在次元のどのパラメータを、音の何(音高・音色・テンポ・空間)に対応させるか
- **Q2 身体的応答の検証** — 「直感的に何かおかしい」と感じられる設計の条件とは何か
- **Q3 暗黙知との照合** — 生成された感覚信号は熟練工の知覚と対応するか
---
## ステータス
🔬 **探索フェーズ** — 概念設計・学際的連携の構築中