外国人労働者向けAI音声日報システム
外国人労働者が母国語で音声録音した日報を、AIが自動でテキスト化・日本語翻訳・感情分析・リスク判定し、管理者が日本語でフィードバックできるSaaS。16言語対応。
課題
従来の面談形式では、時間的制約や心理的ハードルが高く、十分なケアが難しく、従業員のメンタルヘルス問題が増加していた。
ソリューション
AIによる翻訳や感情分析を活用したメンタルヘルスケアアプリを開発。感情のアラート機能により従業員が気軽に相談できる環境を提供。
成果
従業員のメンタルヘルス問題の早期発見を支援し、休職・離職率を低減
チーム
1 member, 2 months
PM・エンジニアリング全般
役割
要件定義から設計、実装、運用まで全てを担当。
ビジネスサイドと連携し、検証段階からPM・エンジニアリング業務を全面的にリードしました。
技術スタック
主要機能
6段階AIパイプライン: 音声録音 → Whisper文字起こし → GPT/Gemini翻訳 → 感情分析 → リスク判定 → 要約・フォローアップ質問生成
16言語対応: 日本語・英語・ベトナム語・インドネシア語・ミャンマー語・ネパール語・フィリピン語・タイ語など
マルチテナント・RBAC: ワークスペース単位のテナント分離(RLS)、4段階ロール管理
カスタマイズ可能な質問テンプレート: 業種・現場に合わせた柔軟な日報フォーマット
AIコスト最適化: モデル階層化(GPT-4o-mini/Gemini Flash→Gemini Pro)とフォールバックチェーンで最適なコストパフォーマンスを実現
月次パーティショニング: 高頻度テーブルをパーティション分割し、大規模データでの性能劣化を防止
工夫点
セキュリティアーキテクチャの改善
従来の公開APIエンドポイント経由の分析を、Supabase Edge Function + pg_cronの内部トリガー方式に変更し、DDoS攻撃面を排除。
AI APIコスト最適化
翻訳はGPT-4o-mini/Gemini Flash(安価)、複雑な推論のみGemini Proを使用。感情分析はGoogle NLP API→OpenAI(非対応言語時)のフォールバックチェーンを構築。
多言語音声処理の技術課題解決
16言語の音声文字起こしではWhisperの言語パラメータとドメイン特化プロンプトで精度を向上。Safari音声録音の互換性問題にはWebAudio APIのカスタムhookで対応。