【ChatBotLearning】 Piano Class Chat Bot 実運用マニュアル&PoC総括(PoC01-08): 2025/11/5

プログラム

作成ファイルPRODUCTION_OPERATIONS_MANUAL.md

週次回帰テスト → 精度確認
    ↓
正解率 < 90% ?
    ↓ YES
アラートメール送信
    ↓
カテゴリ別分析
    ↓
FAQ追加 / プロンプト強化 / パラメータ調整
    ↓
再テスト
    ↓
正解率 ≥ 95% → 本番反映

✅ マニュアルの構成(全9章)

1. 概要

  • PoC01-08機能一覧と精度への影響
PoC機能目的精度への影響
PoC01ベースライン評価現状把握正解率 66.7%(9問中6問)
PoC02FAQ決め打ちルーターFAQ質問の100%正答化0% → 100%(9問)
PoC03プロンプト強化想像回答の抑制不正確なURL回答の抑止
PoC04PersonaフィルタRAG精度向上カテゴリ絞込によるノイズ削減
PoC05Rerank + SelfCheck回答品質向上誤答防止(2段階検証)
PoC06自動チューニングパラメータ最適化top_k 等の自動探索
PoC07回帰テスト + ダッシュボード品質監視自動メトリクス可視化
PoC08Guardrails + アラート本番保護・異常検知CircuitBreaker・RateLimiter実装
  • システム構成図(FAQ Router → RAG Pipeline → Guardrails → Alert)
ChatBot2025
├── FAQ Router (PoC02)
├── RAG Pipeline
│   ├── Persona Filter (PoC04)
│   ├── Reranker + SelfCheck (PoC05)
│   └── Auto Tuning (PoC06)
├── Production Guardrails (PoC08)
│   ├── Circuit Breaker / Rate Limiter
│   ├── Graceful Degradation
│   └── Production Monitor
└── Alert System (PoC08)
    ├── メール通知(実装途中)
    └── Slack通知

Monitoring
├── Regression Test (PoC07)
└── Dashboard / HTML Reports

2. 日次運用(毎日5-15分)

  • 朝の点検: サービス稼働確認、アラートメール確認、簡易動作テスト
  • 夜のメトリクス確認: Production Monitor、エラーログ確認

3. 週次運用(毎週15-35分)

  • 回帰テスト実行: Golden Test Suite、HTMLダッシュボード確認
  • パフォーマンス分析: レイテンシ、コスト分析

4. 月次運用(毎月30-90分)

  • 総合レビュー: 月次メトリクス集計、品質傾向分析
  • FAQ更新: 新規FAQ追加、既存FAQ見直し

5. アラート対応(4種類)

  • 📉 正解率低下: カテゴリ別分析 → プロンプト調整
  • ⏱️ レイテンシ増加: API遅延確認 → Graceful Degradation
  • ❌ エラー率上昇: Circuit Breaker確認 → API障害対応
  • 💰 コスト超過: Rate Limiter強化 → ボット攻撃調査

6. トラブルシューティング(4パターン)

  • 🔴 サービス起動失敗 → ポート競合、環境変数エラー
  • ⚠️ API障害 → Circuit Breaker動作、フォールバック
  • 💥 システムエラー → Python例外、設定ファイル検証
  • 📊 精度劣化 → 変更履歴確認、ロールバック

7. 精度改善プロセス(5手法)

  • FAQ精度改善: 新規FAQ追加、テストケース作成
  • プロンプト強化: PoC03テンプレート適用
  • RAGデータ拡充: Persona Filter用タグ付与
  • 自動チューニング: PoC06による全パラメータ探索
  • 手動パラメータ調整: パフォーマンス重視/精度重視/バランス重視

8. 運用コマンド集(7カテゴリ)

# サービス管理
sudo systemctl status piano-chatbot.service

# テスト・評価
PYTHONPATH=. python3 tools/run_qa_regression_full.py

# ログ確認
tail -100 /var/log/piano-chatbot/error.log

# メトリクス確認
cat uploads/qa_reports/production_metrics_$(date +%Y%m%d).json

# 設定変更
nano .env
sudo systemctl restart piano-chatbot.service

# バックアップ・リストア
tar -czf config_backup_$(date +%Y%m%d).tar.gz app/data/person*.txt

# Git操作
git tag -a v1.0.1 -m "Release v1.0.1"

9. 付録

  • 重要な閾値・目標値表(正解率95%、レイテンシ2000ms、コスト$5など)
  • 連絡先・エスカレーション基準(障害レベル1-4)
  • 参考資料リンク

📊 主要な運用ポイント

運用頻度主な作業所要時間重要度
日次アラート確認、簡易テスト5-15分⭐⭐⭐
週次回帰テスト、パフォーマンス分析15-35分⭐⭐⭐
月次総合レビュー、FAQ更新30-90分⭐⭐
随時アラート対応、トラブルシューティング変動⭐⭐⭐

🎯 精度維持・改善の流れ

週次回帰テスト → 精度確認
    ↓
正解率 < 90% ?
    ↓ YES
アラートメール送信
    ↓
カテゴリ別分析
    ↓
FAQ追加 / プロンプト強化 / パラメータ調整
    ↓
再テスト
    ↓
正解率 ≥ 95% → 本番反映

📈 期待される運用効果

  1. 継続的な高精度維持: 週次テストで95%以上の正解率を維持
  2. 迅速な障害対応: アラート通知により1時間以内に検知・対応
  3. 計画的な改善: 月次レビューで戦略的な機能強化
  4. コスト管理: 日次$5、月次$150以内の予算遵守
  5. ユーザー満足度向上: レイテンシ2秒以下の高速応答

🔧 次のアクション

このマニュアルに基づいて、以下を実施することを推奨します:

  1. 運用担当者へのトレーニング – 第8章のコマンド集で実習
  2. 初回の週次運用実施 – 回帰テスト実行とレポート確認
  3. アラート設定の有効化 – .envでSMTP設定を完了
  4. 月次レビュー会議の設定 – 第4章の手順でKPI確認

マニュアルは PRODUCTION_OPERATIONS_MANUAL.md に保存されています。必要に応じて組織の運用ルールに合わせてカスタマイズしてください!

付録:運用マニュアル(原文)

ピアノチャットボット 実運用マニュアル全文

Version: 1.0
対象システム: ChatBot2025(PoC01–08 実装完了版)
最終更新: 2025-11-05


📋 目次

  1. 概要
  2. 日次運用(毎日実施)
  3. 週次運用(毎週実施)
  4. 月次運用(毎月実施)
  5. アラート対応
  6. トラブルシューティング
  7. 精度改善プロセス
  8. 運用コマンド集
  9. 付録

1. 概要

1.1 本マニュアルの目的

本マニュアルは、PoC01〜08で実装された機能群を活用し、
ピアノチャットボットの精度・安定性・信頼性を継続的に維持・改善するための実運用手順を定めるものです。

1.2 実装済みPoC機能一覧

PoC機能目的精度への影響
PoC01ベースライン評価現状把握正解率 66.7%(9問中6問)
PoC02FAQ決め打ちルーターFAQ質問の100%正答化0% → 100%(9問)
PoC03プロンプト強化想像回答の抑制不正確なURL回答の抑止
PoC04PersonaフィルタRAG精度向上カテゴリ絞込によるノイズ削減
PoC05Rerank + SelfCheck回答品質向上誤答防止(2段階検証)
PoC06自動チューニングパラメータ最適化top_k 等の自動探索
PoC07回帰テスト + ダッシュボード品質監視自動メトリクス可視化
PoC08Guardrails + アラート本番保護・異常検知CircuitBreaker・RateLimiter実装

1.3 システム構成

ChatBot2025
├── FAQ Router (PoC02)
├── RAG Pipeline
│   ├── Persona Filter (PoC04)
│   ├── Reranker + SelfCheck (PoC05)
│   └── Auto Tuning (PoC06)
├── Production Guardrails (PoC08)
│   ├── Circuit Breaker / Rate Limiter
│   ├── Graceful Degradation
│   └── Production Monitor
└── Alert System (PoC08)
    ├── メール通知
    └── Slack通知

Monitoring
├── Regression Test (PoC07)
└── Dashboard / HTML Reports

2. 日次運用(毎日実施)

2.1 朝の点検(5〜10分)

2.1.1 サービス稼働確認

sudo systemctl status piano-chatbot.service
# → Active: active (running) が正常

2.1.2 アラートメール確認

  • 📧 「🚨 ChatBot Alert」件名のメールを確認
  • 📊 Slackチャンネルで通知を確認

異常がある場合 → 5. アラート対応 を参照。

2.1.3 動作テスト(手動)

  • 「体験レッスンの流れを教えてください」(FAQ)
  • 「ハノンって何ですか?」(音楽理論)
  • 「スタッカートの練習方法」(テクニック)

期待結果:

  • 3秒以内で応答
  • FAQ質問は即答
  • その他は適切な生成回答

2.2 夜のメトリクス確認(3〜5分)

cat uploads/qa_reports/production_metrics_$(date +%Y%m%d).json

確認基準:

  • error_rate < 0.10
  • avg_latency_ms < 3000
  • total_cost < $10
  • cache_hit_rate > 0.5

3. 週次運用(毎週実施)

3.1 回帰テスト実行(15〜20分)

PYTHONPATH=. python3 tools/run_qa_regression_full.py

確認項目:

  • 総合正解率 > 90%
  • FAQ Router:100%
  • 平均レイテンシ < 3000ms
  • エラー率 < 10%

3.2 アラート送信確認

回帰テスト時に自動で発火。メールまたはSlackで閾値超過を報告。


4. 月次運用(毎月実施)

4.1 月次レビュー(30〜60分)

PYTHONPATH=. python3 tools/generate_monthly_report.py

分析観点:

  • 精度推移(週次グラフ)
  • レイテンシ傾向
  • CircuitBreaker・RateLimit発動回数

4.2 FAQ更新

nano app/services/faq_definitions.py

追加・更新後は回帰テストで検証。


5. アラート対応

5.1 主なアラート種別と対応

種別判定条件主な対応
正解率低下< 90%回帰テスト結果分析・カテゴリ特定
レイテンシ増加> 3000msGraceful Degradation確認
エラー率上昇> 10%API障害/システムログ調査
コスト超過> $10RateLimiter制限強化

各種手順は「メール件名」別に詳細記載(例:🚨 ChatBot Alert: 正解率低下)。


6. トラブルシューティング

症状主な原因対処
サービス起動失敗ポート競合/依存関係エラーjournalctl -u piano-chatbot.service
API障害OpenAI Timeout/Rate LimitCircuitBreaker自動復帰を待機
Python例外設定ファイル/KeyErrorerror.log でトレース確認
精度低下パラメータ・プロンプト変更回帰テストで原因特定

7. 精度改善プロセス

改善は以下のサイクルを遵守します:

検知 → 原因分析 → 仮説立案 → 修正 → 回帰テスト → 効果測定 → 反映

主な改善手法

手法PoC効果
FAQ追加PoC02定型質問の精度向上
プロンプト強化PoC03想像回答抑制
RAGデータ拡充PoC04情報欠落防止
自動チューニングPoC06パラメータ最適化
回帰テストPoC07改善効果の定量化

A/B比較は compare_reports.py で実施。


8. 運用コマンド集

8.1 基本操作

sudo systemctl restart piano-chatbot.service
sudo systemctl status piano-chatbot.service
sudo journalctl -u piano-chatbot.service -n 100 -f

8.2 テスト系

PYTHONPATH=. python3 tools/run_qa_regression_full.py
PYTHONPATH=. python3 tools/test_alert_service.py
PYTHONPATH=. python3 tools/run_guardrails_demo.py

8.3 ログ・メトリクス確認

tail -100 /var/log/piano-chatbot/error.log
cat uploads/qa_reports/production_metrics_$(date +%Y%m%d).json

9. 付録

9.1 閾値・目標値

メトリクス目標値アラート閾値
総合正解率95%以上90%未満
FAQ正解率100%未達時アラート
平均レイテンシ< 2000ms> 3000ms
エラー率< 5%> 10%
日次コスト< $5> $10
Cache Hit Rate> 60%< 40%
Circuit Breaker月10回以下週5回以上
Rate Limit月20回以下週10回以上

9.2 エスカレーション体制

障害レベル対応者連絡方法目標対応時間
Lv1(軽微)運用担当メール営業時間内
Lv2(中度)管理者メール4時間以内
Lv3(重大)開発チームSlack/電話1時間以内
Lv4(緊急)全員緊急連絡網即時

9.3 参考資料

  • PoC01–08 技術レポート: uploads/qa_reports/PoC0*_analysis_summary.txt
  • 設計書: app/data/poc0*_plan.md
  • デプロイ手順: DEPLOYMENT_UBUNTU.md
  • プロジェクト概要: README.md

改版履歴

  • v1.0(2025-11-05)初版作成 – PoC01〜08対応版

作成者: ChatBot2025 開発チーム
承認者: システム管理者
次回見直し予定: 2025-12-05


このマニュアルは、ピアノチャットボットの本番運用を支えるための「日次〜月次点検・異常検知・改善ループ」を体系化した正式ドキュメントです。
特に PoC08で導入した Guardrails/Alert 機構 を中心に、安定稼働を持続させるための基盤運用を明確に定義しています。

コメント

タイトルとURLをコピーしました