LLMによる議事録自動作成についてのバックアップ(No.2) - .NET 開発基盤部会 Wiki

[ トップ ] [ 新規 | 一覧 | 単語検索 | 最終更新 | ヘルプ ]

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
LLMによる議事録自動作成についてへ行く。
- 1 (2025-09-10 (水) 15:38:20)
- 2 (2025-09-10 (水) 15:38:51)
- 3 (2025-09-10 (水) 23:19:51)
- 4 (2025-09-11 (木) 14:28:14)
- 5 (2025-09-11 (木) 15:20:45)
- 6 (2025-09-19 (金) 12:37:54)
- 7 (2025-09-19 (金) 17:29:38)
- 8 (2025-09-22 (月) 16:28:03)
- 9 (2025-09-24 (水) 09:51:30)

「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

戻る > ChatGPT

目次 †

目次
概要

概要 †

以下のような理由で苦手。

そもそもの複雑さ
- 単に音声をテキスト化するだけでなく、発言の真意や背景にある文脈を正確に理解し、議論の要点を抽出し、簡潔にまとめる必要がある。
- 会議では、複数の参加者が同時に発言したり、指示詞、専門用語が飛び交ったり、非言語的な情報（ジェスチャー、表情など）も含まれる。
- AIにとって判断が難しい「決定事項、タスク、重要な議論のポイント」などを取捨選択してまとめる必要がある。

音声認識（ASR）の限界
- 背景音や咳払いなどの雑音、発言者の話し方（早口・なまり）によって認識精度が落ちる。
- 複数人が同時に話す（ダイアログのオーバーラップ）と誰が何を言ったかが曖昧になる。
- 特に指示詞、専門用語や固有名詞、社内用語などは誤認識されやすい。

発言の文脈・意図の理解が困難

会議中の発言は省略や曖昧さが多く、逐語的に記録しても意味が通じにくい。
暗黙の了解や前提知識、非言語的情報（表情、ジェスチャー）に依存する場合もある。
AIは「何が重要だったか」「何が決定されたのか」を自動で判断するのが難しい。

要約・構造化の難しさ
- 会話は冗長で、要点が散らばっていたり、途中で話題が飛んだりする。
- 会議の目的（情報共有／意思決定／ブレストなど）によって必要な要約の形式が異なる。
- 「決定事項」「次のアクション」「担当者」などの抽出は定型的でないと精度が出にくい。

※ 決定事項の抽出：「意見」と「決定」を区別するには深い文脈理解が必要。

個人・組織ごとの書き方の差異
- 議事録には企業・組織ごとにフォーマットや書き方の文化がある。
- 例えば「丁寧に」「簡潔に」「発言者を明示する/しない」といった違いがあり、汎用モデルでは対応が困難。

セキュリティ・プライバシーの懸念
- 会議内容には機密情報が含まれることが多く、クラウド上のモデル利用が難しい。
- 特に生成AIを用いる場合、データが外部に送信されることへの懸念が強い（社内利用に制限）。

責任と信頼性の問題
- 議事録は法的な意味を持つ場合も多く、内容の正確性が極めて重要。
- 誤りがあった場合の責任の所在が不明確であり、組織として利用することにリスクが伴う。

項目	得意 / 不得意	説明
テキスト要約	△（構造化されていれば）	会話形式だと精度が落ちる
固定フォーマット出力	△	定型的な会議（定例報告など）には適用可能
意思決定の抽出	×	意図や合意形成を自動で理解するのは困難
会話の構造理解	×	会話の流れや関係性をモデルが理解しきれない
文書生成（清書）	○	下書きがあれば文書化には有効