Noriyo Akita's Today I Learned

# 「実践AIエージェントの教科書 構築技術と豊富な活用事例で学ぶ」を読んだ

Table of Contents

日立製作所 AI CoE 監修の「実践AIエージェントの教科書 構築技術と豊富な活用事例で学ぶ」(リックテレコム)を読んだ。AIエージェントの基礎から開発技術、活用事例までを1冊にまとめた本で、全6章構成。前半が概念と技術の解説、後半が日立グループでの実践事例という構成になっている。

よかったところ

技術編(第2章)の密度が高い。特にオーケストレーションの解説では、ツール利用・ルーター・メモリー・計画立案という4つの構成要素を、工事現場の安全管理のようなシナリオを使って段階的に説明していく。LLM単体の限界(学習データにない企業固有の情報や未来の天気は扱えない)から出発して、なぜ外部ツール連携やコンテキスト保持が必要なのかを示す流れが腑に落ちやすかった。

設計パターンの整理も実用的で、対話設計パターン(スロットフィリング、コンテキスト保持、マルチターン対話)と行動設計パターン(ReAct、Reflection、Planning-and-Execution、マルチエージェント)に分けて紹介される。マルチエージェント構成はワークフロー型・Supervisor型・Network型・Hierarchical型の4種で、それぞれフローチャート付きで比較できるのがわかりやすい。

MCPとA2Aの章(2.3節)も、両プロトコルの位置づけの違い――MCPがツール接続の標準化、A2Aがエージェント間協調――を整理していて、この2つが混同されがちな今、頭の整理に役立つ。

評価設計の節(2.1.4)は予想以上にしっかり書かれていて、Planning/Reasoning、Reflection、Tool Useという要素能力ごとの評価観点を示した上で、段階的評価アプローチやオフライン/オンライン評価の使い分けまでカバーしている。AIエージェントをどう評価すればいいかが曖昧なまま開発に入るケースは多いので、ここだけでも読む価値がある。

日立グループの活用事例

本書の後半(第3〜5章)は日立グループでの実践事例が中心で、ここが本書の独自色でもある。

第3章はオフィスワーク領域。社内検索AIエージェントや受注手配業務の自動化(約1,800名の営業・約300名の事務が関わる業務)、マニュアル更新の効率化(Human-in-the-Loop型)といったユースケースが並ぶ。技術面で興味深いのは、日立とOracleが共同で取り組んだ次世代RAGの事例で、LangGraphとOracle Databaseを組み合わせてSQL検索とベクトル検索を自動的に切り替える構成が紹介されている。MCPサーバーによるツール接続の標準化(3.5.2節)や、社内問合せ業務をLangGraphで実装した設計・開発プロセスの解説もある。

第4章はシステム開発・運用保守でのAIエージェント活用。IDE統合型・Webインタフェース型・スタンドアロン型といったコーディングエージェントの分類や、協調型開発のアプローチが紹介される。ここで面白いのが仮想シナリオを使った実証で、SIer企業の仮想X社が家電販売の仮想Y社のECサイト拡張(地域ポイント制度導入)を請け負うという設定のもと、AutoGenベースのロールプレイ型マルチAIエージェントがシステム開発企画書を生成する過程が描かれている。

第5章は業界別の事例で、ここが最も読み応えがあった。まず業務知識を言語的・記述的・手続き的・概念的・暗黙的の5つに分類した上で、各業界の事例に入る。金融では日立グループの中期経営計画「Inspire 2027」を仮想シナリオとしたアナリスト業務支援が紹介され、Agnoフレームワークを使ったマルチエージェント構成で約10分でレポートを生成する。製造では、OTナレッジとSTAMP/CASTという安全分析手法を組み合わせた故障原因分析の事例があり、正答率が 67% から 90% へ 23ポイント向上したという具体的な数値が示されている。

鉄道の事例は特にユニークで、運行管理システムの装置状態監視において、日立の専門部隊によるエスノグラフィー調査で現場の暗黙知を抽出し、Q&A形式にドキュメント化した上でAIエージェントに組み込むというプロセスが解説されている。ドメイン特化LLMの構築にはCPT(Continual Pre-Training)とSFT(Supervised Fine-Tuning)によるファインチューニングが使われている。コラムでは日立レールのデジタルアセットマネジメントプラットフォーム「HMAX」(2024年9月発表、NVIDIAとのコラボレーション)も紹介されていた。電力では、日立パワーソリューションズの障害受付センタ(約3,000サイト対応、初動判断30%効率化)、Hitachi Energy社の植生管理ソリューション「Hitachi Vegetation Manager」、原子力プラントでのメタバース×生成AIの取り組みなど、幅の広い事例が並ぶ。

気になったところ

活用事例の充実ぶりは認めつつも、第3〜5章がほぼ日立グループの事例で占められている点は好みが分かれるところだと思う。大企業でのAIエージェント導入がどう進むかを知りたい人には参考になるが、個人開発者やスタートアップの視点からは距離がある。事例の多くが仮想シナリオや実証段階のものである点も、実運用での知見を期待する読者にとっては物足りなく感じるかもしれない。

リスクと対策の節(1.8)がやや表面的に感じた。ハルシネーション、自律性の逸脱、マルチエージェント環境でのコンフリクトといった課題が列挙されるものの、具体的にどう痛い目に遭ったか、どうリカバリしたかという踏み込んだ話は少ない。せっかく日立グループの豊富な実践があるのだから、失敗から学んだ教訓がもっとあると説得力が増したと思う。

技術編の一部で、クラウドプロバイダー各社(OpenAI、Microsoft、AWS、Google Cloud)のサービス紹介がカタログ的になっている箇所もある。これは執筆時点(2025年9月)のスナップショットなので、読む時点では変わっている可能性が高い。

どんな人に向いているか

AIエージェントという言葉は聞くけれど、全体像がつかめていないエンジニアや企画職の人にとっては、概念・技術・事例をひと通り押さえられる入口として良い本だと思う。帯にある「とりあえずAIエージェントでどうにかして!と無茶振りされた人」向けというのは的を射ている。

逆に、すでに LangChainLangGraph を使ってエージェントを組んでいるような人にとっては、技術編の前半は既知の内容が多いかもしれない。ただ、評価設計やオブザーバビリティの章は実務で後回しにしがちな領域なので、改めて体系的に整理する機会としては有用。

一冊で「AIエージェントとは何か」から「実際にどう作り、どう運用するか」までカバーしようとする野心的な本で、その分、各トピックの深さにはばらつきがある。ただ、2025年時点でのAIエージェント開発の全体地図としては、日本語で読める中では最もまとまっている部類だと思う。

My avatar

Thanks for reading my blog post! Feel free to check out my other posts or contact me via the social links in the footer.


More Posts