ひろやす/伊藤(vnnc8158) 2025-08-21 15:07:14 |
JR News ミライ JR西日本グループ Release もっとつながる。未来が動き出す 2025年 8月20日 西日本旅客鉄道株式会社 生成AI技術を活用した画像解析ソリューションの開発 〜VLM×mitococaによる新たな社会課題解決への挑戦〜 JR西日本グループは、「長期ビジョン2032・中期経営計画2025」において、「イノベーションによる長期ビジョンの実現」を掲げ、新たな価値創造に取り組んでいます。その1つの柱が、当社グループが持つ技術やノウハウを活用し、鉄道という枠を超えて世の中の課題解決を果たす「アウトバウンド型のオープンイノベーション」です。 この取り組みの一環として、これまで画像解析AIをはじめとするデータソリューションを内製で開発し、鉄道分野だけでなく製造業や大規模施設など幅広い分野での活用を進めてきました。 現在、次なる技術展開として、生成AIを活用した新たな画像解析ソリューションの開発に着手しており、その内容をご紹介いたします。 1.開発の背景 〜画像解析AI「mitococa」〜 JR西日本は「アウトバウンド型オープンイノベーション」の取り組みのなかで、鉄道現場で培ってきたノウハウや技術を活用し、画像解析AI「mitococa(ミトコカ)」シリーズ※を内製開発してきました。 同シリーズは、駅構内や作業現場のカメラ映像から不安全行動や異常を検知し、安全性・生産性の向上に貢献してきました。現在では、鉄道現場にとどまらず、製造業や大規模施設など幅広い分野への展開も進めています。 ※ 製品情報:https://media.jrw-ip.jp/solution-product/solutions/5843/ 一方で、展開を進める中で、「mitococa」が人物や物体の検出に強みを持ちながらも、未学習の対象を検出できず、シーンや状況を踏まえた判断が難しいという課題が徐々に見えてきました。 2.生成AI「VLM」に着目 この課題に対応すべく、当社は生成AIの一種である「VLM」に着目し、新たな画像解析ソリューションの開発に取り組んでいます。 (1) VLM(Vision-Language Model)とは “視覚情報”と“言語情報”を統合的に処理できる生成AIモデルであり、世界中の画像と説明文を大量に学習することで、視覚と言語の両方にまたがる“意味”や“文脈”を理解することが可能です。 (2) 従来の画像解析AIとの違い ┌────┬─────────────┬───────────────┐ │ 観点 │ 従来の画像解析AI │ VLM │ ├────┼─────────────┼───────────────┤ │学習方法│あらかじめ定義したラベル※│画像と言語を組み合わせて │ │ │ ごとに個別学習 │ 大規模に学習済 │ ├────┼─────────────┼───────────────┤ │ 入力 │画像のみ │画像+問い(プロンプト) │ ├────┼─────────────┼───────────────┤ │ 出力 │枠やラベルなど定型的 │true/falseや文章など柔軟 │ ├────┼─────────────┼───────────────┤ │主な特長│学習済ラベルの検出は │未学習の対象にも対応、 │ │ │ 高速・高精度 │状況や背景を含めたシーンを理解│ ├────┼─────────────┼───────────────┤ │ 留意点 │新しいラベルは再学習が必要│処理負荷が高く、 │ │ │ │応答に時間がかかる場合あり │ └────┴─────────────┴───────────────┘ ※AIが画像から対象を識別・学習するための分類名(例:「人」「ヘルメット」など) 3.VLMを活用した画像解析ソリューション(特長) 日々、鉄道会社として現場の課題と向き合っている当社だからこそ、実務に即した視点を重視して開発を進めています。現場での使いやすさと解析精度の高さを両立するため、次のような特長を備えています。 (1) 必要な場面のみを選別 映像の静止画をすべてVLMで推論すると、処理対象が膨大になり、誤検出や負荷が増大します。そこで、VLM推論に必要な場面のみをあらかじめ抽出することで、低負荷かつ高度な解析を両立しています。 「mitococa」との連携で広がる活用領域 ケースに応じて、この前処理段階で「mitococa」を活用することで、人や物体を高精度に検出し、VLM推論の対象を的確に絞り込みます。これにより「mitococa」とVLMの強みを掛け合わせ、対応可能な課題領域を広げることが期待できます。 (2) “誰でも”使いやすいUI 現場業務に組み込みやすいよう、シンプルで直感的な操作画面にこだわっています。 ・プロンプトは簡単に入力可能 ・解析結果は画像やグラフで視覚的に表示 ・ログ記録やアラート表示、外部機器とも連携可能 4.想定ユースケース 本ソリューションは、鉄道分野にとどまらず幅広い現場で活用可能です。以下では、安全性向上や業務効率化、販促施策の高度化につながる具体的な想定ユースケースをご紹介します。 (1) 建設工事等、沿線作業箇所の自動検出 ● 課題 当社の沿線で建設工事などを行う場合は、事前連絡をいただき、社員が列車に添乗して現地を確認し、列車運行に支障がないかの確認をしています。 しかし、連絡がない作業は発見が難しく、見落としや対応遅れにつながるおそれがあります。加えて、現地確認には時間と労力がかかっています。 ● アプローチ 列車の前頭映像をVLMで解析し、事前にAIに学習させる必要なく、クレーンや足場など作業の兆候を自動抽出。 これにより、重点確認箇所を効率よく把握でき、現地確認の負担軽減と事前連絡のない作業の見落とし防止で、さらなる安全性向上が期待できます。 (2) 来店者属性の推定と可視化 mitococa連携 ● 課題 店舗や施設では、来訪者の年代や性別といった属性情報が十分に把握できず、商品配置や販促、接客方針が経験や勘に依存するケースも少なくありません。こうした状況では、施策が顧客層に合わず、販売機会の損失や顧客満足度低下につながるおそれがあります。 ● アプローチ 「mitococa」で人物を検出し、VLMが属性を推定。結果はUI上で集計表示され、容易に確認可能です。 これにより、来訪者層の実態を踏まえた施策立案と、その効果検証を効率的に行えるようになります。 今後は、社内外で実証を重ね、実用性と信頼性をさらに高めたソリューションへと磨き上げていきます。 ■その他の想定ユースケース ・保護具着用状況の自動検知 ・列車標識の異常検知 ・製造ラインの不良品判定 ・労災発生状況の自動検知 ・工作機械の稼働状況(待機/作動)モニタリング |
||
|