RAGを搭載した生成AIツール「SeekAI」を業務に活用 LINEヤフー株式会社

今回は、「Yahoo! JAPAN」等の幅広いインターネットサービスを提供しているLINEヤフー株式会社様にお話を伺いました。

プロフィール

LINEヤフー株式会社 インフラ統括本部 Developer Platform2本部 本部長

殷 雷(イン レイ)氏
SeekAI責任者。インフラ統括を主務とし、生成AIの活用を推進する生成AI統括本部でも開発PF系の部長を兼務。

LINEヤフー株式会社 生成AI統括本部 AI推進本部 推進2部 リーダー 

笹城戸裕記(ササキド ヒロキ)氏
生成AIを活用したサービス企画やプロジェクトマネジメントに従事。

LINEヤフー株式会社 インフラ統括本部 Developer Platform2本部  

図左 洋介(ズサ ヨウスケ)氏
社内向け生成AIアプリケーションの開発において、サービス構築から運用まで幅広く担当。

RAGを活用した「SeekAI」技術情報の問い合わせなどに使用される

Q:RAGを活用した生成AIツールである「SeekAI」 を社内で使用しているそうですが、「SeekAI」について教えてください。


A:「SeekAI」は、組織ごとに適したデータ管理を念頭に開発されており、独自のアプリを作成し、データを取り込んで独自の回答を生成することが可能な生成AIを活用したツールです。

ドキュメント検索に焦点を当てた機能を備えており、「この情報はどこにあるのか?」といったシンプルな質問に対し、一問一答形式で素早く応答するインターフェースが特徴です。

また、権限管理の仕組みを用いて、アプリを特定の部門のメンバーだけがアクセスできる設定にすることが可能です。そして、こうした限定された情報も安全に管理し、取り扱うことができます。

このような設定を可能にした理由は、部門ごとに展開したい情報には、その部門内でのみ共有すべきものが含まれることがあるからです。一方、全社向けの情報は、全ての従業員が一覧で確認できる形で提供されています。

Q:「SeekAI」のユースケースを教えてください。

A:ユースケースについてですが、エンジニアが多い会社であるため、最もよく利用されているのは社内の技術情報に関する問い合わせや課題解決に関する部分です。

加えて、他の部門でも幅広く活用されています。例えば、事業部門では、営業に関するコミュニケーションや利益に関する情報を扱うアプリケーションが使用されています。

また、各部門ごとに異なる申請フローや手続きに対応するワークフローがあり、それに基づいたマニュアルを活用して、部門ごとの手続きを支援するアシスタントとして役立てられてもいます

SeekAI 海外出張のユースケース例:

ただし、ビジネス上の高度なタスクについては、依然としてハルシネーション(幻覚)などの問題があり、現状では全ての要求に応じるほどの精度には達していない可能性があります。

POCで90%以上の精度を達成

Q:「SeekAI」を使用し始めた背景を教えてください。

A:社内には多くの情報があり、その管理や検索が難しいという課題がありました。そのため、以前からこの課題に真剣に取り組んできました。昨年、GPTが注目されるようになり、「この技術を使って改善できないか」と考え、1年半ほど前から技術的な検証を開始しました。

いくつかのPOCを行い、社内の協力者の助けも得て、一定の精度が確認されました。これで、業務に使えるという自信がついたのです。一般的にはこの技術の精度は正解率40〜50%程度だと言われていますが、当社のPOCでは90%以上の精度を達成しました。

Q:「SeekAI」について、モデルは何を使用しているのかを教えてください。

A:GPT-4oを使用しています。これは弊社ではマルチベンダーの方針に従い、最良のLLMソリューションを採用する方針だからです。そのため、現時点ではGPT-4oを使用していますが、今後さらに優れたモデルが登場した場合には、積極的に置き換えを検討します。

RAGの精度向上のためにチャンク品質を重視

Q:RAGの精度を上げるために重視した点を教えてください。

A:チャンクの品質を重視しました。もちろん、LLMの性能やデータベースのヒット率も影響しますが、特に重要なのは、ベースとなるチャンクの品質だからです。

具体的に言うと、LLMが扱えるデータ量には限りがあるため、それに合わせて文章を分割する際に文脈が失われることがあります。そのため、文脈を維持したままチャンクを作成することが非常に重要だということです

また、一定のハルシネーションはどうしても発生するため、情報の元となる資料を明示し、「こちらが元の情報ですので、確認してください」といった形で情報を提示しています。結果として、検索機能としての役割が強調されているという印象を与えるかもしれません。

生成AIソリューションの利用にeラーニングでの学習を必須にし最低限の知識を共有

Q:「SeekAI」の使用者による声を教えてください。

A:前提として、導入からまだ2ヶ月ほどしか経っておらず、全体公開も短期間です。そのため、現在はまだ基盤を固めている段階です。

そういった状況の中で、利用者アンケートからは、「情報の参照元が明記されているため情報ソースとして信頼できる」といった声や、以前から社内のイントラ検索に課題を感じていた方々から「より自然な形で課題解決の道筋が示された」と感動された声が寄せられています。

さらに、「社内のすべての仕組みをこのアプリから把握できるようにしてほしい」という要望もいただいています。

SeekAI_導入後の業務効率改善に関するデータ:

Q:社内での生成AIに関する教育について教えてください。

A:弊社の社内業務効率化ツールを利用するためには、eラーニングを通じて、一定の知識を習得する必要があり、最低限の知識はeラーニングで共有しています。

また、要望に応じて全社的なセミナーを実施しています。さらに、外部企業との連携を図りながら、社内教育用の動画コンテンツも作成しています。

マルチモーダル対応やフォーマットの拡充を進める


Q:「SeekAI」を使用してもらうために行なった事を教えてください。

A:他のソリューションを紹介する際に一緒に紹介していました。この形での紹介にとどまっていた理由は、大規模なデータを扱う仕組みを導入する際に慎重にローンチする必要があったためです。

しかし、現在では「思い切って使っても問題ない」という道筋が見えてきたため、今後はインナーコミュニケーションにも力を入れ、社内セミナーなどを積極的に実施していく計画です。

Q:生成AIに関して今後の展望を教えてください。

A:今後に関しては、システムを提供する側と利用する側の間で、常にたくさんの意見やリクエストをいただいています。それに対応しつつ、どのようなアップデートをしていくかを考えています。現在は、ロードマップを策定しながら、いただいた多くのリクエストに応じて、どれを優先するかを検討しているところです。

機能面においては、既存のデータソースを拡大し、マルチモーダル対応やフォーマットの拡充を進めています。また、他のシステムとの連携も強化しており、ドキュメントだけでなく、必要に応じてデータベースとの連携も進めています。

最後に、ようやく生成AIを使って社内データを活用し、どのようなことができるかが明確に見えてきました。さらにデータの管理方法や質問の仕方について知見を集め、生成AIを効果的に活用することで、弊社はより強力な企業へと成長していけると信じています。そのため、これからも積極的にこの技術を活用していきたいと考えています。

LINEヤフー株式会社様の公式テックブログでは、「SeekAI」の品質評価を行う仕組みを紹介していますので、ぜひ参考にしていただければと思います。