AIが社内で果たす多様な役割。リクルートのAI活用事例

このエントリーをはてなブックマークに追加

1月31日にレッジが六本木アカデミーヒルズにて開催した、『The AI 2018』

『The AI』とは
The AIとは、株式会社レッジ主催の、”今のAIを語る”大規模AIカンファレンスです。AIが世の中をこう変える、ビジネスを進化させるなどの抽象的な未来な話ではなく、具体的なコストは? 具体的に何ができるのか? など、今のAIを知る名だたる企業が登壇する大規模イベントです。
>> The AIの詳細はこちら

この中のリクルートテクノロジーズによるセッション、「リクルートにおけるAI活用とビジネス貢献の勘所」を今回の記事では、前半と後半に分けてレポートしていきます。

石川 信行
株式会社リクルートテクノロジーズ / シニアマネジャー
2009年リクルート新卒入社。グループ横断でデータの解析・利活用を推進するデータテクノロジーラボ部を指揮。

リクルートにおけるAIの歩みとは?

ーー石川
「リクルートのデータの利活用の原点は、Hadoopの導入です。HDSFというファイル形式で、音声や画像などの非構造データがたくさん蓄積されていました。こうしたデータをなんとか活用できないかと考えたのがきっかけです。」

ーー石川
「データの中でも多かった画像データを活用したのが、ネイルデザインのレコメンド。ネイルを認識しデザインを推定、似ているネイルをレコメンドできるシステムで、ここで初めてリクルートがディープラーニングに触れることとなりました。」

石川さん曰く、このプロジェクトのプロセスをフレームワーク化し、ほかの分野にも転用していったのがリクルートのAI活用の始まりなのだとか。リクルートグループ内で活用することによってノウハウが蓄積され、AI活用が社内で加速度的に進化してきたということなのですが、開発から運用まで一括でできるリクルートの規模と技術力も凄まじい。

ーー石川
「リクルート内でのAIの定義は『人が行なっていたパターン、行動を忠実に模倣するレベルにあるもの』です。そこで人間の作業をデータとアルゴリズムで再現し、代替し得るAPI群としてA3RTが誕生しました。」

そんなリクルートでのAI活用事例の内容を、語っていただけました。

事例1:95%の精度を実現! カーセンサーの画像解析事例


まずあげていただいたのは、カーセンサーという中古車情報を提供するサービス内の機能で、ユーザーが気になる車を撮影すると、その車種を教えてくれるというものです。もちろんこのサービスは当てずっぽうで開発された訳ではありません。

ーー石川
「きちんとカスタマーのみなさんからヒアリングし、街角で見かけた車が気になるとか、この車がどこのメーカーさんのものなのか分からないといった声に応えて開発しました。

カーセンサーにある多数の中古車の画像でモデルを作って、人気上位500車種で約95%の精度を実現することができました。」

95%の精度もさることながら、フィードバック機能も追加することで常に精度の向上が見込めるとのこと。
結果だけ見ると華々しいですが、実はこのプロジェクト一回失敗しているそうです。

ーー石川
「当時このアプリケーションは、精度が全然出ていなかったんです。
三年間精度を磨き続けてやっと日の目を見たという、リクルートでは珍しい事例です。
技術は日々進歩します。新しいロジックを順次適応し、内部できちんと技術検証してきた結果、このように日の目を見るところまでいけたわけです。」

こうした画像の持つ情報量の多さというのを利用することで、画像から式場を検索するというゼクシィのサービスも紹介されました。文字検索が今だと一般的ですが、こうした画像という頭の中のイメージと直接合致しやすい情報を検索に用いることで、ユーザーの検索行動がより感覚的になるのかもしれませんね。

事例2:ハイブリッドな校閲ロジックの実装。データ活用でリクルート社内の文章を正す


次に紹介されたのは、リクルートの持つ原稿校閲のロジック。この技術で注目なのは、ルールベース機械学習ハイブリッドであるということです。

ーー石川
「原稿校閲においてルールベースの方が精度が高い項目があるんですよね。そのほか取れないようなところに機械学習を使って、総合的に自動校閲を成しましょうというのがこのロジックです。」

両者の得意領域をあげると以下の通り。

ルールベースの領域

  • 日付の間違い
  • 電話番号の桁数の間違い
  • NGワードだけ引く
  • 機械学習の領域

  • 誤字脱字
  • 原稿内不一致
  • 矛盾
  • 表記揺れ
  • このように役割分担することで、校閲の精度を向上させています。実はもうリクルート内の7~8割のサイトで実装されているそうです。これを活用し、リクルート全体で文章の不備率が劇的に低下したのだとか。素晴らしい成果を残しているようです。

    ーー石川
    「気づきとしては、学習データが綺麗な状態の校閲後のデータしか蓄積されてなかったんです。本当は校閲する前のデータも欲しかったんです。
    そこでクラウドソーシングでわざと正しい文章から間違った文章を作ってもらい、学習させたといった経緯もありました。」

    やはり目的のための適切なデータの有無は、AI活用において肝要な部分になってくるわけですね。

    事例3:精度は93%! NGなクチコミをAIが自動検出


    次に紹介されたのが、クチコミの審査を自動化するといったものです。

    リクルートのサイト、特にホットペッパーグルメなどのライフスタイル領域のサイトにおいてクチコミは重要な情報源です。中には不適切なNGなクチコミも書き込まれてしまうため、それらを審査する必要があります。石川さんたちは、ここの作業を代替できないかと考えたわけです。

    このツールでは画像解析技術を転用したクチコミ評価のシステムを採用し、93%もの精度でNGなクチコミを検出することに成功したのだそう。
    しかし石川さんはここで、こんなことをおっしゃっていました。

    ーー石川
    「ただ作って実装するだけではだめなんです。なぜなら、クチコミの審査項目は日々増えていくから。さらに精度は100%には絶対ならないうまく継続的にこの精度を保つ仕組みを作ってあげないと、劣化していきます。
    なので間違ったことをフィードバックする機能もつけました。AIはまだ人間が補助をしてあげないといけないわけです。」

    システムを開発・実装だけでは不十分で、あくまでAIは人間を補助するものという認識を持ち、人間がそれを育てていくことが必須であるということですね。

    工数削減から、顧客へのサービスレベル向上まで。リクルートにおけるAIの多面的な役割


    石川さんがご紹介された事例を見ていると、リクルート社内で工数を削減する役目を果たすためのAIもありつつ、カスタマーのサービス体験の中に存在するAIもあります。そのどちらも「人が行なっていたパターン、行動を忠実に模倣するレベルにあるもの」という定義に乗っ取った、AIのあるべき姿だと言えます。

    社内にもサービスにもうまく実装されている、彼らのAI活用の勘所とは具体的にどういったところなのでしょうか?レポート記事第二弾に続きます。お楽しみに。

    >>後半はこちら