機械学習の民主化がもたらすマーケティング分野でのAI 活用:DataRobot 中野高文さんに聞く

機械学習の民主化がもたらすマーケティング分野でのAI 活用:DataRobot 中野高文さんに聞く

運用型広告レポート作成支援システム glu グルー

機械学習と身近な運用型広告の世界

Google DeepMind 社が開発した AlphaGo が囲碁の世界チャンピオンに勝利したことは記憶に新しいところですが、運用型広告の世界においても AdWords の「スマート自動入札」や「来店コンバージョン」の計測などに機械学習の機能が活用されており、ますます身近なものとなっています。

 

一方で、広告運用者にとって、「AI」や「機械学習」が活用されているのはプラットフォーム側の、言わば「むこう側」であり、実際にどのようなアルゴリズムが働いているのかが見えにくく、どうしてもブラックボックスのように捉えられてしまうことも事実です。

 

そこで、今回の Unyoo.jp 特別対談では、2017年に行われて好評を博しました、「Unyoo.jp Meetup vol.11 機械学習に寄り添う」でご登壇いただいた DataRobot の中野高文さんに、マーケティングの領域でどのように「AI(人工知能)」「機械学習」を使えば良いかをインタビューしてきました。

 

技術の進化にともなって今後も大きな変化が続いていくであろうデジタルマーケティングのあり方について、少しでもご自身なりの輪郭を掴む一助になれば幸いです。

 

話し手:DataRobot Japan株式会社
データサイエンティスト 中野高文さん

 

聞き手:アタラ合同会社
テクノロジーコンサルティング事業部
チーフコンサルタント 杓谷 匠

 

※このインタビューは2017年12月に行われました。

 

杓谷:まずは中野さんの自己紹介をお願いします。

 

 

中野:DataRobot の中野と申します。2017年に6人目のメンバーとして DataRobot Japan に入社しました。社内2人目のデータサイエンティストとして、弊社の価値をお客様に知っていただくためのプリセールス面・ポストセールス面でのテクニカルな部分を担当しています。

 

プリセールス面では昨今AIを使ってみたいというお客様が多いので、弊社がフォーカスを置いているビジネスのコアな問題をフィルタリングするというプロセスを非常に大事にしています。近年は深層学習(ディープラーニング)・画像認識がニュースで非常に大きく取り上げられ、それを使えば何でも解決できるとお考えの方もいらっしゃるかもしれませんが、現在ビジネスで実際に利益をもたらすAI活用の8割以上の問題は深層学習・画像認識でない機械学習が解決できる問題であると言われています。DataRobotとしては現在そのコアな問題にのみフォーカスしており、DataRobot が解決できる問題で実際にビジネスでリターンをもたらす問題をお客様が持っておられるかという部分を注意して見ております。

 

ポストセールス面では、 DataRobot を使ってモデルを作るのみならず、それを実際に運用して価値を上げると行った所まで含めてご提案しています。例えばモデルを作ってみても、実際に使ってみると危ないモデルやモデルの精度は良いけれども事業に活かせないというモデルもあります。顧客の解約予測モデルを作りたいというお客様の場合、実際に解約を防止できる手段が存在するのか、そしてそれらがモデリングの変数として利用できるかと行った所ですね。そうでないと、100発100中の解約予測モデルができても何も対策アクションを取ることができず、指を咥えてみているだけという結果に終わってしまいます。

 

お客様の持つビジネス課題をどう解決していくのかをご提案するという意味では、営業的な側面もあり、同時にモデルの精度改善のアドバイス・モデリングを行なったりと非常に多岐にわたる仕事です。

 

物理学から広告業界、そして DataRobot へ

 

杓谷:中野さんご自身は、どの段階で機械学習に興味を持たれたのでしょうか?

 

中野:学生時代はひたすら物理と数学を学び、量子コンピュータを作る量子情報論を専攻していました。現在のインターネットのセキュリティーの元となっているRSA暗号というものがあって、現在のコンピューターでは計算するのに億年単位の時間がかかってしまうんですよ。しかし量子コンピューターを用いるとすぐに計算できてしまうんですね。そのように理論的な点では非常に面白いのですが、それを実際に実用化するというところに大きな壁があって、もう少し現実的でビジネスに活用できるような事をしたいと考え、ウェブ解析などを始めて CRITEO 株式会社に入社しました。

 

Criteo はディスプレイ広告として非常に性能が良く、アルゴリズムは全て機械学習のモデルに基づいています。同時に、アトリビューション分析や売上予測、新規リード、営業ターゲティングなども適用可能だということを知り、機械学習を本格的に始めました。

 

杓谷:DataRobot に興味を持つきっかけはなんだったのでしょうか?

 

中野:機械学習はテクニカルな部分が往々にしてあり、どうしてもRあるいはPythonといったプログラミング言語でのコーディングが必要になります。同時にアルゴリズムの理解にも高度な数学・統計の知識が必要です。近年は特にどんどん新たな手法も出てきているので、そうした全ての情報をキャッチアップするのはデータサイエンティストでも大変な作業です。

 

しかし機械学習をビジネスで活用する際にそうした知識はコアな部分ではないのです。本当に大事なのはビジネスの本質を見極め、それらの中で機械学習で解決できる問題を選択し、実際に事業で生かされる様に実行していくというインパクトの部分に集中したいといった思いが常にありました。

 

弊社のシバタアキラ(DataRobot Japanで最初のメンバー)と会いデモを見てDataRobot がそうした事を可能にしてくれるプラットフォームだと知り、素直に「すごいな!」と思いました。面倒なコーディングなどなく、ビジネスに活かすという一番大切な本質に迫るプラットフォームだという点にとても惹かれました。

 

杓谷:機械学習は運用型広告の世界でも様々な領域で活用されていますが、マーケティングの現場ではどのように使われているのでしょうか?

 

中野:まず機械学習にも様々な種類があります。その中でも DataRobot は「教師あり学習」に特化した機械学習です。「教師あり学習」とは、過去のデータをもとにパターンを導き出し、新しいデータを入れた場合、過去のパターンから未来を予測するというものです。

 

 

具体的には、どういった人がウェブサイトでコンバージョンしたのかというデータ(ユーザーの肩書、サイト上での行動履歴、どういったチャネルで来訪したのかなど)をもとに、今後のコンバージョンユーザー、購買しない人の予測が可能です。あるいはどういった人がバナーをクリックするのか、どういったバナーを出せばクリックされるのか、といったことのレコメンドも可能です。

 

杓谷:広告業界にいらっしゃったご経験のある中野さんから見て、オーディエンス分析に機械学習を使うことは、もう当たり前に普及しているのでしょうか?

 

中野:日本でもアーリーアダプターはもうそういった分析をされて、非常に大きなインパクトを出されています。ただ私の肌感覚的には AdWords などの広告プラットフォームに任せてしまっているマーケターの方もまだまだ多いと思います。こうしたプラットフォームですと入れられる情報には限りがあり部分的な情報になっているため、本当のニーズを汲み取ることは難しくなります。やはりCRM、購買情報、Webでの情報など全ての情報を分析することでユーザーが真に欲するものを理解することが出来ます。そのような分析を行う場合、広告プラットフォーム上での1機能ではどうしても追い付かず、機械学習専門のプラットフォームを使う必要があると思います。

 

また、そうしたプラットフォームでは利用するモデルもルールベースの非常に単純なもの、あるいは逆にブラックボックスで中で何が起こっているかわからないものになりがちです。マーケターが次のアクションを決定する際にはモデルを理解して、ユーザーの心理を理解する必要があります。そのためにも、精度が良く理解できるモデルを利用することが大事だと思われます。

 

杓谷:オフラインやブランディングに強みを持つ広告主では機械学習の活用は進んでいるのでしょうか?

 

中野:そうですね。昔からマーケティングミックスモデルなどでは時系列の分析が伝統的に行われてきたと思います。マス媒体では情報を一元化したプラットフォームがないため、広告を全部代理店さんに委託するにしても、実は代理店さんが裏でモデル分析を行ってきたという伝統があると思いますね。

 

杓谷:そういった意味ではマーケティング領域に機械学習が使用されていくのはまさにこれから、ということですね。

 

機械学習を民主化する DataRobot

 

 

杓谷:それでは具体的にDataRobot さんのプラットフォームを活用してどのような分析ができるか実際にサンプルとなるデータを用意していただきましたので、見てみましょう。

 

中野:今回のデモでは、金融業界の広告主が個人ローンを一般消費者に販売する際のマーケティングを想定しています。過去に個人ローンを購入した顧客に新たな個人ローンの購入を勧めるマーケティングキャンペーンといったものは定期的に行なわれていますよね。しかし、むやみに行うとユーザーからのメール拒否などにもつながりますし、ダイレクトメールはコストもかかります。そこでどういった人が買いそうか、または買わなさそうか、同時にEメールやダイレクトメールを打つとどれぐらい購入確率が高くなるかを予測するモデルを作ります。

 

まず最初に、DataRobot に入れるデータ(教師データ)として、過去に個人ローンを購入した一人ひとりのユーザーの情報(年齢・職業・未婚既婚など)をCRM情報などをもとに入れます。次に、もともとローンを借りたことがあるか、購買後のフィードバック情報なども入れます。

 

加えて、個人ローンという商材の特性上、一般的な形質的な情報や、前回キャンペーンでEメールやDMを送ったかどうか、そしてその結果、個人ローンを買ったかどうかという結果の情報も入れます。DataRobotが行うのは、こうした情報を元に購入する人及びマーケティングの影響パターンを学習し、今回のキャンペーンで様々なマーケティングを行なった際にローンを購入する確率を予測するという作業です。

 

実際にインプットするデータ
 

杓谷:一人ひとりがどの程度の確率で買うかどうかを機械学習の力を借りて予測していくわけですね。実際には、ここまでデータが整っていないお客様もいらっしゃるのではないでしょうか?

 

中野:基本的にCRM情報とマーケティング情報を繋げられるお客様でしたら、こういった予測は可能です。最近は別々に持っていたマーケティング情報とCRMを、DMPで統合して活用される例が非常に多くなってきているので、ハードルはかなり下がってきているのではないかと思います。

 

杓谷:つまり、DataRobotさんで分析を始める前に、こうした粒度でデータを準備する必要があるということですね。しかしデータさえ用意してしまえば、ここまでの予測ができる。

 

中野:これまでのマーケティングでは「多分こういう人がコンバージョンに繋がりやすそうかな」といった、担当者の匙加減や肌感覚に拠る部分が大きかったのではないかと思います。しかし、機械学習を使うと「この人は40代でこうした経歴があり、大企業で働いているから、これだけの確率でコンバージョンに繋がる」といった具体的な事までわかります。つまり、個々のユーザーにカスタマイズしたコンバージョン確率が出せるようになります。

 

今回のようにDMを送った際に買うのか買わないのかを予測したいのであれば、何%の確率で買いそうか、という部分まで結果予測が可能です。今回は約1万人のデータにおいて10%程度の人が個人ローンを買っているという過去データを使っています。

 

データがアップロードされると、DataRobot 内ではそれぞれの変数を読み、それが数値なのかカテゴリなのかまで自動で分析します。同時にDataRobotでは日本語のテキスト分析にも対応しており、日本語の文章をそのまま入れていただくと、単語単語に分解してそれぞれの重要度をみるといった分析も行います。さらに、IDなど一般的に分析に不要なデータも自動的に判別し、自動でモデリングに使う変数から除外してくれます。

 

シンプルに言うと、最初に教師データでモデルを作り、新しいデータ(結果がわからないデータ)を入れた際に、モデルを使って結果を予測するというプロセスをたどります。

 

DataRobot では1000~2000のアルゴリズムを持っており、該当データを入れた際に、数あるアルゴリズムの中から最適なモデルを自動で作るというのも大きな強みです。これまではデータサイエンティストが作った場合、数週間かけて2、3個のモデルを作るのが精いっぱいでした。しかし実際には、その2、3個のモデルが最適とは限らないし、たくさんのモデルを作るには時間もリソースも割く必要がある。DataRobot ならば文句ひとついわず、どのアルゴリズムが最適なのか時間をかけずに短時間で、かつ自動で検証してくれます。

 

杓谷:機械学習モデルごとに得意・不得意があるということでしょうか?

 

中野:シンプルなデータであれば線型モデルで充分ですが、「年齢が〇歳、こういう趣味があるから、これを買う」といった複雑なパターンだとGBM (Gradient Boosting Machine : 勾配ブースティングマシン) などが有効ですし、得手不得手はデータによって変わってきます。

 

分析中の機械学習のモデル一覧
 

杓谷:様々な機械学習のモデルがプリセットされていて、データによって最適なアルゴリズムを選んでくれるわけですね。どのアルゴリズムが最適だったかというのは、どこを見ればよいのでしょうか?

 

中野:DataRobot では答えがわかっているデータの一部(検定データ)で答え合わせを行なって、検定データで正しく予測できる割合が多いモデルから順に表示されるようになっています。このリーダーボードと呼ばれる順位表によってどのモデルが最適だったのかがわかります。

 

杓谷:それぞれのアルゴリズムごとの分析結果はエクスポートできるのでしょうか?

 

中野:はい。それぞれのアルゴリズムごとに様々なインサイトが用意されており、全てエクスポート可能です。

 

予測結果に影響を与えた要因
 

例えば、モデルを作る際には様々な変数があるのですが、その中で予測に大きな影響を与える重要な変数も確認できます。今回の例では「顧客のフィードバック」(テキスト)がもっとも重要だと出ているのでそれを詳しく見ていきましょう。

 

 

Refused(拒否された)、told(言われた)、charge(請求)といった濃い青のワードを使ったフィードバックを返しておられる方ほど追加でローンを購入する確率が低く、逆にimmediately(すぐさま)、helpful(助かった)、resolved(解決してくれた)といった濃い赤のワードを使っている方ほど購入確率が高いということがわかります。こちらを見ていただくとどのようなキーワードを使ったフィードバックをされた顧客が追加のローンを購入しやすいのか一目でわかります。これらを確認しながら不必要な変数は削除し、効果がありそうな変数を新たに追加してみるといった形で様々なデータをどんどんくっつけていただくのが一番良いと思います。

 

通常、モデルの構築は1回では終わりません。一度データを入れてみて、そのデータを理解しながらPDCAを回し、どんどん良いモデルを作っていくというサイクルがあります。一旦モデルを作ってみて、インサイトを見ながら次はどうするか、あるいは不要なデータを削るといった事がすぐにできてしまうのが、DataRobot の強みかなと思っています。

 

分析結果
 

杓谷:これらの結果を、一人ひとりの単位にどのように出すことができるのですか?

 

中野:まず一人ひとりに対するキャンペーンでの購入確率を予測することができます。見ていただくと30%の確率で購入する人もいれば、4%でほとんど購入する確率の無い人もいます。

 

杓谷:今回の例だと、一人ひとりの結果によってとるアクションも変えられそうですよね。

 

中野:単に数値だけ見せられても現場の方は納得しづらいでしょうが、DataRobot では何故その人がその確率で購入するのかまで説明することができます。具体的には、78%の確率で買う人は、Eメールを送付しており、しかも国債利回りが低い(つまりローンが安い)時期に購入しており、最終コンタクト日が近いために購入する確率が高いということですね。確率の低い例だと顧客のフィードバックの際にクレームがついていたり、ネガティブな事を担当者に言われた、などと出ており非常に納得できる内容となっています。

 

 

杓谷:テキスト情報の内容がネガティブかポジティブかまで数値化できるのはすごいですね!

 

中野:DataRobot ではテキストデータの分析が可能なので、フィードバックなども分析に取り入れられます。具体的にはどういうキーワードがユーザー心理にどう働くかをすべて数値化しています。ポジティブだと赤色、ネガティブだと青色で表示されます。これは広告分野だけでなく、製造業や企業の事業予測などにも使うことができるため、非常に汎用性があります。

 

杓谷:画像の分析は可能ですか?

 

中野:画像を直接入れていただく事はできませんが、入れる前に画像を処理し、ベクトル化し数値化すれば読み込み可能です。同様に、音声もテキストまたは数値に変換する必要があります。

 

一旦テキストまたは数値に置き換えることができれば、コーディングや統計について何もわからなくても簡単に使っていただけるという点が、現場の運用者の方には使いやすいのではないかと思います。

 

杓谷:例えばPOSデータや天気データを溜めて、それに合わせて動的にクリエイティブを変えるといった事を大手企業ではやり始めていますが、DataRobotと組み合わせれば自動でそれぞれのユーザーに対する最適なメッセージを出し分けるということも可能になりそうですね。

 

中野:ウェブサイトでどんなものを出すか、どんなフォントの色が良いのかといったクリエイティブをユーザーごとに最適化するといった部分にまで、DataRobot は使えます。

 

広告運用者が注力すべきはクリエイティビティ

 

 

杓谷:広告の中ではすでにやってきた事ですが、それがウェブサイトにまで波及したら面白いですね。中野さんから見て、これからの広告運用者はどの領域に注力していくべきだと思いますか?

 

中野:やはりクリエイティビティ(=創造性)ではないでしょうか。AIは過去のマーケティングデータより常勝パターンを教えてくれますが、全く新たなクリエィティブを作ったり、バズマーケティングを思いついたりすることはできません。ユーザーの心理を理解して、その動かすような新たな手法を思いつくような事はやはり人間にしかできないことだと思います。今後はルーティーン化された運用はどんどんAIにより自動化されていくと思います。その中で自動化できないスキルをもった広告運用者の価値が上がっていくと思います。

 

杓谷:結局、どれだけ優秀でもAIが予測できるのは過去のデータからなのであって、次に何をするのか、それを人間が考える必要があるということですね。

 

中野:それがAIが真似できない、人間の強みだと思います。マーケターがユーザーにカスタマイズできるパターンには限界があり、ユーザー一人一人の行動履歴をみて予測できるAIには敵いません。そうしたユーザーごとにカスタマイズして分析するといった部分はAIにどんどん任せていけば良いと思います。

 

杓谷:本当に早くそういう環境が整うと良いですね。本日はどうもありがとうございました!

 

 

広告配信の最適化に関しては AdWords や Facebook などのプラットフォーム側がすでにふんだんに活用していますが、これからは「誰」に「何」を見せるか、といったことがより重要になってきており、マーケターは DataRobot のような機械学習プラットフォームを使って分析をすることが当たり前になってくるのではないかと思います。

 

来るべき世界に備えて、ユーザーのデータを綺麗に整えてくとともに、機械学習を使った分析がどんなものなのか、イメージを掴んでおくことが重要となると思います。このインタビューが読者のみなさまの理解の一助となりましたら幸甚です。

【運用型広告のトレーニング、スキルアップ、リスキリング、必要ですか?】

✓社内の知識を醸成するため、Google 広告などの運用型広告のトレーニングをしてほしい
✓Cookieレス、ファーストパーティデータ、リテールメディアなど最新のトレンドについて知りたい
✓広告代理店のマネージャーとして知っておくべきことを吸収したい
✓ハウツーに止まらない本質的な考え方から身につけたい
という方は、まずはライトな相談から
支援内容とお問い合わせはこちらをクリック

Related posts

Top