教員コラム

政治・経済・IT・国際・環境などさまざまなジャンルの中から、社会の話題や関心の高いトピックについて教員たちがわかりやすく解説します。

IT・デザイン

皆さんも「ビッグデータ」という言葉を耳や目にしたことは何回かあるかと思います。言葉自体は古くからありましたが、利用頻度が飛躍的に増えたのは比較的最近で、日本では2011年後半あたりからだと言われています。
「1,000件以上の購買履歴データ」のような明確な定義はありません。文字通り「大きなデータ」としか言いようがないのです。それも人間の情報処理能力では全体像を捉えきれないような膨大なデータです。件数で言えば最低でも数万単位、コンピュータの容量で言えばギガバイトないしテラバイト級のデータを指すと考えてください。紙に打ち出したら机の上どころか、部屋がパンクするような量です。
このようなデータが収集可能になったのは科学技術の飛躍的発展があったためです。科学技術の恩恵は多分野に渡ります。したがって、ひとくちにビッグデータと言っても、学問分野や産業によって、測定と収集方法、データの具体的な中身、適用される標準的な分析方法、知見の活用方法はさまざまです。素粒子物理学の加速器実験で収集されるデータも、ビジネスの世界で集められる個人の購買履歴データもビッグデータなのです。
新聞やビジネス誌で、ふだん話題になっているとき、念頭に置かれているビッグデータは「ソーシャルデータ」です。

日々増加するソーシャルデータ

実は「ソーシャルデータ」も明確な定義はありません。ここでは「私たちが生活を送る中で、情報端末などの電子機器を通じて収集されるデータ」を指すことにします。例えば、営業職の30歳独身男性(Aさん)の1日を仮想的に考えてみましょう。

「Aさんのある1日」

  • 朝はスマホのアラームで目を覚まし、スマホの新聞アプリを読みながら支度をした。
  • 通勤で使う駅の改札をスマホのタッチで通過し、電車の中でもスマホアプリでスケジュールやメールを確認しその日の予定を立て、少しあまった時間でSNSに目を通した。
  • 出社後は営業用のクルマで外回りにでた。昼休みを利用して通販サイトで気になっていた商品をその日は購入した。
  • 夕方に帰社し幾つかの事務処理を終え、定時をやや越えて会社を出た。
  • 夕飯は、グルメサイトで検索した会社近くの評判の居酒屋に同僚と立ちより、オンタイムで店と料理の感想をSNSにアップした。帰りは自宅近くのコンビニで、朝食用のパンと飲み物を電子マネーで購入した。
  • 帰宅後は、趣味のサッカーのニュースやブログを幾つかのサイトで閲覧し、就寝した。

私たちの生活行動は、インターネット接続のPCやスマートフォン、IC内蔵のポイントカードやクレジットカードを読み取る電子端末などで日々収集されています。Aさんの例だけでも、閲覧する新聞、利用路線と乗降駅、GPSによる移動情報、通販サイトの利用履歴と支払い口座、SNSの閲覧と発言傾向、食べ物の趣味、利用するコンビニと購買履歴、よく見るサイト等に関するデータが収集されています。このデータの集合体がソーシャルデータです。しかも、多くの場合、スマートフォンのような鍵となる端末のIDでヒモ付け可能です。
Aさんの例でいうならば、新聞アプリ利用の情報は新聞社に、SNSの利用はSNS運営会社に、というように、各データは別個に収集されますが、ヒモ付けることによってその人の生活をより広範に捉えられるのです。つまり、「誰が・いつ・どこで・何を・どうした」についての情報がより精密に収集可能になってきているのです。
ひとりの生活行動のデータが日々蓄積されるだけでなく、情報端末の利用者数も、企業が提供する新規のサービスやアプリも日々増加しています。アマゾンの元チーフ・サイエンティストのワイガンド氏によると、現在、世界規模で約10億人がソーシャルデータを生み出し、データの「量」は18ヶ月でほぼ倍増するそうです。単純計算だと5年後には今のほぼ10倍、10年後は約100倍のデータ量になるのです。この傾向は暫く続くでしょうし、生活行動のどの範囲までデータ収集されるようになるかは想像もつきません。
ところで、データが溜まっただけで喜んで良いのでしょうか?

ソーシャルデータは何もしなければただのゴミ

ソーシャルデータは、有益な情報に転化しないかぎりただのゴミです。それどころかコンピュータシステムの容量を指数関数的な勢いで占領するガンと言っても良いでしょう。有効活用しなければ役に立たないという点で、石油のような地下資源と同じです。
つまり、各社に分散されているローデータ(生のデータ)から必要なデータをそれぞれ取り出し、統合し、利用可能な形に加工修正しないかぎり、単純な分析もできないのです。基となるローデータが分散しているのですから、この観点からするとビッグデータはローデータという「スモールデータの集合体」とも言えます。したがって、ビジネスとして、スモールデータを収集するためのデジタル端末やサービスを提供する事業者、巨大な情報ネットワークを構築するためのハードウエアないしソフトウエアを提供する事業者が、これからますます増えていくでしょう。
しかし、これらの事業者が有効に機能しても「利用可能なデータが整った」だけです。この状態でもソーシャルデータはただのゴミです。あくまでもスタート地点です。ここから分析によって何かの知見を得て、日々の業務に活用するための仕組みを作らなければならないのです。

データマイニングで発見する

利用可能になったデータは「データマイニング」して、知見を得ようと試みるのが一般的です。つまり、ビッグデータとデータマイニングはワンセットで考えるべきなのです。
データマイニングとは、膨大なデータから新たなパターン(知見)を発見するための探索的な分析の総称です。マイニングは掘るという意味なので、平たく言えば「データ掘り」です。また、名詞形のマイン(mine)には宝物という意味もあるので、掘り当てた宝物を役立てるための仕組みを作り、日々更新されるデータによってその仕組みをつねに改善するという過程までを含みます。ビジネスの世界では、90年代後半あたりからマーケティングと金融工学の分野で積極的に導入されてきました。
代表的な分析手法のひとつに「アソシエーションルール」の分析があります。2個以上の事柄の関連性(アソシエーション)を調べる分析です。例えば、「商品Bと商品Cが同時に買われることが多い」のような関連性です。成功した有名な実用例は、アマゾンのレコメンデーションシステムです。商品の閲覧時に、そのページの下で「この商品を買った人はこういった商品も見ています」と、関連のお薦め商品一覧を見せる仕組みです。これはその商品の閲覧者の過去の閲覧履歴、購買履歴、個人情報などから、その人と同様の人たちの購買パターンを基に提示しているのです。
応用範囲はレコメンデーションシステムに留まらず、行動ターゲティング広告の出稿にも有益です。みなさんも友達と同じサイト(例えばFacebook)へアクセスして、互いにどのような広告が提示されているか確認してみると面白いかもしれません。もし同じ広告ならば、消費者特性(友達だからほぼ同じでしょう)だけでなく、その他の行動パターンが似ていると判断されたからでしょうし、違う広告ならば、何かの行動がはっきりと違うからかもしれません。
このようにビッグデータとデータマイニングによって、個人の細かなニーズに対応した商品の提示や、極めて効率的な広告出稿などがマーケティングの世界で可能になってきています。

ビッグデータとマーケティング

上はごく一部の例で、ビッグデータがマーケティングを大きく変えていくことは間違いありません。
レコメンデーションの提示、行動ターゲティング広告の出稿、クーポン配布など、企業から消費者への具体的な働きかけを「マーケティング戦術」と言います。そしてビッグデータは、自動的ないし半自動的に、極めて効果的なマーケティング戦術を策定する強力なツールになっているのです。
マーケティングは、私たちの生活を支える有形財ないし無形財の売買を効率化するための仕組み作りです。日々の生活そのものに大きな影響を与えます。つまり、ビッグデータはマーケティングを大きく変え、間接的に私たちの生活も変えていくのです。
今後、ビッグデータがどの範囲まで及び、その有効活用によってどのような変化と恩恵をもたらすかは全く予測できません。いまの私たちが想像できない世界がもたらされるということが、ただひとつ正しく予測できることです。

【参考文献】

  • M.J.A.ベリー&G.S.リノフ(2006)『データマイニング手法2訂版』海文堂、江原淳ら訳
  • A.ワイガンド(2017)『アマゾノミクス』文藝春秋、土方奈美訳
  • 佐藤一郎(2017)「企業間アライアンスの前に見直したいビッグデータ活用の理想と現実」『宣伝会議』2017年12月号、24~27頁
  • 佐藤洋行(2013)「データサイエンティストに必要なスキル」『データサイエンティスト養成読本』技術評論社、2~11頁

解説者紹介

櫻井 聡