今日、ビッグ データの価値と利用方法が国際レベルで議論されていますが、さまざまなソースから収集および蓄積されるビッグ データを十分に活用できていないビジネスは少なくありません。そんな現状に一石を投じるのが株式会社データビークルの分析ツール スイートです。同社が提供する「dataDiver」、「dataFerry」、そして近日リリース予定の「dataSniper」はどのようなメリットを提供するのでしょうか。代表取締役の西野 啓 氏と技術部門の根津 智幸氏にお話をお伺いしました。
株式会社データビークル
代表取締役最高製品責任者 西内 啓(ひろむ) 氏 (写真左) |
株式会社データビークル
テクノロジーリード 兼 第一開発部プロダクトリーダー 根津 智幸 氏 (写真右) |
データビークルの概要について
―― まず会社の概要についてお教えください。
西内 創業は 2014 年の 11 月ですから、データビークルは 5 年目を迎えるベンチャー企業です。IT の営業畑出身の油野 (達也 氏、データビークル代表取締役CEO) と、かつて大学で統計学を研究したり指導していた私が、それぞれのミッションを実現しようと設立しました。私のミッションは元々研究していた統計学を、広く世の中で活用してもらえるようになることでした。一方の油野は、日本からグローバルに成功できるパッケージソフトウェア会社を作ることを考えていました。
―― 提供製品の特長は?
西内 現在の提供している製品は dataDiver と dataFerry の 2 つです。dataDiver は分析支援ツールとして、既存のデータをデータ分析用に加工するプロセス (データ プレパレーション) を自動化する拡張アナリティクスツールです。たとえば、ID-POSデータから優良顧客の特徴を見つけたい、となった場合に、顧客マスターや商品マスター、購買のトランザクションといったデータの関係性や型から考えられうるすべての説明変数/特徴量を作成した上で、自動的にモデリングを行ない、その結果何がどれぐらい関係してそうか、という関連性を自然言語で表示します。このような仕組みを通して企業の意思決定や、データから洞察を得るプロセスを自動化するわけですね。また、dataFerry は、さらにもう一歩このデータプレパレーションのところに踏み込んで、フォーマットを揃えたり、異常値を含むデータを自動的に除外したり、複数の項目の組合わせから新たな指標を定義したり、といった、データ分析やAI開発に必要なデータの作成を、プログラミングレスで簡単に行えるようなツールです。この 2 つに加えて、私たちが「マーケティング ROI 最大化ツール」として位置付けている dataSniper というツールを近日中に公開する予定です。これは統計的因果推論と呼ばれる手法を応用し、継続的な A/B テストを行ってマーケティングや営業活動におけるターゲティングと効果検証を繰り返すプロセスを自動化することを目指しています。
「dataDiver」と「dataFerry」がもたらす導入効果
―― これまでの導入実績は?
西内 大手では、NTT ドコモ、はるやま商事、ヤマハ発動機の各社様に加えて、変わったところで J リーグの川崎フロンターレ様に使っていただいています。NTT ドコモ様にはデータ サイエンティストがいるのですが、メインのビジネスである回線契約以外にも膨大な数のサービスを提供されているので、それぞれをグロースさせるためのデータ分析もたいへんな手間なんですね。そうした状況下でデータサイエンティストの方の生産性向上を目的としてご検討頂きました。はるやま商事様では、顧客向けのダイレクトマーケティングで使われています。はるやま商事さんに限ったことではないのですが、小売業の場合、購買データを適切に分析することによって、優良顧客の意外な特徴が発見されることがしばしばあります。そうした分析結果から考えられた一つひとつの施策の効果はゼロコンマ数パーセントから数パーセントというところです。つまり数百億円規模の事業であれば数億円ぐらいの伸びしろを作ることは特に難しいことではありません。また、グローバルにビジネスを展開するヤマハ発動機様では、国単位の市場の生産計画を最適化するために活用されています。川崎フロンターレ様では試合のチケット販売とマーケティングにご利用いただいていて、現在ではチケットの入手が難しくなったという話も耳にします。その日の試合がシーズンの何試合目か、対戦相手はどのチームか、現在の成績はどうか、天候はどうか、などといった要素を組み合わせて分析すれば、かなりの高精度でチケットの販売予測も行えるようになりました。
―― 正確なデータ分析によって大きなメリットが生まれるのですね。
西内 ビッグデータの価値と可能性については、かなり早い段階から多くの企業が目をつけていたのですが、実際にデータ分析を行うとなると専門の知識が必要になるということで、データサイエンティストに外注することになります。多くのコストと時間が必要になるだけでなく、外注先のデータサイエンティストは IT のスペシャリストなので、必ずしもデータを活用したいと考えている企業の現場やビジネスを熟知しているわけではありません。結果、分析のアプローチが違っていたり、分析や予測が十分に活用できるようなものではなかったりしたケースが少なくありませんでした。今までの分析業務フローでは少し条件を変えてやり直すだけで、 結果を確認するまでに1 か月待たされることも珍しいものではありませんでした。しかし、私たちのツールを使えば、会議中に見つかった新しい視点や条件でデータを改めて分析し、数分後にその場で報告することも可能です。
余談になりますが、2018 年のガートナーのレポートでは、「Citizen data scientist」と「Augmented data discovery」という用語が見られるようになりました。前者は私が掲げるミッションを言い表した言葉で、普通のビジネスマンによるデータ分析を意味します。後者は拡張データ探索などという訳語が充てられることがあるようですが、Citizen data scientist を実現するためのツールを指します。私たちがやっていることを上手く言い表す言葉が出てきたなと思っているところです。
Azure を介したクラウド サービスとしての提供
―― マイクロソフトとのかかわりについて教えてください。
根津 データビークルのサービスは当初からクラウド モデルですが、最初からマイクロソフトを利用していたわけではありません。設立当初は国内の小規模なプロバイダーを使っていました。その当時は十分だったのですが、事業規模が拡大してお客様のデータも増大するにしたがって限界が生じました。さらに機密性の高いエンタープライズ データを扱うようになったこともあり、規模とセキュリティの観点から Microsoft Azure に乗り換えました。それが 2 年ほど前ですが、ちょうどその時期に IoT データやビッグデータを扱う為のサービスが次々に提供された事もタイミングが良かったです。当社のサービスはお客様からは単なるアプリですが、バック エンドでは複雑なアルゴリズムが動いています。つまり、お客様側では、それほど高い PC スペックは必要ありませんが、バックエンドでは瞬発的に多くの CPU パワーとメモリが必要になります。Azure ではオンデマンドでリソースを利用できるので、コスト的に非常に助かっています。
また、私たちのアルゴリズムでは R という言語を使用しています。その R 言語のソフトウェアとサービスを提供する Revolution Analytics をマイクロソフトが数年前に買収して R の製品をマイクロソフト製品として提供するようになった結果、マイクロソフトのデータベースとの親和性が飛躍的に向上しました。エンジニアとして、これからも大きな機能向上が期待できると思っています。
西内 サポートも非常に優れていますね。
根津 当社のオフィスは (マイクロソフト本社がある) 品川駅の反対側にあるので、何か問題があればすぐにお邪魔しています (笑)。マイクロソフトのサポートはシステム レベルではなく、アプリやプログラム コード レベルで提供されるので非常に助かっています。他のベンダーであれば、システム側の担当者が「クラウド システムの制限があるので、このような仕様に従ってください」的なアドバイスがあるのですが、マイクロソフトでは、コード レベルで技術的なアドバイスを提供してくれるので製品開発を非常に効率的に進めることができます。
西内 マイクロソフトと協業する最大のメリットは、マイクロソフト自身が自社サービス・製品の最大のユーザーであるということだと思います。マイクロソフトは、システムベンダー、アプリベンダー、そして開発ツールのベンダーとしての立ち位置にあると同時にユーザーでもあるので、あらゆるツールがベンダー側ではなく、ユーザーの視点で構築されています。
根津 開発する立場としては、マイクロソフトのツールは相互運用性も高く、非常に使いやすいので有難いですね。
西内 私はメディアに出る頻度が多いのでマイクロソフトのイベントによく呼んでもらうのですが、その時にいろいろな方と名刺交換をする機会があったり、マイクロソフトのコールセンターから直接リードをいただいたりと、マーケティングの面でも非常に助かっています。
―― 今後の予定について教えてください。
西内 今年 (2018 年) の 12 月にメジャー バージョン アップを予定しています。先にお話しした「マーケティング ROI 最大化ツール」の dataSniper も、正式リリースではありませんが、そのときにお披露目を予定しています。
根津 以前はセキュリティの観点から 1 台のサーバーで 1 件のお客様のすべてのデータを管理していたのですが、Azure では認証の時点でセキュリティが保証されるようになりました。さらに、これからはリソースを適材適所的に分散させた複数のサーバーが協調して Azure 上で機能するモデルに移行する予定です。新しいモデルでは、システムの柔軟性とメンテナンス性が向上するとともに、コストも削減されると考えています。
西内 また、マルチユーザー機能も追加されます。今は 1 つのアカウントを複数のユーザーが共有していますが、これからはユーザー管理機能によってユーザーごとにアクセスできるデータを制限することが可能になり、チーム作業も効率化されます。アルゴリズムも高速化されて精度が向上します。
―― 最後にマイクロソフト パートナーへのメッセージをお願いします。
西内 現在、データ分析サービスを提供している企業様に加えて、これからデータ分析サービスを提供することをお考えの企業様もデータビークルのツールを活用してサービスを充実させていただければと思います。IT のノウハウは必ずしもデータ分析のノウハウではないので、IT スキルを持った企業様はデータビークルの分析ノウハウや分析エンジンを使って新しいレベルのデータ分析を実現することができます。
根津 12 月のバージョン アップでは、これまで一枚板の設計だった dataDiver がパーツ化されてコア コンポーネントが Azure 上で独立して機能するようになります。お客様はデータビークルのコア プログラムに独自のプログラムを直接接続できるので、より密接なコラボレーションが可能になります。例えば、お客様のデータベースから直接 dataDiver にデータを渡して分析後、結果をお使いの業務システムに書き戻し、Office 365 経由でレポートを確認する、といった仕組みが構築出来るようになります。
西内 Co-Sell の分野でのコラボレーションをお考えの企業様にもご検討いただければと思います。現在は、セゾン情報システムズ様と日立ドキュメントソリューションズ様とご契約いただいています。現在の分析サービス市場では、データサイエンティストの数が限られているので、データビークルのツールを活用して人的労力の省力化と効率化を行って分析サービスを向上させ、BI ツールの先にある可能性を探ることができると思います。
統計学とデータ分析を専門とする西内 啓 氏と NTT データを始めとして IT営業の第一線で 30 年以上にわたる経験を持つ油野 達也 氏によって 2014 年に設立。ビッグデータを実際に活用する際の障害となる「難解な ITツール」、「データ整備の煩雑化」、そして「打ち手を考えられる人材不足」という問題を解決し、「データサイエンスをみんなの手に」提供すべくデータ分析ツールおよびサービスを多様な業界に提供しています。