Micro Focusの2019年予測: 機械学習プロジェクトはデータサイエンスプロジェクトやイノベーションラボ内に留まらず、2019年には業界を破壊し創造する者によるフル活用へと進む

  • tono

人工知能、コグニティブコンピューティング、ディープニューラルネットワーク、拡張インテリジェンス、機械学習など、数多くの有望な技術が数十年にわたり私たちの世界で推移してきました。しかし、非常に重要な変化が起こっています。

「スマートコンピューティング」は、最新のコンピューティングテクノロジーと予測アルゴリズムが適応されているとしてもそれを活用するためには、学習に必要なデータの規模と範囲があります。現在は、ストレージコストが大幅に低下し、膨大な量のデータを保管することが経済的に可能になりました。過去のレポートではなく、予測的かつ先手をとる分析を実現するために、従来とは桁違いのスケールでコンピュータを「教えて訓練する」できる膨大な量の様々なデータが必要でした。一方で、このデータの爆発は、独自の課題をもたらします。

事実上、各業界のすべての企業に、イノベーションラボやデータサイエンティスト部門が関わる機械学習(ML)プロジェクトが存在します。これらのプロジェクトのほとんどは、強力な機能を提供するものの、ビジネス上の目標に関連するすべてのデータにアクセスできないという専門プラットフォームに依存しています。これらのデータはすべて、さまざまなデータウェアハウスおよびデータレイクに保存されますが、いずれもエンドツーエンドの機械学習を実行できず、専門プラットフォームへのデータ移行が課題です。

テラバイト単位、さらにはペタバイト単位のデータ移行には多くの時間と費用がかかります。特に重要なデータに個人情報(PII)が含まれていると、本当に危険なセキュリティリスクが発生します。

さらに、専門プラットフォームでは、処理できるデータの量に制限があります。そして、ダウンサンプリングとしてよく知られているデータのサブセットのみが、MLモデルのトレーニングおよびスコアリングに使用され、結果、精度が制限されます。

2019年には、現在の業界における破壊と創造者もしくはスマートな伝統的大手企業は、データを機械学習プラットフォームへ移行するのではなく、機械学習をすべてのデータに適用します。そしてデータがどこに格納されているかにかかわらず、利用可能なすべてのデータを活用し、そのデータを保護するセキュリティとガバナンスの恩恵を受けます。モデルトレーニングや評価に対応したRやPythonのようなML言語を統合する高度な分析プラットフォームを活用していきます。

このようなデータは業界のリーダーを決定的なものにします。彼らは正確性と遅延において妥協しません。意味のある対応をするためのデータ活用が遅すぎれば、正確な予測が役に立つことはありません。先駆的な企業は、医療機器の予知保全、パーソナライズされた顧客行動分析に基づく収益予測、不正行為の事前検知と予防など、さまざまなビジネスユースケースをリードしています。

そして、最も重要なことに、何が起こるかを知るだけで終わりではありません。先駆的企業は、エンドツーエンドML機能と統合したすべてのデータを活用してレコメンデーション事項を作成し、結果に影響を及ぼすために必要な対応を自動化していくでしょう。

※本記事は、ブログ記事「Micro Focus 2019 Predictions: Machine Learning Projects Will Move from Data Science Projects and Innovation Labs to Full Production Led by Industry Disruptors in 2019」を翻訳・意訳したものです。

原文はこちら

カテゴリ: