オラクル、400TBのワークロードにおいてSnowflakeの17倍、Redshiftの6倍高速なクエリ性能を提供する「MySQL HeatWave Lakehouse」を発表

この記事は約12分で読めます。
オラクルは本日、「MySQL HeatWave Lakehouse」を発表しました。お客様は、CSVやParquet、AuroraおよびRedshiftのバックアップなど、各種ファイル形式でオブジェクト・ストアに保存されている数百テラバイトのデータに対して処理およびクエリ実行ができるようになります。「MySQL HeatWave Lakehouse」は、単一のMySQLデータベース内にトランザクション処理、アナリティクス、機械学習、機械学習をベースとした自動化を組み合わせた唯一のクラウドサービスである「MySQL HeatWave」ポートフォリオに追加される最新の製品です。
Press Release

オラクル、400TBワークロードにおいてSnowflake17Redshift6倍高速なクエリ性能を提供するMySQL HeatWave Lakehouse」を発表
オブジェクト・ストレージから400TBのデータを、Redshiftの8倍、Snowflakeの2.7倍高速にロード可能

最大512ノードに拡張でき、オブジェクト・ストア内のAuroraおよびRedshiftのバックアップなど、複数ファイル形式の数百テラバイトのデータを処理

Oracle CloudWorld, ラスベガス – 20221019

(本資料は米国2022年10月18日にオラクル・コーポレーションより発表されたプレスリリース https://www.oracle.com/news/announcement/ocw-oracle-announces-mysql-heatwave-lakehouse-2022-10-18/ の抄訳です)

オラクルは本日、「MySQL HeatWave Lakehouse」を発表しました。お客様は、CSVやParquet、AuroraおよびRedshiftのバックアップなど、各種ファイル形式でオブジェクト・ストアに保存されている数百テラバイトのデータに対して処理およびクエリ実行ができるようになります。「MySQL HeatWave Lakehouse」は、単一のMySQLデータベース内にトランザクション処理、アナリティクス、機械学習、機械学習をベースとした自動化を組み合わせた唯一のクラウドサービスである「MySQL HeatWave」ポートフォリオに追加される最新の製品です。

大規模な並列スケールアウトが可能なMySQL HeatWaveのアーキテクチャにより、「MySQL HeatWave Lakehouse」は、クエリの実行とデータのロードにおいて、競合クラウド・データベース・サービスより大幅に優れた性能を提供することが業界標準ベンチマークによって示されています。また、お客様はMySQLデータベース内のトランザクション・データとオブジェクト・ストア内のデータを標準のMySQL構文で、一つのSQL文で結合できます。オラクルはまた、「MySQL HeatWave Lakehouse」の性能を向上させ、より使いやすくするために、「MySQL Autopilot」の新機能も発表しました。「MySQL HeatWave Lakehouse」は、現在ベータとしてお客様に提供されており、2023年前半に一般提供が開始される予定です。

AWS、Google、オンプレミスから移行するお客様は、マーケティング・アナリティクス、特に広告キャンペーン・パフォーマンスのリアルタイム分析や効果的なキャンペーンを構築するための顧客データ・アナリティクスなど、さまざまなユースケースに「MySQL HeatWave」を利用してきました。AWSから移行するお客様には、自動車、通信、小売、ハイテク、医療業界のリーダー企業が含まれます。

オラクルのチーフ・コーポレート・アーキテクトであるエドワード・スクリーベン(Edward Screven)は次のように述べています。「『MySQL HeatWave』は、長年の研究と先進的な開発の成果であり、すべてのMySQLユーザーにとって、より大きな課題に対応するための画期的なイノベーションになろうとしています。この『MySQL HeatWave Lakehouse』の発表は、『MySQL HeatWave』において今年3回目の大きな発表となります。データベース以外に保存されるデータは大幅に増加しています。『MySQL HeatWave Lakehouse』を利用することで、お客様はオブジェクト・ストアに存在するデータに対しても『HeatWave』のすべてのメリットを活用できます。今回の発表で、『MySQL HeatWave』は、トランザクション処理、データウェアハウスやデータレイクを横断するアナリティクス、ETLを必要としない機械学習を単一の統合サービスとしてマルチクラウドで提供します。この組み合わせにより、性能、自動化、コストを大幅に向上し、『MySQL HeatWave』は他のクラウド・データベース・サービスと一線を画す存在になります。」

オラクルは、新しいレイクハウス・ベンチマークも公開し、「MySQL HeatWave Lakehouse」と「MySQL Autopilot」の革新的な機能を紹介しています。

ベンチマーク
・SnowflakeAmazon Redshiftよりも高速なクエリ性能とデータ・ロード
完全に透過的で、一般公開されている400 TB TPC-H*ベンチマークによって示される、「MySQL HeatWave Lakehouse」のクエリ性能は以下のとおりです。
 ◦Snowflakeの17倍高速 
 ◦Amazon Redshiftの6倍高速 

オブジェクト・ストアから「MySQL HeatWave Lakehouse」へのデータのロードも極めて高速です。400 TB TPC-H*ワークロードでの「MySQL HeatWave Lakehouse」のロード性能は次のとおりです。
 ◦Amazon Redshiftの8倍高速 
 ◦Snowflakeの2.7倍高速

これらの完全に透過的なベンチマーク・スクリプトはすべて、お客様が複製できるようにGitHub( https://github.com/oracle/heatwave-tpch )で公開されています。

MySQL HeatWave Lakehouse」の革新的な機能
・より大規模なデータ・サイズ、標準のMySQL構文:「MySQL HeatWave Lakehouse」では、お客様は最大400TBのデータのクエリを実行でき、「HeatWave」クラスタは最大512ノードに拡張できます。お客様は、データのクエリに標準のMySQL構文を利用できます。
・同一の性能と圧縮:10TB TPC-Hと30TB TPC-Hの両方のベンチマークで示されるように、「MySQL HeatWave」は、MySQLデータベース内に保存されているデータとオブジェクト・ストア上のデータに対して同じクエリ性能を提供します。さらに、1ノードあたりの圧縮量と処理可能データ量も両インスタンスで共通です。
・複数ファイル形式のサポート:「MySQL HeatWave Lakehouse」を利用するお客様は、CSVやParquetなどの各種ファイル形式で保存されたデータやAWSのAuroraおよびRedshiftのバックアップをロードして処理できます。これにより、データがMySQLデータベースに保存されていない場合でも「MySQL HeatWave」のメリットを活用できます。データの保存ファイル形式に関係なく、同じクエリ性能が提供されます。
・MySQL内データクエリを実行オブジェクト・ストアのデータと結合する機能:「MySQL HeatWave Lakehouse」を利用するお客様は、MySQLデータベースに保存されているOLTPデータのクエリを実行し、オブジェクト・ストアに保存されているデータと結合することができます。OLTPデータに加えた変更はリアルタイムに更新され、クエリ実行結果に反映されます。

「MySQL HeatWave Lakehouse」の新しい「MySQL Autopilot」機能
「MySQL Autopilot」は、「MySQL HeatWave」向けに機械学習ベースの自動化を提供します。「MySQL HeatWave Lakehouse」では、自動プロビジョニング( https://www.oracle.com/mysql/#rc30p4 )や自動クエリ実行計画改善( https://www.oracle.com/mysql/#rc30p4 )などの既存の「MySQL Autopilot」機能も強化されます。データベース管理のオーバーヘッドはさらに解消され、性能も向上します。また、「MySQL HeatWave Lakehouse」では、多数の新しい「MySQL Autopilot」の機能を利用できます。
・スキーマの自動推論:Autopilotは、ファイル・データとデータベース内のデータ型のマッピングを自動的に推論します。これにより、「MySQL HeatWave Lakehouse」によって新たにクエリが実行されるファイルごとにお客様がマッピングを手動で指定する必要はありません。
・データのアダプティブサンプリング:Autopilotは、オブジェクト・ストレージ内のファイルの一部をインテリジェントにサンプリングし、最小限のデータ・アクセスで正確な統計情報を収集します。「MySQL HeatWave」では、これらの統計情報はクエリ実行計画の生成と改善、最適なスキーマ・マッピングの決定などの目的に使用されます。
・自動ロード:Autopilotはデータを分析して「MySQL HeatWave」へのロード時間を予測し、データ型のマッピングを決定し、ロード・スクリプトを自動的に生成します。ファイルとデータベース・スキーマおよびテーブルとのマッピングをユーザーが手動で指定する必要はありません。
・アダプティブデータ・フロー:「MySQL HeatWave Lakehouse」は、基盤となるオブジェクト・ストアの性能に動的に適応します。これにより、「MySQL HeatWave」は基盤となるクラウド・インフラストラクチャから利用可能な最大限の性能を引き出すことができ、全体的な性能、コスト効率、可用性が向上します。

MySQL HeatWave」のその他の強化内容
機械学習やVS Codeのプラグインなど、「MySQL HeatWave」の多数の強化内容も発表されました。「MySQL HeatWave」のインデータベース機械学習がさらに強化され、予測モデルがサポートされるようになりました。「MySQL HeatWave」に最適化された新しい機械学習の説明技術が追加されました。アルゴリズムの選択、機能の選択、スコアリング・メトリック、説明技術など、自動化された「HeatWave ML」トレーニング・パイプラインの様々な段階に対してデータ・サイエンティストが影響を与えられるようになりました。「HeatWave ML」も強化され、お客様は「HeatWave」に機械学習モデルをインポートできるようになりました。

新しいマルチエンジンHypergraphクエリ・オプティマイザーは、複雑なクエリ性能をさらに向上させ、結合順序を指定する必要をなくしました。ゾーンマップが追加され、「MySQL HeatWave」による幅広いクエリ実行が高速化されました。また、MySQL向けのVS Codeのプラグインが強化され、「MySQL HeatWave」の機能がサポートされるようになりました。

分散クラウドに対応
「MySQL HeatWave」は、新たにMicrosoft Azure でも利用可能となり、既に利用可能なOCIやAWSと合わせてマルチクラウドで展開します。データベース・ワークロードをパブリック・クラウドに移行したくない組織は、「OCI Dedicated Region」の一部としてオンプレミスで利用できます。お客様は、オンプレミスのMySQL OLTPアプリケーションから「MySQL HeatWave」にデータを複製し、リアルタイムに近いアナリティクスを利用することもできます。「MySQL HeatWave」は、常に最新バージョンのMySQLデータベース上にあります。

* ベンチマーク・クエリはTPCベンチマークに由来しますが、TPC仕様に準拠していないため、結果を公開済みのTPCベンチマーク結果と比較することはできません。

オラクルについて
オラクルは、広範かつ統合されたアプリケーション群に加え、セキュリティを備えた自律型のインフラストラクチャをOracle Cloudとして提供しています。オラクル(NYSE:ORCL)に関するより詳細な情報については、http://www.oracle.com/ をご覧ください。

Oracle CloudWorldについて
「Oracle CloudWorld」は、世界中のお客様とパートナー企業を対象に開催するオラクル最大のイベントです。ビジネス上の最大の課題に取り組むために必要なインサイトの探究、スキルや知識の習得、人脈の構築、クラウド・インフラストラクチャ、データベースやアプリケーションを構築し使用する人々からその詳細を学ぶ機会として、是非イベントにご参加ください。登録方法、基調講演の視聴方法、セッション詳細、ニュースなどの情報は、https://www.oracle.com/cloudworld または http://www.oracle.com/newsroom をご参照ください。

将来の製品に関する免責条項
上記の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。上記の事項は、マテリアルやコード、機能を提供することをコミットメント(確約)するものではないため、購買決定を行う際の判断材料にしないで下さい。オラクル製品に関して記載されている機能の開発、リリース、時期および価格については、弊社の裁量により変更される可能性があります。

将来の見通しに関する記述
オラクルの将来の計画、見通し、信念、意図に関する本記事内の記述は「将来に関する記述」であり、重大なリスクや不確実性が生じる可能性があります。こうした記述はオラクルの現在の期待と実際の結果に影響を及ぼす可能性があり、実際の結果が大きく異なる可能性があります。これらの記述およびオラクルのビジネスに影響を及ぼすその他のリスクに関しては、Form 10-K での オラクルの最新のレポートならびに Form 10-Q の「Risk Factors」など、米証券取引委員会 (SEC) に提出されているオラクルの報告書に記載されます。これらの報告書は、SECのウェブサイトまたはオラクルのウェブサイト http://www.oracle.com/investor からご覧いただくことができます。本記事内の情報はすべて、2022年10月18日時点で最新であり、オラクルは新しい情報や将来の出来事を踏まえて記述を更新する義務を負いません。

商標
Oracle、Java及びMySQLは、Oracle Corporation、その子会社及び関連会社の米国及びその他の国における登録商標です。文中の社名、商品名等は各社の商標または登録商標である場合があります。本文書は情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。

タイトルとURLをコピーしました