アッペン、日本市場におけるAI開発の成長を加速させるデータアノテーション・プラットフォーム「Appen AI Data Annotation Platform」を発表

この記事は約9分で読めます。
世界トップクラスのトレーニングデータでAI開発をリードするアッペン(Appen)と、その日本法人であるアッペンジャパン(Appen Japan)株式会社(本社:東京都千代田区、代表:吉崎哲郎)は、本日、「Appen AI Data Annotation Platform」の日本市場での提供開始を発表しました。「Appen AI Data Annotation Platform」は、企業のAIに対する取り組みを強化することを目的とする、業界をリードする「データアノテーション・プラットフォーム」です。

Appen AI Data Annotation PlatformAppen AI Data Annotation Platform

米大手調査会社ガートナーによると、AIをより普及させるためには、産業化されたAIプラットフォームが必要不可欠です。AIプラットフォームを産業化することによって、AIの再利用性、拡張性、安全性が実現され、AIの導入と成長が加速されます。
(出典:Gartner: Industrialization of AI in the Enterprise, https://blogs.gartner.com/svetlana-sicular/industrialization-of-ai-in-the-enterprise/

そして、「データアノテーション・プラットフォーム」は、ラベル付けされたAIトレーニングデータのサプライチェーンの構築と、それによってAIモデルの継続的な改善と開発を可能にするもので、AIプラットフォームならびにプロジェクトの産業化には必要不可欠な存在です。

新型コロナウイルスの影響で、AI分野は新たに対策を講じる必要がある投資重点領域として企業に認識されました。ITおよび通信分野に関する調査などを提供するIDCが2021年6月に発表した「国内AI市場予測」によると、日本のAIシステム市場は2025年までに25.5%の年平均成長率が見込まれています。また、その市場規模は2025年には約4,910億円になると予測されています。
(出典:国内AIシステム市場予測を発表、https://www.idc.com/getdoc.jsp?containerId=prJPJ47728821

現在、アッペンは、すでに国内の自動車メーカーに対して車載音声アシスタント用のデータを提供しています。言語は一般的に、地域ごとに方言やイントネーションの違いなどがある上、地域によって会話に頻出する地名が異なり、AIがそれを完全に認識することは困難でした。しかし、アッペンは各地域のネイティブスピーカーから音声データを収集することによって、より精度の高い車載音声アシスタントの実現に貢献しています。

また、アッペンは、2011年から、音声認識技術のソフトウェアプロバイダーとともに、音声サービス提供の共同提案を行っています。ある研究機構は、言語の壁を超えるための自動音声翻訳技術の研究開発を推進しており、音声認識性能の向上のための大規模な音声データの収集を必要としていました。アッペンは、この課題と要件に対し、日本語、中国語、韓国語、ロシア語から東南アジアのマイナー言語までの音声収集と書き起こしを提供しました。また、日本人の子どもの音声収集の要望に関しても、アッペンのクラウドワーカーネットワークを通して音声の提供を行いました。

現在の市場には、データアノテーション・プラットフォームはまだほぼ存在しません。「Appen AI Data Annotation Platform」は、世界レベルのAIイニシアチブの実現に向けたアッペンの最新の試みです。「Appen AI Data Annotation Platform」は、ITリーダーが、ラベル付けされたAIトレーニングデータのサプライチェーンを構築し、高度に自動化、標準化、拡張可能な方法でデータアノテーション・プロジェクトを実行できるよう支援します。トレーニングデータの生産効率は、「Appen AI Data Annotation Platform」によって、実際に行われているオフラインでの手動プロセスに比べて100倍も高くなる可能性があります。
 

  • 「Appen AI Data Annotation Platform」のプラットフォームの主な構成要素は、プロジェクト管理、リソース管理、アノテーションツールセット、およびアノテーションエンジンです。「Appen AI Data Annotation Platform」は、社内やBPOのデータチームを対象に、いくつもの役割・機能を調整して高い生産性を実現しながら、アノテーターやバリデーターの負担を低減します。
  • 「Appen AI Data Annotation Platform」は、あらゆるデータタイプやユースケースを改善・強化する、充実したデータアノテーションの生産性向上ツールを備えています。NER、音声分割・転写、オブジェクトトラッキング、ピクセルレベルのセマンティック分割、OCR、設定可能なコンテンツ関連性テンプレートなど、幅広いアノテーションツールをサポートします。しかも、これらの機能は使いやすく、機械学習による品質検証機能を組み込んでいるのが特徴です。
  • 「Appen AI Data Annotation Platform」のワークフローは、大規模なデータアノテーション・プロジェクトのための強力な動力源です。毎秒30,000クエリの処理能力に加え、オートスケーリングにも対応しています。中央のデータセンターから並列のパイプラインにデータをディスパッチし、データセンターにバージョン管理付きのアノテーション結果を戻します。
  • 「Appen AI Data Annotation Platform」は、エンタープライズグレードのセキュリティ機能とコンプライアンス機能を備え、さらにAIモデルの継続的な改善・開発に対応するための豊富なAPIを提供できるように設計されています。
  • 「Appen AI Data Annotation Platform」は、データセキュリティやコンプライアンスに高度な要件を定めている大企業や中堅企業を対象としています。研究チームやスタートアップ企業の場合は、SaaS版の利用を推奨します。
  • 「Appen AI Data Annotation Platform」を導入することにより、データアノテーション・プロジェクトを短期間で立ち上げることやデータセットのバージョン同期が可能になると同時に、社内データアノテーション・プラットフォームを維持するための運用コストを下げることになります。また、「Appen AI Data Annotation Platform」は、アッペンの100万を超えるグローバルクラウドワーカーと接続でき、プライベートファイルサーバーの拡張サポートにより強固なセキュリティを実現します。

アッペンジャパン 代表の吉崎哲郎は、「2022年はAIデータアノテーション業界にとって大きな分岐点となるでしょう。データアノテーションの成功事例が再利用可能なソフトウェアツールとしてコード化され、AIモデルのライフサイクル全体に対して高精度かつ高品質のトレーニングデータセットを大規模に提供できるようになります。このようなデータアノテーション・プラットフォームは、AI市場において強固なトレンドとなってきています。そしてこのプラットフォームは2Dの大量の静止画や動画のフレームデータ、自律走行向けのLiDAR等で生成された3Dの点群データをも扱えるパワフルな環境です」と述べています。

なお、「Appen AI Data Annotation Platform」ソリューション・パッケージの詳細や価格は、後日発表いたします。

アッペンは、データの品質にこだわり、高品質で偏りのない多様なAIトレーニングデータサービスを提供し、データラベリングプロセスのコンプライアンスとプライバシー保護を実現します。「Appen AI Data Annotation Platform」の発表によって、アッペンは日本におけるデータアノテーション業界を牽引して参ります。

アッペン(Appen)のデータアノテーション機能について
アッペンデータアノテーション・プラットフォーム­は、全世界100万人以上からなるヒューマン・インテリジェンスと最先端のモデルを組み合わせることで、機械学習プロジェクト向け最高品質のトレーニングデータ*の作成を可能にします。トレーニングが必要なデータをアッペンのプラットフォームにアップロードいただくことで、機械学習モデルの正確な実情報を作成するために必要なアノテーション、判断、ラベルを提供します。
高品質のデータアノテーションにおいてAI/MLモデルがどのような判断を下すべきかを学習させる方法が重要です。アッペンのプラットフォームは、ヒューマン・インテリジェンスと最先端のモデルと効果的なツールを組み合わせ、文章から映像、イメージ、音声、3D点群などあらゆる種類の生データにアノテーションを付与します。当社のプラットフォームにおけるワークフローは非常に柔軟性に富む手法で、複数のリソースチームによる共同作業を可能にします。当プラットフォームはデータ・アップロードから最終段階の実行レビューまですべてをオンラインにより、エンドツーエンドで提供可能です。
*トレーニングデータ:AIモデルや機械学習アルゴリズム(MLA)が適切な判断を導くことができるように意味付け(ラベリング)されたデータ

アッペン(Appen)について
アッペン( https://appen.co.jp/ )は、世界で最も革新的な人工知能システムを構築し、継続的なAIの学習や改善に欠かせない画像、文章、発話、音声、映像、その他のデータを収集、ラベリングするサービスを提供しています。アッペンは、235以上の言語に対応する専門知識、100万人以上の熟練したクラウドワーカーによって構成される全世界170カ国に及ぶグローバルネットワーク、業界最先端のAI支援型データアノテーション・プラットフォームによって、世界中のテクノロジー、自動車、金融、小売、そして医療メーカーのリーダー企業、および各国の政府に対して、高品質で、セキュリティレベルが高く、スピードが伴ったサービスを提供します。1996年に設立されたアッペンは、現在、オーストラリア本社をはじめ、アメリカ、イギリス、フィリピン、中国、韓国、日本のオフィスを拠点に、多くの顧客を支援しています。

タイトルとURLをコピーしました