【背景と課題】
現代社会では、データの膨大な量が生まれ、AI技術の進化によってビジネスにおけるデータ活用がますます重要になっています。一方で、AIの活用は人間の介入が必要であり、モデルの性能を維持するためには大量のデータの前処理やモデルの再学習が必要です。このような課題に対応するため、自律学習システム(MLOps)が注目されています。しかし、MLOpsの導入にはいくつかの課題があります。まず、AIモデルの開発や運用に関わる技術が複雑であるため、専門的な知識を持ったエンジニアが必要です。また、データセットやモデルのバージョン管理、再学習や検証、展開といった一連のプロセスを一元的に管理するためのツールが不足していることが課題となっています。
特にAI議事録において、MLOpsの導入によってAIモデルの開発や運用が効率化され、品質向上やコスト削減につながる可能性があります。しかし、MLOpsの導入には個別最適化が必要な課題があります。
*以下はインド、ネパール、日本人など5名で日英混合MTGを当社AI議事録「CalqTalk」で1時間のMTGを議事録にした結果。3. インフラストラクチャーの詳細まとめにおいて、「AWSのインフラスクラッシュ」、「ブレインボール」などは実際に無い単語であり、ユーザーが修正しAIが学習するMLOpsの仕組みが必要となる。
まず、業界ごとに異なるデータの特性や背景に基づいたMLOpsの開発が必要です。例えば、医療業界では患者の健康情報を取り扱うため、プライバシー保護や倫理的観点を考慮したモデル開発が必要となります。また、金融業界では信用リスクの評価や投資戦略の最適化など、異なる目的に基づいたモデル開発が必要です。 次に、企業ごとに異なる企業内で利用されるデータや情報、ビジネス目標に基づいたMLOpsの開発が必要です。例えば、製造業では製造業独自の用語の理解や生産ラインの最適化や欠陥品の検出など、業務プロセスの改善に向けたAI議事録時の提案フローが必要です。さらに、個人単位での最適化が必要です。モデルの公平性を担保するためには、個人単位でのデータセットの分析やモデルの再学習が必要です。MLOpsを導入する際には、業界、企業、個人単位での個別最適化が必要であることが課題となっています。適切な最適化を行うことで、AIモデルの性能向上や公平性担保につながることが期待されます。
【提供価値】
このような課題を解決するため、当社はMLOps(AI自律学習システム)の実証実験を開始します。MLOpsを自動化することで、エンジニアがMLOpsに費やす時間やコストを削減することができます。これによりCalqTalkのAIモデルの学習、テスト、評価、再学習、デプロイまでの一連のプロセスを一元管理することができます。
MLOpsは、機械学習モデルの開発から運用までの一連のプロセスを自動化するための技術です。MLOpsには以下のような技術要素が含まれます。
- データ管理:MLOpsにおいては、データの取得、前処理、変換、ストレージ、ラベリング、アノテーションなどの管理が重要な機能です。このための製品としては、データプラットフォームやデータ管理ツールがあります。
- モデル管理:MLOpsにおいては、モデルのバージョン管理、再トレーニング、デプロイなどが必要です。モデル管理に関連する製品としては、バージョン管理システム、モデル管理プラットフォーム、自動化されたワークフローがあります。
- 自動化されたトレーニング:MLOpsにおいては、モデルのトレーニングを自動化することが重要です。トレーニングに関連する製品としては、自動トレーニングツール、モデル選択とハイパーパラメーターチューニングを自動化するプラットフォームなどがあります。
- デプロイメント管理:MLOpsにおいては、モデルを適切な環境にデプロイする必要があります。デプロイメントに関連する製品としては、モデルサービングプラットフォームやコンテナオーケストレーションツールがあります。
- 監視とデバッグ:MLOpsにおいては、モデルのパフォーマンスを監視し、トラブルシューティングを行う必要があります。監視に関連する製品としては、ログ分析、アラート、自己診断機能があります。
- セキュリティとコンプライアンス:MLOpsにおいては、モデルのセキュリティとコンプライアンスに関する問題に対処する必要があります。セキュリティとコンプライアンスに関連する製品としては、モデル監査、アクセス制御、データプライバシー保護などがあります。
MLOpsに関連する一部の製品やツールの主要製品は以下のようなものがあります。
当社は大手法人様向けのMLOps構築で以下全ての製品群を活用した実績があります。
- Kubeflow:Kubernetes上で動作するオープンソースのMLオーケストレーションプラットフォームです。
- MLflow:モデルのトレーニング、管理、デプロイを容易にするオープンソースのMLOpsプラットフォームです。
- AWS SageMaker:AWSが提供する、機械学習の訓練、デプロイ、管理を容易にするフルマネージドサービスです。
- Azure Machine Learning:Microsoftが提供する、機械学習のトレーニング、デプロイ、監視、管理を容易にするクラウドベースのサービスです。
- Google Cloud AI Platform:Googleが提供する、機械学習のモデル開発、トレーニング、デプロイ、監視、管理を容易にするクラウドベースのサービスです。
- Databricksは、Apache Sparkベースのデータ分析や機械学習のためのクラウドプラットフォームであり、MLOpsにも使用できます。Databricksには、以下のようなMLOps関連の機能があります。
これらの製品は、企業や開発者がMLOpsを実装する際に役立ちます。しかし、これらの製品だけでなく、他のオープンソースツールやカスタム開発もMLOpsの実装には有用です。MLOpsは、機械学習プロジェクトの成功に不可欠な重要なプラクティスの1つであり、データサイエンスや機械学習の分野においてますます注目を集めています。
またこの度の実証実験では
- MLOpsにChatGPTを組み合わせたプログラム修正・変更・提案レベルでの次世代MLOpsの研究開発
- MLOpsに量子コンピューターを組み合わせた超高速大規模パラメータ最適化
の2点を含みます。
より良い社会の実現に向けてAI議事録を起点に実証実験を進めて参ります。
CalqTalkのβ版はこちら!
[株式会社KandaQuantumについて]
社名:株式会社KandaQuantum
本社:102-0083 東京都千代田区麹町6-6-2 番町麹町ビルディング 5F
代表:代表取締役社長 元木大介
事業内容:2020年設立。2年半で20社以上の各業界の国内最大手企業から数億~数十億円の調達を完了したスタートアップまで、量子コンピューター、AI、クラウド、IoT等最先端技術を支援してきました。「協創の基盤を創る」をミッションに、Gen-AI(ジェネレーティブAI、生成系AI)や量子技術等を活用し誰もが自分の人生に熱中できる社会の実現に向け新たな価値を創出していきます。