開発経緯と目的
リッジアイでは、ChatGPTのAPI開発やMicrosoft社が提供するAzure Open AIの環境でのAI構築などを行ってきております。その中でも近年では、業務や専門知識の理解、倫理や規約の遵守など目的に合わせた精度向上の必要性およびオープンクラウド上での利用への不安に関する問い合わせも増えています。先日、リッジアイが国内大手企業のIT担当者向けに行った、ChatGPTの業務活用に関する実態調査 (※2) によると、回答者の44%が生成AIの業務活用の検討をしている一方で、情報セキュリティの面で不安があると回答した人が90%以上を超えていることがわかりました。こうした社会ニーズに対応
するために、日本語で稼働する生成AIの実現に向けて研究開発を開始することにしました。
現状の生成AIに感じる課題感の解消も目指すため、 (1) 情報セキュリティの面で「安心して使える」LLMの利用環境の提供 (2) 日本語にチューニングされた目的特化型の生成AI・LLMの開発 に注力して着手します。2023年中にプロトタイプ版の提供開始、2024年からは企業向けの生成AI・LLM活用サービスの提供を目指します。
リッジアイが強みを持つマルチモーダルAI技術に自然言語領域のAIが加わることで、最先端技術でビジネス・社会課題を解く、というミッションの実現に向け更に邁進していきます。
開発体制
今回の研究開発にあたり、必要となる画像処理半導体(GPU)は、さくらインターネットが提供予定のGPUサービスを採用する想定です。
また、情報セキュリティ面や、目的に特化したLLMの研究開発に向けて、当社のAIエンジニアだけでなく、自然言語のAI開発で豊富な知見を持つバオバブの協力を仰ぎ、日本語のNLP開発で知見を持つ元Googleの小田悠介氏、およびカーネギーメロン大学准教授のGraham Neubig氏が参画します。これにより、日本語特有のトークン解析やファインチューニングのための知見を組み込んだ最先端かつ高精度の日本語LLMの開発を目指します。
本LLMの特長
下記のテーマで研究開発を行うことで、目的特化型LLMの実現を目指します。
-
研究開発資料や顧客情報など秘匿性の高いデータ
国内のデータセンタで動くLLMを開発することにより、安心して使える環境を目指します。
-
実用性と費用対効果を考慮した目的特化の軽量LLM
利用用途に応じて最適なパラメータ数のLLMを提供するための研究開発を行い、安価な計算環境での利用や、組み込みソフトとしての展開などを見据えたLLMの提供体制を目指します。
-
日本語に特化した研究
日本語に基づく歴史や法律、業務や専門知識の理解、倫理や規約の遵守などが可能となるLLMを実現するための学習・検証データの整備やファインチューニングのノウハウを蓄積することで、官公庁などの機関で使えるLLMを目指し、専門家不足や学校教員不足の解決につなげていきます。
各社からのコメント
さくらインターネット株式会社 代表取締役社長 田中邦裕 氏
「この度、Ridge-i様と共に大規模言語モデル(LLM)の開発にて協力できることを大変嬉しく思います。生成AIへの関心が高まっている今、経済安全保障の観点からも国産LLMの実現は社会に大きなインパクトを与えるものだと考えます。本件が、日本におけるAIの発展をさらに加速させる一助となることを期待しています。当社は、「『やりたいこと』を『できる』に変える」を企業理念に掲げており、Ridge-i様をはじめとしたスタートアップ企業の生成 AIへの取り組みを支援してまいります。」
株式会社バオバブ 代表取締役社長 相良美織 氏
「この前人未到のチャレンジにバオバブが貢献できること、非常にワクワクしています。
過去10年以上にわたる言語処理分野におけるデータ作成の知見を如何なく発揮する事はもちろんのこと、この度7月にバオバブに参画したばかりのGraham Neubig氏、及び国内でも数少ないLLM研究者達を含むモデル開発チームという万全の布陣で挑み、最先端かつ高精度の目的特化型LLMの実現を目指します。」
※1 Graham Neubig氏略歴:カーネギーメロン大学コンピュータサイエンス学部言語技術研究所(CMU-LTI)准教授 – http://www.phontron.com/index.php?lang=ja
※2 2023年6月15日付プレスリリース 「90%以上がセキュリティに懸念。生成AI固有のセキュリティリスクを懸念するも80%が未対応 – https://ridge-i.com/news/3916/
―――――――――――――――――――――――――――――――――――――――――――――――――
さくらインターネット株式会社について
さくらインターネットは、1996年創業のインターネット企業です。「さくらのクラウド」「さくらのレンタルサーバ」「さくらのVPS」などのクラウドコンピューティングサービスを、自社運営の国内のデータセンターから提供しています。「『やりたいこと』を『できる』に変える」の企業理念のもと、お客さまのご要望にお応えする多様なサービスを開発し、あらゆる分野に対応するDXソリューションを提案します。
会社名:さくらインターネット株式会社
所在地:〒530-0001 大阪府大阪市北区梅田1-12-12 東京建物梅田ビル11階
事業内容:クラウドコンピューティングサービスなどの提供。データセンター運営
代表者:代表取締役社長 田中邦裕
株式会社バオバブについて
バオバブは、創業以来AIのための学習データ構築サービス事業を展開し、言語処理・画像認識・対話シナリオ・マルチモーダル向けの多様なアノテーションサービスを国内外の大学、学術機関、研究所等に提供しています。プロジェクトにあたる「パートナー(Baopart)」を独自に育成し、的確な仕様策定、パートナー(Baopart)が迷うことのない作業ルールの作成、品質管理者による日々の進捗とデータチェック、納品前のクオリティチェックなど、緻密な業務フローと組織、システムで学習データの高い品質を担保しています。
OpenAI社のChatGPTなど高性能な会話型AIの学習プロセスとして採用されているRLHF(Reinforcement Learning from Human Feedback、人間からのフィードバックを用いた強化学習)をはじめ、LLM開発、及びモデルの評価においても、バオバブはこれまでの知見を活かしたサービスの展開を目指してまいります。
会社名:株式会社バオバブ
所在地:〒100-0006 東京都千代田区有楽町1-12-1新有楽町ビル11FPortalPoint
事業内容:AIのための学習データ作成サービス
代表者:代表取締役社長 相良美織
URL: https://baobab-trees.com/
株式会社Ridge-i(リッジアイ)について
リッジアイは、AI・ディープラーニング技術を活用したソリューションにより、経営・社会課題の解決に挑むテックイノベーションファームです。特に、画像解析ディープラーニング、センサーによる異常検知AI、最適化AIなど様々なデータに対応するAIを組み合わた「マルチモーダルAI」に強みを持ちます。戦略策定から要件定義フェーズに始まり、現場のコンサルテーションから開発・運用保守まで、投資対効果を実感するまで一気通貫で伴走し、これまでにもごみ焼却運転の自動化AIや、物流倉庫のレイアウトを自動でデザインするAI「ALPS」など、多くの実績をあげています。また社会課題にも積極的に取り組んでおり、SDGs課題と環境変化を衛星画像から発見する「GRASP EARTH」などで第4回、第5回宇宙開発利用大賞を連続受賞しました。今後とも技術とビジネスの高みを追求し、社会・顧客が持続的に効果を実感できる最高峰のソリューションを提供します。
会社名: 株式会社Ridge-i
設立: 2016年7月
所在地: 東京都千代田区大手町1-6-1 大手町ビル438
代表: 代表取締役社長 柳原 尚史
資本金: 365,650,000円
事業内容:
① AI・ディープラーニング技術のコンサルティングおよび開発
② 共同事業、ライセンス、保守モデル、自社開発等によるプロダクトの提供
③ 人工衛星データAI分析サービスの提供
URL: https://ridge-i.com
お問合せ: contact@ridge-i.com