コグニティブ・フォートトークへ新機能を追加 次世代のAI機能群が、「コグニティブ・フォートトーク」をさらに豊かに

この記事は約10分で読めます。
コグニティブリサーチラボ株式会社(本社:東京都港区 代表取締役CEO苫米地英人、以下CRL)は、iPhone版アプリ「コグニティブ・フォートトーク」へ新機能を追加致しました。次世代のAI機能群が、「コグニティブ・フォートトーク」をさらに豊かにします。取得情報の理解から学習支援、エンターテイメント、人間同士のコミュニケーションをも増幅するこれらの新機能をぜひ体験ください。

ChatGPTで代表される生成AIが社会的に急速に認知され、これに合わせて弊社の元々持つ生成AI機能と、OpenAI社の生成AIを高度化する機能の両方を複数フォートトーク上に実装し公開しました。特に生成AIは、幻覚(hallucination)と呼ばれますが、大規模学習の結果による超次元的な偏微分空間での近似解としては正しいが、人間には受け入れられない解を出すリスクがありますが、世界でも最初期の生成AI研究の1991年のATR苫米地MONA-LISA論文※での幻覚解決技術提案以来、一貫して継続して来たこの解決法の例を世界で最初にフォートトーク内に実装しました。これはG7でヒロシマプロトコルと呼ばれた生成AIのリスク回避にも大きく貢献します。

また、ChatGPTなど生成AIは大規模学習モデルによる深層学習期間を超える知識は限定的な教師付き学習知識のみとなり大きく欠如します。例えば、ChatGPTは2021年9月までの知識に限定され、現在の社会情勢や明日の天気を質問しても満足な回答は得られません。弊社はこれらを解決する技術開発を長年継続して来ましたが、最近この問題が広く知られるようになり、この解決法もフォートトークに実装し公開しました。具体的には、弊社独自開発の人工知能がChatGPTの持たない知識を提供しChatGPTとシームレスに回答します。前記のAI幻覚回避システムと融合的に稼働しています。

「コグニティブ・フォートトーク」は、ユーザーがより新鮮で有益な情報を手に入れるための全27種類の新機能を追加しました。その中でも特に目立つ存在は、「Advanced Assistant(アドバンスドアシスタント)」です。これはコグニティブリサーチラボ株式会社独自のAI技術とGPT-4の組み合わせから生まれた、他のサービスでは類を見ない最先端の機能を持つAIアシスタントです。特に、このアドバンスドアシスタントは先進的な「知識補完・誤り修正機能」を搭載しています。これらの新機能は情報へのアクセス体験を一段と高めることでしょう。

■ Assistant(アドバンスドアシスタント)の開発背景と機能

情報社会の急速な発展に伴い、私たちは増大する情報量を適切に処理することが求められています。このニーズに応えるため、「コグニティブ・フォートトーク」は、最新のGPT-4とコグニティブリサーチラボ独自のAIを組み合わせた「アドバンスドアシスタント」を開発しました。

1.最新の情報に基づいた対応

アドバンスドアシスタントは、GPT-4とコグニティブリサーチラボ独自のAI技術の組み合わせにより、過去の情報からだけではなく、最新のデータをもとに適切な回答を提供します。これは、私たちの独自のAIがGPT-4と協調して最新の情報を送り、最適な回答を生成することにより実現しています。 

2.根拠となる情報の提示

アドバンスドアシスタントは、回答の根拠となる情報(URL等)も提供します。これにより、ユーザーはアシスタントの回答がどのような情報に基づいているのかを確認することができます。また、回答の根拠となる関連リンクも提示されるため、その他のサービスでは体験できない先端の機能を提供します。

3.音声入力による操作

アドバンスドアシスタントは、音声入力による操作も可能です。ユーザーは文字入力の手間を省き、より直感的に情報を取得することができます。

■知識を補い、誤り(幻覚)を修正する機能

コグニティブリサーチラボ独自のAIとGPT-4を組み合わせることにより、不足している情報を補い、不正確な回答や幻覚を正確に修正することができます。これにより、最新情報を取り入れた回答を得ることもできます。

これらの新機能により、「コグニティブ・フォートトーク」はユーザーが日々の生活で新鮮で有益な情報を手に入れ、知的な好奇心を満たすことが可能になります。最新の情報に基づく対応、根拠となる情報の提示、音声入力による操作、これら全ての機能をぜひお試しください。

さらに、アドバンスドアシスタントに加えて、26の追加機能があります。

以下に各システムの名前とその機能の説明をまとめます。

1.AIチャット: ユーザーの過去の会話履歴を利用し、独特のプロンプトをカスタマイズして、APIを通じて自由度   の高い会話体験を提供します。安全に関連資料を組み込むことで、ユーザーの好みや傾向に応じたパーソナライズされた応答を生み出し、一人ひとりに最適化したチャットボットを実現します。

2.スマートアシスタント: 音声コマンドにより質問に対する詳細な回答を提供したり、特定の主題について深く探求します。

3.PDFアシスタント: “チャンキング”と”マルチモーダル類似性計算”という先進的な技術を採用し、PDFの内容を詳細に解析し、ユーザーの質問に対する洞察に満ちた迅速な回答を提供します。

4.リンガメイト: ユーザーの表現を自然に強化し、理解を深め、会話を促進することで多言語学習を効率的にサポートします。

5.サイトスクライブ: 先進的なAI技術を活用してウェブコンテンツを精緻に解析・要約し、複数言語への翻訳を可能にする革新的なツールで、情報のアクセシビリティと消費の効率を飛躍的に向上させます。

6.インサイトウィズドム: 知識探求の伴走者となり、生活や学問の各領域に対する深遠な名言を音声、視覚的イメージ、さらには楽曲として提供し、視野を広げ、深い理解を促進します。

7.ビジョナリートランスフォーマー: 自然言語処理技術を駆使し、文脈を理解してネガティブな感情表現を捉え、それを人々の感情や気分が向上するようなポジティブな表現に転換します。

8.ハーモニックバース: テキストの意味と感情を理解し、それを反映した音楽とタイトル、歌詞を生成する、誰でも簡単に利用可能な最新の自然言語処理技術と音楽生成アルゴリズムを用いたシステムです。

9.ヴィルトゥオーソキュレーション: 800曲以上のクラシック音楽からユーザーの感情や状況にマッチする楽曲を選び出し、その曲の背後にある深い背景を理解することで、個々の音楽体験を豊かに高めるAI鑑賞アシストツールです。

10.イメージダイジェスター: 画像から情報を即時抽出し、要約・音声化を行うための強力な情報取得ツールです。

11.pdf2summary: PDFからのテキスト抽出とその要約・音声化により、情報へのアクセスを迅速かつ効率的にします。

12.speech2summary: 音声・動画データをテキスト化し、その要約・音声化により時間効率の良い知識獲得を可能にします。

13.speech2text: テキストを自然な音声に変換し、アクセシビリティとコミュニケーションの可能性を広げます。

14.speech2text-transcoding: URLから動画・音声データを取得し、トランスコーディングとテキスト化を行う強力なツール。情報へのアクセスが迅速かつ効率的になります。

15.text2summary: 情報を迅速に掴むための高度なテキスト要約機能を提供します。

16.text2moderations: AI技術を用いてテキストのコンテンツポリシー適合性を判定し、信頼性の高いモデレーションを提供します。

17.text2text-edit: 誤字の校正から句読点の挿入、語彙調整に至るまで、文書の品質を最大限に引き上げます。

18.text2img: ユーザーの想像力を瞬時に視覚化し、直感的な表現を可能にするシステムです。

19.img2img-edit: AI技術を活用し、画像要素を自由に調整して独自のビジュアルストーリーを創り出します。

20.img2img-variation: 一つの画像から多様なバリエーションを自動生成し、新規な視覚的世界を展開するツールです。

21.インターラクティブプロンプトエンハンサー: ユーザーのフィードバックを活用し、より有益で自然な対話形式のプロンプトを生成する機能です。

22.コラボティブプロンプトエクスペリエンサー: ユーザーとの共創を通じて、各段階の進展を具現化しつつ、理想的なプロンプトを追求する対話型ツールです。

23.ヒューリスティックグローブ: 言語モデルを用いて問題解決のヒューリスティックガイド付き探索を行う新たなフレームワークであり、ユーザの問題に対して思考ステップを生成・評価し、最善の解答を導き出すシステムです。

24.ビションスクライブ: ユーザーの抽象的な表現を具体的なビジュアル表現へと具現化し、視覚的に表現するシステムです。

25.プロンプトナビゲーター: 各ユーザーの個々のニーズに応じて選択可能なプロンプトをパーソナライズし、効率的な情報アクセスと問題解決を支援する直感的な対話型システムです。

26.アクト、プロンプト一覧: 具体的なプロンプトとアクトを100種類以上表示する機能です。

それぞれの新機能が、私たちが毎日取り扱う大量の情報をより有益で価値あるものに変換する力を持っています。これらの機能により、「コグニティブ・フォートトーク」は、ユーザーがより直感的に情報にアクセスし、知識の深堀りを楽しむことができます。最新の情報への対応、根拠となる情報の提供、手軽な音声入力による操作、そして他の26の新機能を通じて、情報アクセス体験はこれまで以上に深まると確信しています。

■OpenAIからの最新アップデートとアドバンスドアシスタントへの影響について

OpenAIからの最新アップデートにより、「アドバンスドアシスタント」のようなシステムを実現するための技術が一層進化し、個々のアプリケーションが独自の機能を更に強化・拡大できるようになりました。

このアップデートでは、2023年6月13日に公開された「gpt-4-32k」と「gpt-3.5-turbo-16k」が追加されました。それぞれのモデルが一度に理解できるテキストの長さ(トークン数)が”32k”や”16k”と増加することで、大規模なテキストの理解が向上し、情報の精度が高まります。

さらに、「関数呼び出し機能」の導入により、開発者は自分で関数をモデルに追加し、ユーザーの入力からその関数を呼び出すことが可能になりました。これにより、ユーザーの質問を直接的に処理し、外部ツールからデータを取得するなど、応用範囲が広がります。具体的には、ユーザーが「東京の天気はどうですか?」と質問した場合、開発者が事前に作成しておいた「get_current_weather」関数を用いて天気情報を取得し、その結果をユーザーに提供するという操作が可能になります。

これらの新機能により、「アドバンスドアシスタント」のようなシステムの可能性が更に拡大し、その実用性が向上します。この新機能につきましても、対応して参ります。

「コグニティブ・フォートトーク」は、これからもユーザーのための有益な機能を提供し続け、情報利用体験の豊かさを追求してまいります。新たなステップをご期待ください。

https://www.crl.co.jp/pdf/thesis/01_研究論文/研究論文12.pdf

(※ https://www.crl.co.jp/pdf/thesis/01_%E7%A0%94%E7%A9%B6%E8%AB%96%E6%96%87/%E7%A0%94%E7%A9%B6%E8%AB%96%E6%96%8712.pdf

■会社概要

商号 : コグニティブリサーチラボ株式会社

代表者 :代表取締役 苫米地 英人

所在地 :〒106-0032 東京都港区六本木7-5-11

設立 : 2000年3月

事業内容 :ソフトウェア開発

URL : https://www.crl.co.jp/

【本プレスリリースに関するお問い合わせ先】

コグニティブリサーチラボ株式会社

E-Mail:info@crl.co.jp

タイトルとURLをコピーしました