ナレッジベース構築プラットフォーム「Toposoid」が文章の曖昧性を吸収するAIを強化。

この記事は約5分で読めます。
Linked Ideal合同会社(本社:東京都立川市、代表社員:久保寺誠)は、文章の曖昧性を吸収するAIを強化したナレッジベース構築プラットフォーム「Toposoid」バージョン0.4を、2023年2月1日(水)にオープンソースソフトウェアとして公開致しました。
URL: https://toposoid.com
GitHub: https://github.com/toposoid/toposoid
■ 文章の曖昧性における自然言語処理技術の活用
私達が使用している言語には言い換えという機能があり、これが言語の世界を豊かにしています。例えば下記のような例を考えてみましょう。

toposoidv0.4toposoidv0.4

上記二つの命題はアインシュタインの特殊相対性理論の文脈の言い換えです。言葉を習得していればこの言い換えをヒトは同一視できますが、コンピュータにとってこのタスクは2017年くらいまでは苦手なものでした。しかし2018年Google社によって開発された汎用言語モデルBERT(※1)という技術により、この課題に大きな進展があり、現在でも全世界で盛んに研究が行われております。弊社では近年発展してきたBERTモデルの技術的ノウハウ(事前学習、ファインチューン、転移学習etc.)を蓄積してきており、今回「Toposoid」のバージョンアップで利用可能に致しました。

■ 言語の違いも吸収
今回の「Toposoid」のバージョンアップでは言語の違いを超えて推論ができるよう、多言語BERT(※2)というモデルを採用しました。多言語BERTはまだ研究途上の技術ではありますが、「宇宙は膨張している。」と「The universe is expanding.」を同じ意味の文章と解釈してくれます。今後研究が進めば、違った言語(例えば、英語と日本語)で書かれた知識を区別することなく利用して推論ができるようになります。「Toposoid」は現在日本語と英語の推論に対応(※3)しており、今後の多言語BERTの精度向上に期待しております。

■ AIのブラックボックス問題
AIのブラックボックス問題というAIの課題をご存知でしょうか?AIが導き出した回答に対して、何故その回答に至ったのかAIが人間にわかる形で説明できない問題です。説明可能性問題とも言います。例えば、2015年にGoogleフォトがあるアフリカ系の米国人をゴリラとタグ付けしてしまい、それがSNSで拡散されるという事件がありました。しかしGoogleフォトで使用された画像認識AIの精度は高く、当時何故識別ミスをしたのか原因がわからず対処できませんでした。「Toposoid」では、このような課題に自然言語処理の方面からチャレンジし続けています。今回のバージョンアップでは、与えられた命題に対して文章の曖昧性を解消しながら解釈しつつ、同時に論理的に何故説明できるかという部分も合わせて命題の真偽を計算させる機能の両立を目指しました。この改善がAIのブラックボックス問題に対する一つの貢献になればと期待しております。

■ 今後の抱負
全世界で情報が加速的に溢れていく中、言語の壁を超えて正しい知識を利用しかつ、ヒトに納得感のある回答を与えるAIの実現と精度向上は、ファクトチェックなど様々な分野で期待されております。そしてヒトは膨大な情報に振り回される煩わしさから解放されるべきです。今後とも「Toposoid」はいつでも誰でも膨大な情報から説明可能性のある正しい情報を取得できるシステムの実現にチャレンジし、情報の民主化に一つの貢献ができればと思っております。

■ 用語説明
(※1)BERT
Bidirectional Encoder Representations from Transformers(BERT)は、自然言語処理の深層機械学習手法の一つです。BERT は、Google の Jacob Devlin と彼の同僚によって2018年に作成され公開されました。この手法は自然言語処理分野のさまざまなベンチマークにおいて従来モデルの精度を上回り、近年非常に注目されています。
(※2)多言語BERT(MultilingualBERT)
多言語BERTはBERTモデルを多言語に拡張したモデルで、現在104言語のWikipediaデータで学習されたモデルなどが公開されております。https://huggingface.co/bert-base-multilingual-cased
(※3)ナレッジベース構築プラットフォーム「Toposoid」が英語文章に対応。日本語、英語の同時推論も可能に。
https://prtimes.jp/main/html/rd/p/000000003.000087522.html

■ 【会社概要】

タイトルとURLをコピーしました