ワークス徳島人工知能NLP研究所、「徳島県地域情報化表彰」受賞 産学官共同研究や、760万DLされた自然言語処理のOSSなどを評価

この記事は約6分で読めます。
 株式会社ワークスアプリケーションズ(本社:東京都千代田区、代表取締役最高経営責任者:秦修、以下 WAP)のワークス徳島人工知能NLP研究所が、地域情報化の推進に寄与したとして2022年度の「徳島県地域情報化表彰(e-とくしま表彰)」を受賞することが決定しました。同研究所は2017年に開所し、チャットボットや検索エンジン、機械翻訳に不可欠な自然言語処理の研究を行っています。産学官連携の取り組みのほか、研究成果をOSS(オープンソースソフトウェア)*1の形で無償提供して幅広く活用されている点などが評価されました。表彰式は1月25日に徳島市内で開かれます。

 

  • 徳島県における地域情報化の推進に貢献したとして評価されたポイント

 研究所では私たちが日ごろ使っている自然言語処理分野における研究開発を産学官連携で進めており、その成果は国際学会でも評価*2され、当該分野における基礎研究の発展に貢献しています。また、研究成果をOSSとして無償公開しています。例えば、徳島名産のすだちを冠したOSSである「Sudachi」は、国内最大規模290万語(2022年5月現在)の語彙が登録された、自然言語処理を行うための基盤技術である形態素解析*3を行うツールです。Sudachiシリーズのひとつである「SudachiPy」は現在760万ダウンロードされており、日本語処理のためのOSSのなかでは上位のダウンロード数*4となります。これらのOSSは、企業や研究機関にて膨大なデータからの情報検索やテキスト分類、画像やPDFに記載された文字列の読み取り精度向上などに活用されています。

 また徳島大学との共同研究や、徳島大学のベンチャー企業との意見交換など、徳島県内の大学や企業との連携も行っています。国内では奈良先端科学技術大学院大学や人間文化研究機構国立国語研究所とも共同研究を実施しており、最近では、徳島県に開設された消費者庁新未来創造戦略本部がSudachiを活用した論文*5を発表した例もあります。
 

  • 世界の自然言語処理研究者が徳島へ、国際色豊かなメンバーが参画

 日本語が研究対象のワークス徳島人工知能NLP研究所ですが、現在フランス、ベトナム、インドネシア、ロシアなどの研究者が開発に取り組んでいます。シンガポールや上海にあるWAPグループ会社の研究者とも協力し、国際色豊かなメンバーが研究開発を行っています。また、所長の内田佳孝をはじめ、徳島出身の研究者も約3名在籍しています。

<所長 内田佳孝 プロフィール>
高専でロボットコンテストに参加し、人工知能に興味を持つ。2000年、九州工業大学情報工学部に編入学。自然言語処理の分野で対話システムの研究を行い、04年、修士課程修了後、徳島にあるジャストシステムに入社。約12年にわたり自然言語処理の研究開発から商品化に携わる。16年7月、ワークスアプリケーションズ入社。
 

ご希望いただければ所長の内田や、研究者への取材も調整いたしますので、
こちらにご連絡いただきますようお願いします。

ワークスアプリケーションズ広報担当
pr@worksap.co.jp

 

  • ワークス徳島人工知能NLP研究所について

 大手企業向けのERPやグループウェアの開発・販売などを行うWAPグループが2017年2月に開設した研究機関で、AI分野の中でもNLP=自然言語処理=に特化して曖昧な表現や意味の重複、表記の揺れがある言葉をコンピュータが正しく処理するための研究を行っています。研究成果の多くはチャットボットやAI-OCRなどの自社製品に活用しているほか、ほかの企業や研究機関で活用できるようにOSSとして無償公開しており、この分野の研究や企業のAI活用に役立てていただいています。

【例】曖昧さや表記の揺れ

単語の曖昧さ はしー橋ー端ー箸 あじー味ー鯵
文字種の違い 向日葵ーひまわりーヒマワリ
送り仮名の違い 受け付けー受付けー受付

 OSSの研究開発をさらに加速させるため、研究所ではSudachi GitHubスポンサーを募集しています。個人・団体を問わず、スポンサー料1ドルから、何回でも支援していただけます。スポンサー料へのリワードとして、ウェブサイトへのロゴ掲載、スポンサー用チャットスペース参加、ワークショップ開催などをご用意しております。くわしくは以下サイトよりご覧ください。
https://github.com/sponsors/WorksApplications

*1.OSS(オープンソースソフトウェア(Open Source Software)):ソースコードが公開されており、無償で誰でも自由に改変、再配布が可能なソフトウェア

*2.【例】
2018年 言語資源に関する世界最大の学会「第11回 言語資源と評価に関する国際会議(LREC/エルレック)」に採択
2021年 電気情報通信学会 言語理解とコミュニケーション研究会(NLC)の優秀研究賞(Best paper Award)を受賞

*3.形態素解析:自然言語処理(NLP)を行う基盤となる工程で、普段の生活で一般的に使っている言葉である「自然言語」を形態素(言葉が意味を持つまとまりの単語の最小単位)にまで分割し、品詞などの情報を付与する技術。形態素に分割することで、構文の解析、意味の解析、文脈の解析ができる。
【例】私は本を読みました
       →私(名詞)/は(助詞)/本(名詞)/を(助詞)/読み(動詞)/まし(助動詞)/た(助動詞)

*4.Python Package Indexに登録されたパッケージのダウンロード数
出典:https://github.com/taishi-i/awesome-japanese-nlp-resources

*5.出典:消費者庁新未来創造戦略本部国際消費者政策研究センター PIO-NETを利用した消費者問題の傾向分析(https://www.caa.go.jp/policies/future/icprc/research_004/assets/future_caa_cms201_220418_02.pdf

 

  • ワークスアプリケーションズ・グループについて

 ワークスアプリケーションズ・グループは、1996年の創業以来、日本発の業務アプリケーションのパッケージソフトウェア会社として、主に国内の大手企業向けに製品・サービスを提供してまいりました。「働く」の概念を変え、仕事をより創造的なものへ、企業の生産性を高め、企業価値を拡大する、この企業理念のもと、ERPを軸としたソリューションプロバイダーとして、大手企業に加えて中堅・中小・スタートアップ企業のDX推進のパートナーとなれるよう、さらなる発展を目指していきます。
株式会社ワークスアプリケーションズ サイト https://www.worksap.co.jp/

*会社名、製品名およびサービス名は各社の商標または登録商標です。
*本リリースに掲載された内容は発表日現在のものであり、予告なく変更または撤回される場合があります。また、本リリースに掲載された予測や将来の見通しなどに関する情報は不確実なものであり、実際に生じる結果と異なる場合がありますので、予めご了承ください。

タイトルとURLをコピーしました