⽇本経済新聞社(本社:東京都千代田区、代表取締役社長:長谷部剛)の情報サービスユニットに所属するデータサイエンティストの櫻井亮佑、増⽥太郎両⽒と、⽇経イノベーション・ラボ所属のデータサイエンティストである⻘⽥雅輝⽒らは、世界最⼤級のデータサイエンスコミュニティ「Kaggle」が開催した機械学習のコンペティション「U.S. Patent Phrase to Phrase Matching 」で1,889チーム中8位に⼊賞し、⾦メダルを受賞しました。この結果を受け、櫻井⽒と増⽥⽒が「Kaggle Master」、⻘⽥⽒が「Kaggle Expert」の称号を獲得しました。
今回のコンペティション( https://www.kaggle.com/competitions/us-patent-phrase-to-phrase-matching )は⾃然⾔語(テキスト)処理技術に関するものでした。具体的には特許において指定された分野の⽂脈を考慮しつつ、特定の2つのフレーズ間の類似度の予測性能を競いました。櫻井⽒、増⽥⽒、⻘⽥⽒らのチームの解法はこちらのブログ( https://hack.nikkei.com/blog/kaggle202207/ )でも解説されています。コンペティションは6月20日に終了しました。
⽇経では記事データなどの⼤量のテキストデータを活⽤したサービス・プロダクトの研究開発に注⼒しています。今回の結果が⽇経の⾃然⾔語処理に関する技術⼒を証明できただけでなく、同コンペティションから得られた知⾒が研究開発業務にも生かせると考えています。
社員がKaggleのコンペティションで⾦メダルを獲得するのは、⽇経イノベーション・ラボに所属する⽯原祥太郎⽒らが2019年に「PetFinder.my Adoption Prediction( https://www.kaggle.com/competitions/petfinder-adoption-prediction ) 」で優勝したことに続いて2度⽬です。
<Kaggleについて>
世界中からデータサイエンス・機械学習に興味のあるユーザが集う最⼤規模のオンラインコミュニティです。その中でもKaggleで開催されているコンペティションは、機械学習モデルの予測性能を競い合う⼈気コンテンツとなっています。⽇経は2019年にKaggle主催のオンサイトイベント「Kaggle Days Tokyo( https://www.kaggle.com/c/kaggle-days-tokyo )」でコンペティションを開催しただけでなく、⽯原⽒がKaggle関連の書籍を出版するなどKaggleコミュニティへの貢献を意識した取り組みを⾏ってきました。