Elith、ROOST・Hugging Face・OpenAI共催「Open Safeguard Hackathon」に日本企業として唯一参加

株式会社Elithは、2025年12月8日に米サンフランシスコで開催された、ROOST、Hugging Face、OpenAI共催の国際ハッカソン「Open Safeguard Hackathon」に参加したことをお知らせいたします。

本ハッカソンは、AIによるオンライン上のリスクやハームへの対応を目的に、オープンでコミュニティ主導のAIセーフティ技術を実践的に検証・開発する場として開催されました。
政策、研究、プロダクト実装の第一線で活動する専門家が集まり、セーフティモデルの活用や課題について集中的な議論と開発が行われました。
当日は、米国を中心にテック企業、研究機関、非営利団体などから約75名が参加しました。

OpenAIが公開したオープンウェイトのセーフティ推論モデル「gpt-oss-safeguard」をはじめ、複数のオープンセーフティモデルを用いた検証・実装が行われ、以下の3つのトラックに分かれてプロジェクトが進められました。

Policy Development：オープンセーフティモデルを活用したポリシー検証・改善
Model Testing：モデル性能やコストを含めた実践的評価
Real-World Applications：実運用を想定したプロダクト・ワークフローへの統合検証

Elithは、日本から唯一の参加企業として本イベントに参画し、AIセーフティモデルの実装・評価に関する国際的な知見や、オープンな技術基盤を活用した協調的な取り組みについて、現場レベルでの議論と検証に参加しました。

Track2（Model Testing）とTrack 3（Interpretability / Token-level Analysis）に参加し、セーフティモデルの挙動理解を目的とした技術検証を行いました。
gpt-oss-safeguardを対象に、判定に影響を与える要素やポリシーとの関係性について分析し、その結果を共有可能な形で整理しています。

本ハッカソンでの技術的成果は、ROOST Model Community 上の公式ディスカッション (#39, #40) にElithとして投稿し、国際的なAIセーフティ実装コミュニティに対して公開しました。

Track 2（Model Testing） — gpt-oss-safeguard 実践評価：
Elithは多層的評価パイプラインを用い、364件の攻撃プロンプトを体系的に設計・評価しました。これにより、gpt-oss-safeguard-20B に対する検出失敗（バイパス）がFraud や Malware カテゴリで顕著に発生する傾向を定量的に明らかにし、実運用環境で想定される攻撃パターンとそれに対するモデルの脆弱性を示しました。
Track 3（Interpretability / Token-level Analysis） — モデル内部挙動の可視化：

モデルの安全判定に寄与する内部表現を理解するため、カスタムAPI を用いたトークンレベルの注意重み解析を実装しました。これによって、どのトークンが安全性判断に強く関与しているかを可視化し、なぜ特定のバイパスが発生するのかという “理由” の解釈性を深める技術的アプローチを提示しています。

これらの投稿は単なる結果報告に留まらず、モデル評価と解釈性という二つの視点から、オープンセーフティモデルの実装上のリスクと挙動を国際標準レベルで検証・共有する意欲的な技術成果として発信されています。

本イベントを通じてElithは、実装現場におけるセーフティモデルの活用可能性や限界、ポリシー設計とモデル挙動の関係性について、国際的な実践知見を共有・吸収しました。

オープンな技術基盤を軸に、多様な組織が協調しながらAIセーフティを前進させるアプローチは、今後のAI社会実装において不可欠であると再認識しています。

Elithは今後も、生成AIおよびAIセーフティ領域において、研究・実装・社会的責任を横断する取り組みを国内外のパートナーとともに推進してまいります。

イベント概要

名称：Open Safeguard Hackathon
開催日：2025年12月8日
開催地：米国サンフランシスコ
主催：ROOST、Hugging Face、OpenAI

関連情報

Elith 提出内容（GitHub）：

■AIの導入・開発に関するご相談はこちら

AIの導入や開発、業務への適用に関するご相談を随時受け付けております。ご希望に応じ.て、Elithの開発・企画担当との個別相談（無料）をオンラインでご案内いたします。具体的な課題や構想が固まっていない段階でも、お気軽にお問い合わせください。

お問い合わせ

■株式会社Elith

Elithは、クライアントと共に課題を発見し、AIによる最適な解決策を共創するパートナーです。人・組織・技術といった多様な「粒子」を融合させ、混沌を恐れず活かすことで、エネルギーを増幅させながら加速的に成果を生み出します。私たちは、個の力を超えてイノベーションという「融合体」を創出し、次の時代を切り拓くテックカンパニーです。変化の最前線で、常に価値を生み出し続けます。

製造業、金融業、医療業など、さまざまな業種のクライアントの事業成長を支援するために、コンサルティング、生成AIの利活用、LLM（大規模言語モデル）、画像AIの開発・システム構築、AI教育アドバイザリーなどのソリューションを提供しています。

社名：株式会社Elith

代表者：代表取締役CEO＆CTO 井上顧基

本社所在地：東京都文京区本郷3-30-10本郷 K&Kビル1F

事業内容：AIに関する研究、開発、設計、企画、教育、販売、保守、コンサルティング業務

会社概要 URL：https://elith.ai

■本プレスリリースに関するお問い合わせ先

株式会社Elith Eメール：contact@elith.ai

最先端のAI技術の教育研修、開発・導入支援、コンサルティングについてのお問い合わせも、お待ちしております。