ー約20万人の競技人口の0.2%が保有する最上位称号「Kaggle Competition Grandmaster」に昇格ー
株式会社松尾研究所(以下、「松尾研究所」)のデータサイエンティストである奥村悠希が、世界最大のAIコンペティション「Kaggle(カグル)」主催の「Deep Past Challenge - Translate Akkadian to English」で金メダルを獲得しました。奥村は、今回のコンペティションにより世界で393番目のCompetitions Grandmasterに認定されました。これは、競技人口約20万人のうち上位0.2%に相当します。
 
「Kaggle」とは、データ分析や機械学習に関する課題を競い合うオンラインプラットフォームです。世界中のデータサイエンティストや統計家などが参加しており、AI人材の育成や企業の課題解決に役立っています。本コンペティションには世界トップレベルのデータサイエンティストや機械学習エンジニアが多数参加しており、この度の受賞は、松尾研究所のデータサイエンティストの発想力と技術力が世界的に認められたものと考えています。
 
取り組み内容
本コンペティションでは、約4,000年前の古代アッシリア商人たちが残した楔形文字文書を対象に、転写された古アッシリア語(アッカド語の一方言)を英語へ翻訳するモデルの構築が求められました。データが限られ、文法も複雑な古代言語に対応した翻訳モデルを設計・実装し、商業記録や書簡をどれだけ正確に英語へ翻訳できるかを競いました。
 
受賞者コメント
株式会社松尾研究所 データサイエンティスト
奥村 悠希
 
アッカド語は低リソース言語であるため、学習データの拡充が必要不可欠でした。そのため、VLMを用いてPDF形式の非構造化デー
タを整理しながら、対訳コーパスを丁寧に抽出しました。さらに、継続事前学習や逆翻訳データの追加など、翻訳モデルの性能向上に役立つ手法も活用し、精度向上につなげることができました。今回のコンペティションをきっかけに、アッカド語の解析がさらに進むことを願っています。
 
参考記事:「様々な事業ドメインの課題を解くことができる」Kaggleマスターが松尾研究所に入社した理由。
採用について
松尾研究所では、Kaggle Grandmasterをはじめとしたトップレベルのデータサイエンティストが在籍し、日々切磋琢磨しながらAIの社会実装に取り組んでいます。同じ志を持ち、より高いレベルで挑戦したい方とお会いしたいです。
下記求人よりお気軽にご応募ください。まずはカジュアル面談でお話しさせてください。
 
▼ 求人ポジション
シニアデータサイエンティスト:https://open.talentio.com/r/1/c/matsuo-institute/pages/77463
Recruit Infomation
 
株式会社松尾研究所について
株式会社松尾研究所は国立大学法人 東京大学大学院 工学系研究科 松尾・岩澤研究室に伴走し、大学を中心としたイノベーションを生み出す「エコシステム」を作り、大きく発展させることを目的に設立された研究所です。松尾研究所は、アカデミアから生み出される研究成果・技術の「開発・実装」を行い、広く社会に普及を目指し、日本の産業競争力の向上に貢献しています。
松尾研究所について:http://matsuo-institute.com
About us