Sansan Builders Stage 2021

2021/11/05 〜 2021/11/05
  • 国内講演者
  • 民間企業
  • その他職名

高橋寛治

Sansan株式会社 技術本部 DSOC 研究開発部 Data Analysisグループ シニアリサーチャー

継続して改善する固有表現抽出

ニュース配信のための企業名抽出をきっかけに、固有表現抽出に継続して取り組んでいます。ひとえに固有表現抽出といっても、タスク設計、データの作成、学習評価、実稼働と様々な工程が必要です。継続して改善に取り組む上では、わかりやすいコードであったり、アノテーションしやすいガイドラインといった枠組みが重要です。本発表では、前述の項目についてどのように取り組んで改善を重ねているかご紹介します。