高橋寛治

Sansan株式会社 技術本部 DSOC 研究開発部 Data Analysisグループ シニアリサーチャー

長岡技術科学大学大学院工学研究科修士課程電気電子情報工学専攻修了。在学中は、解析ツールの研究開発や機械翻訳の評価手法の考案など、自然言語処理の研究開発に取り組む。現在は、キーワード抽出など自然言語処理に関連する研究開発に従事。

Sansan Builders Stage 2021

2021/11/05 〜 2021/11/05
  • 国内講演者
  • 民間企業
  • その他職名

高橋寛治

Sansan株式会社 技術本部 DSOC 研究開発部 Data Analysisグループ シニアリサーチャー

継続して改善する固有表現抽出

ニュース配信のための企業名抽出をきっかけに、固有表現抽出に継続して取り組んでいます。ひとえに固有表現抽出といっても、タスク設計、データの作成、学習評価、実稼働と様々な工程が必要です。継続して改善に取り組む上では、わかりやすいコードであったり、アノテーションしやすいガイドラインといった枠組みが重要です。本発表では、前述の項目についてどのように取り組んで改善を重ねているかご紹介します。