Sansan株式会社 技術本部 DSOC 研究開発部 Data Analysisグループ シニアリサーチャー
長岡技術科学大学大学院工学研究科修士課程電気電子情報工学専攻修了。在学中は、解析ツールの研究開発や機械翻訳の評価手法の考案など、自然言語処理の研究開発に取り組む。現在は、キーワード抽出など自然言語処理に関連する研究開発に従事。
※ プロフィールの引用元は「Sansan Builders Stage 2021」になります。
※ 登壇者情報には同姓同名も含まれている場合があります。
※ 詳細は以下の一覧をご確認ください。
継続して改善する固有表現抽出
ニュース配信のための企業名抽出をきっかけに、固有表現抽出に継続して取り組んでいます。ひとえに固有表現抽出といっても、タスク設計、データの作成、学習評価、実稼働と様々な工程が必要です。継続して改善に取り組む上では、わかりやすいコードであったり、アノテーションしやすいガイドラインといった枠組みが重要です。本発表では、前述の項目についてどのように取り組んで改善を重ねているかご紹介します。