实战演练1:实战演练之命名实体识别
- 命名实体识别简介
- 代码
命名实体识别简介
- 什么是命名实体识别任务
- 命名实体识别(Named Entity Recognition,简称NER)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分:
- (1)实体边界识别。(2)确定实体类别(人名、地名、机构名或其他)。
- 数据标注体系:IOB1、IOB2、IOE1、IOE2、IOBES、BILOU
- IOB2标注
- 表示实体内部,O表示实体外部,B表示实体开始
- B/I-XXX,XXX表示具体的类别
- IOBES标注
- I表示实体内部,O表示实体外部,B表示实体开始,E表示实体结束,S表示一个词单独形成一个命名实体
- 有时也会使用M代替I,但本质是同一含义
- 评估指标:Precision(预测中预测对的)、Recall(真实中预测对的)、F1