Skip to content

Latest commit

 

History

History
23 lines (12 loc) · 2.36 KB

extract-any-entity-from-text-with-gliner-32b413cea787.md

File metadata and controls

23 lines (12 loc) · 2.36 KB

使用 GLiNER 从文本中提取任何实体

原文:towardsdatascience.com/extract-any-entity-from-text-with-gliner-32b413cea787?source=collection_archive---------2-----------------------#2024-03-24

GLiNER 是一个命名实体识别(NER)模型,能够通过双向变换器编码器(类似于 BERT)识别任何类型的实体,并在零-shot 令牌分类任务中超越 ChatGPT 和其他大型语言模型(LLM)。

Andrea D'AgostinoTowards Data Science Andrea D'Agostino

·发表于Towards Data Science ·6 分钟阅读·2024 年 3 月 24 日

--

图片来源:Matt HardyUnsplash

曾经使用过 NER(命名实体识别)范式的人都深知,拥有一个在特定任务上表现出色的模型是多么重要。

事实上,NER 模型对于数据挖掘和文本分析任务极为有用 —— 它们是所有数字智能任务的基础,并且与更大、更复杂的数据科学管道中的各种任务息息相关。

从事 NER 的人也深知,由于训练阶段需要指定大量标签,训练这样一个模型是多么复杂。像 SpaCy 和基于变换器的 Hugging Face 模型等库,极大地帮助了数据科学家以更加高效的方式开发 NER 模型,并且在一定程度上持续改善这一过程。

在本文中,我们将一起探讨GLiNER 范式,一种结合经典 NER 范式与大型语言模型(LLM)强大能力的新型实体提取技术。