You can edit almost every page by Creating an account. Otherwise, see the FAQ.

Benoemde-entiteit herkenning

Uit EverybodyWiki Bios & Wiki
Ga naar:navigatie, zoeken


Benoemde-entiteit herkenning (NER) is een proces van informatieverwerking waarbij informatie in een tekst wordt geclassificeerd in vooraf bepaalde categorieën.

Het meeste onderzoek naar NER-systemen is gestructureerd als (a) het nemen van een niet-geannoteerd stuk tekst, zoals:

Jim kocht 300 aandelen van Acme Corp. in 2006.

En (b) het produceren van een geannoteerd stuk tekst dat de namen van de entiteiten markeert:

[Jim]Persoon kocht 300 aandelen van [Acme Corp.]Organisatie in [2006]Tijd.

In dit voorbeeld zijn een persoonsnaam, een bedrijfsnaam en een tijdsaanduiding gedetecteerd en geclassificeerd.

Tegenwoordig zijn er NER-systemen (voor het Engels) die bijna net zo goed presteren als mensen met betrekking tot het op deze manier annoteren van zinnen.[1]

Proces[bewerken]

Het proces van benoemde-entiteit herkenning bestaat uit twee stappen.

Ten eerste moeten de benoemde entiteiten die in een zin of stuk tekst staan gedetecteerd worden. Wanneer de entiteiten gedetecteerd zijn, is de volgende stap om ze te classificeren volgens het type entiteit waar ze naar verwijzen. Hiervoor moet een ontologie worden gekozen aan de hand waarvan wordt gecategoriseerd.

Naast eigennamen kunnen ook tijdsaanduidingen en sommige numerieke uitdrukkingen als benoemde entiteiten worden beschouwd.[1]

Probleemstelling[bewerken]

Een probleem dat bij het detecteren van benoemde entiteiten komt kijken, is dat sommige entiteiten andere entiteiten bevatten. Zo is 'Rijksuniversiteit Groningen' een organisatie die de locatie 'Groningen' bevat. De meeste systemen voor benoemde-entiteit herkenning classificeren in dit geval enkel 'Rijksuniversiteit Groningen' als geheel.[2]

Ook het classificeren van de entiteiten kan tot problemen leiden. Hoewel het voor mensen een relatief duidelijk proces is, ligt dit voor computers anders. Dit komt onder andere doordat sommige namen dubbelzinnig zijn. Een voorbeeld hiervan is de term "Den Haag" die kan refereren aan zowel de stad Den Haag ("Het Mauritshuis[Organisatie] staat in Den Haag[Locatie].") als de Nederlandse regering ("Den Haag[Organisatie] heeft besloten de belastingen te verhogen.").[3]

Referenties[bewerken]

  1. 1,0 1,1 (en) (2022-08-13)Named-entity recognition. Wikipedia .
  2. (en) Finkel, J.R., Manning, C.D.. "Nested named entity recognition", 2009-08. Geraadpleegd op 2022-09-25.
  3. (en) Nadeau, D., Turney, P.D.; Matwin, S.. "[https://web-archive.southampton.ac.uk/cogprints.org/5025/1/NRC-48727.pdf Unsupervised Named-Entity Recognition: Generating Gazetteers and Resolving Ambiguity]", 2006-06. Geraadpleegd op 2022-09-30.Dit artikel "Benoemde-entiteit herkenning" is uit Wikipedia. De lijst van zijn auteurs is te zien in zijn historische   en/of op de pagina Edithistory:Benoemde-entiteit herkenning.Read or create/edit this page in another language[bewerken]