Also known as document categorization, text categorization
problem in library science, information science and computer science
Se define como la tarea de asignar valores booleanos a cada par pertenecientes a , donde es el dominio de los documentos y es una colección de categorías predefinidas. T (verdadero) indica archivar un documento bajo , mientras F (falso) indica no archivar bajo . Entre las aplicaciones que encuentra la clasificación de documentos se tienen los filtros de correo electrónico (spam / no spam) Las medidas de evaluación utilizadas en la clasificación de documentos son principalmente precisión, cobertura y F-1.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).