Español      Français      English 

EVALTEC, Gestion de la Recherche et le Développement Technologique

Gestion de projets - Commercialisation de technologies - Internationalisation

 

La Minierie de Textes

 

La minierie de textes est un procès de extraction de connaissance à partir de grands volumes d’information, pas nécessairement structuré, laquelle inclus la compréhension du contenu des documents, ça veut dire, son “entendrement”. L’information peut être obtenue de n’importe quelque source comme bases de donnés, documents internes, Internet, courrier, nouvelles, etc. et la traiter après.

 

Ceci signifié que taches comme le classement de documents, la lecture du courrier, la synthèse de contenues de expédients et rapports, analyse de nouvelles et commentaires, etc. peuvent se réaliser de façon automatique.

 

Les phases de la Minierie de Textes

 

Il y a trois phases fondamentales dans le procès de la minierie de textes:

1 -   L’extraction de l’information.

2 -   La clusterisation ou groupement.

3 -   La catégorisation.

 

En général, le procès de travail commence avec l’extraction de l’information, ça veut dire, l’analyse linguistique des sources premières. Pour cette phase il est nécessaire un connaissance préliminaire de la langue, de les caractères spéciales et de les termes relatives au domaine de connaissance analysé.

 

Après il est nécessaire classer l’information, bien à travers des critères de classement déjà disponibles, ou moyennant un clusterisateur qui peut suggérer automatiquement un nombre de groupes et critères pour classer l’information de façon optimal.

 

Le procès de catégorisation adressera l’information dans les divers groups ou clusters déterminés avant.

 

Taxonomies et “cartouches”

 

Les taxonomies sont les structures linguistiques et conceptuels qui conforment un domaine du savoir.

 

Une partie fondamentale des outils de la minierie de textes ce sont les “cartouches”. Chaque “cartouche” contient l’information relative aux critères applicables dans les procès d’extraction, clusterisation et catégorisation. Ça veut dire, contiens relations, fourni relevance à certaines expressions, a terminologie spécifique, verbes modales et jugements, ou structure typique qui présente l’information. Font possible la compréhension de la langue écrite dans domaines techniques, commerciales ou du savoir déterminés. En définitive, ils sont concrétions pratiques des taxonomies.

 

Applications de la Minierie de Textes

 

Les nouveaux outils de la minierie de textes permettent pour tant grands économies de coût et temps en procès telles comme analyse de fonds de documents et cartographie de documents, routage de documentation, nourrisson de bases de connaissance, veille technologique, gestion d’information en centres d’attention aux clients, etc.

 

Telle et comment a été signale avant, activités comme le classement de documents, lecture du courrier, synthèse de contenus d’expédients et rapports, analyse de nouvelles, etc. peuvent s’automatiser.

 

 

Source: Présentation de la Dr Mme Elicet Cruz ©2004 - IALE Tecnologia.         *   twitter @ialeT

 

 

EVALTEC, Gestión de Investigación y Desarrollo Tecnológico, S.L. - C.I.F.: B-83399204 - ©2002-2021

Inscrita en el Registro Mercantil de Madrid, Tomo 18.001, Folio 56, Sección 8, Hoja M-311087