Back to list

Detail of contribution

Auteur: Kamel NEBHI

Titre:
Extraction de relations basées sur une Ontologie pour le Web Sémantique


Abstract/Résumé: La vision du Web Sémantique décrit par Sir Tim Berners-Lee en 1998 veut structurer les informations disponibles sur le World Wide Web pour permettre à des agents logiciels de raisonner sur le contenu des pages. L’annotation sémantique des documents Web est donc une étape clé pour la réalisation du Web sémantique à grande échelle. À terme, l’association des technologies du Web sémantique et la mise à disposition de ressources annotées permettraient par exemple d’inférer une nouvelle connaissance à partir de la connaissance apportée par les ontologies. Depuis une dizaine d’années, la majorité des recherches effectuées dans le domaine de l’annotation (semi-)automatique pour le Web sémantique (SHOE, KA2) ont été faites par des chercheurs issus de l’intelligence artificielle et comme nous fait remarquer A. Prareja-Lora : "[...] these researchers have been neglecting, somehow, the decades of work and the results obtained in the field of Corpus Linguistics on corpus annotation, not only in the semantic level, but also in other linguistic levels." Au vu des résultats peu convaincants obtenus en intelligence artificielle, il apparaît clairement que l’automatisation du processus d’annotation de documents pour le Web sémantique passe par l’utilisation de techniques issues du traitement automatique du langage naturel comme l’extraction d’information, la désambiguïsation ou la reconnaissance de termes. La majorité des systèmes d’annotation sont centrés sur la reconnaissance d’entités nommées. Toutefois, certains travaux tentent de définir les relations entre les entités nommées avec des résultats encore limités. Cet article dresse tout d’abord un état de l’art des approches proposées pour extraire les relations sémantiques entre les entités nommées. Ensuite, nous présentons un système d’extraction d’information pour le français basé sur une ontologie et fondé sur une approche essentiellement linguistique. Cette approche permet d’extraire les relations sémantiques entre les entités nommées en exploitant les contextes syntaxiques. Enfin, nous analysons les premiers résultats de notre expérience obtenus à partir d’un corpus journalistique.