Je viens de mettre en ligne mon rapport de stage que j’ai fait au laboratoire d’informatique de Florence, en Italie, sur les moteurs de recherche utilisant une structure de type GRID.
J’ai aussi mis en ligne la présentation que j’ai faite lors de ma soutenance de stage.
Les deux documents sont au format PDF, et les droits d’auteurs me reviennent, bien évidement.
Petit appercu du rapport :
The Ronin project is an ambitious project that is about to develop a distributed web search engine, that can be used at first for searching computer science articles like the specific search engine CiteSeer does (http://citeseer.ist.psu.edu).
The principal asset of this project is that it uses a method called « Focused Crawling » for getting a higher range of probability in web pages classification system. In a simple way, this system evaluates if a web page belongs to a community, and if so, there is a high probability that this web page talks about the same topic than the community.
The other particularity of this search engine is that it will work in a distributed environment. In this way it will permit to add computers to the Ronin network for sharing time computing and resources. For example if a laboratory wants to participate to the Ronin project it will be able to add one or more computers to the existing network, and in this way the search engine will be more powerful and more efficient in terms of coverage of the Web.
Pour télécharger le rapport
Pour télécharger la présentation
Le rapport est en anglais, par contre la présentation est en francais.
Il est aussi possible de télécharger ces documents directement depuis mon CV.