Notre moteur peut se connecter à tout type de données afin de les indexer. Chaque élément est paramétrable et abouti à une hiérarchisation des données.
Notre moteur s’interface avec multiples canaux : site internet, réseau sociaux, stockage disque, … Notre moteur, qui a pour objectif d’indexer la totalité de vos supports va pouvoir se connecter à chacun d’entre eux pour les réunir au sein de la recherche.
Crawl de contenus hétérogènes
Notre moteur est conçu pour se connecter à un maximum de données afin de balayer tout le spectre de votre communication.
A partir d’une URL et/du chemin du SiteMap, notre moteur va indexer la totalité des pages et des documents. Notre moteur va également indexer le contenu des documents en téléchargement.
Nous utilisons les API des principaux réseaux sociaux (Twitter, Facebook, Instagram, Youtube) et stockons en local votre contenu publié.
Tous les fichiers sont pris en charge et seront intégrés au moteur. Nous prenons alors le nom du fichier, l’arborescence et les métadonnées. Pour certains fichiers, nous allons en plus indexer le contenu du fichier (pdf, doc, docx, odt, txt).
A partir du moment ou un document est accessible et donc visible par un utilisateur, il peut être indexé dans notre moteur. Bases connectables : fichier XML, CSV, bases SQL (MySQL, PostgreSQL, SQL Serveur), MongoDb
Pour chacun de ces éléments, il est possible de paramétrer la pondération et la fréquence de remise à jour du crawl