Files
dictia-public/client_docs/guide-admin/recherche-semantique.md

61 lines
4.4 KiB
Markdown

# Recherche sémantique
La section Recherche sémantique contrôle l'intelligence derrière la Recherche IA, la capacité de recherche sémantique de DictIA qui permet aux utilisateurs de trouver de l'information dans tous leurs enregistrements en posant des questions en langage naturel.
## Comprendre la Recherche IA
La Recherche IA fonctionne en plusieurs étapes :
1. Chaque transcription est découpée en segments de texte qui se chevauchent
2. Ces segments sont convertis en représentations mathématiques (indexation sémantique)
3. Les segments indexés sont stockés dans un format permettant la recherche
4. Lorsqu'un utilisateur pose une question, celle-ci est convertie dans le même format mathématique et comparée à tous les segments stockés
Cette approche va bien au-delà de la simple correspondance de mots-clés. Le système comprend que "préoccupations budgétaires" est lié à "contraintes financières" et "dépassements de coûts", même si les mots exacts diffèrent. Cette compréhension sémantique rend la Recherche IA très puissante pour découvrir de l'information que les utilisateurs ne se rappellent pas précisément.
## Statut du traitement
Les cartes de statut donnent un aperçu immédiat de la santé de votre recherche sémantique :
- **Enregistrements totaux** : Le nombre de fichiers audio dans votre système
- **Traités pour la Recherche IA** : Le nombre d'enregistrements convertis en segments indexés et recherchables. Ce nombre devrait éventuellement correspondre au total, avec un léger décalage pendant le traitement
- **En attente de traitement** : Les enregistrements en attente d'indexation sémantique. Ce nombre augmente lorsque les utilisateurs téléversent du nouveau contenu et diminue à mesure que le traitement avance
- **Segments totaux** : Les morceaux détaillés dans lesquels vos enregistrements ont été divisés. Un enregistrement typique d'une heure génère environ 50 à 60 segments
- **Statut de l'indexation** : Un indicateur rapide de santé. "Disponible" en vert signifie que tout fonctionne correctement
## Progression du traitement
La barre de progression montre l'avancement en temps réel dans la file d'attente d'indexation sémantique :
- **100 %** : Tous les enregistrements sont traités et recherchables
- **Pourcentages inférieurs** : Le traitement est en cours
- **Barre bloquée** : Le traitement s'est peut-être arrêté. Contactez le support InnovA AI
## Gérer la file d'attente
Le bouton **Actualiser le statut** met à jour toutes les statistiques et indicateurs de progression. L'interface ne se rafraîchit pas automatiquement; des actualisations manuelles garantissent que vous voyez les informations actuelles.
Si le système indique que des enregistrements nécessitent un traitement mais que la progression n'avance pas, contactez le support InnovA AI pour diagnostiquer le problème.
Le système de traitement est conçu pour être résilient. Si le traitement échoue pour un enregistrement spécifique, le système le marque et passe au suivant plutôt que de rester bloqué.
## Conseils pour de meilleurs résultats de recherche
La qualité des résultats de recherche dépend en partie de la formulation des requêtes. Encouragez les utilisateurs à :
- **Poser des questions complètes** plutôt que de taper des mots-clés. "Qu'est-ce que Marie a dit au sujet du budget?" fonctionne mieux que simplement "Marie budget".
- **Utiliser des termes variés** : La recherche sémantique comprend les synonymes et les concepts connexes
- **Être spécifique** lorsque c'est possible : Plus la question est précise, plus les résultats seront pertinents
## Considérations de performance
La recherche sémantique croît de façon prévisible avec votre contenu. Chaque segment nécessite environ 2 Ko de stockage. Un enregistrement typique d'une heure nécessite environ 100 Ko de stockage d'indexation. Le système maintient des performances rapides même avec de grandes quantités de données.
Si votre instance croît de façon significative, les politiques de [rétention](retention.md) aident à gérer à la fois le stockage et la performance de la recherche. La recherche sémantique n'inclut que les enregistrements actifs; la suppression du contenu obsolète améliore les performances de recherche.
Pour toute question technique sur la performance de la recherche sémantique, contactez le support InnovA AI.
---
Retour au [Guide d'administration](index.md) →