Formats de fichiers pris en charge
August prend en charge divers formats de fichiers pour les flux de travail d'analyse de documents, de révision, de transcription et de rédaction. Différents formats servent à des fins différentes selon la fonctionnalité que vous utilisez et le type de travail que vous devez accomplir.
Formats de documents
Les formats de documents sont les entrées principales pour les flux de travail d'Assistant, de Révision Tabulaire et de rédaction de clauses.
Documents Word (.docx)
Les documents Microsoft Word sont les formats les plus courants pour le travail de rédaction et d'édition juridique dans August.
Idéal pour : Les brouillons, les accords et tous les documents pour lesquels vous devez produire des modifications suivies ou des sorties éditables.
Fonctionnalités : Extraction de texte intégral, analyse de clauses, comparaison (redlining) et exportations avec suivi des modifications.
Utilisation avec : Assistant pour l'analyse et la rédaction ; Révision Tabulaire pour la comparaison ; Rédaction de clauses dans Word pour les modifications en ligne.
PDF (.pdf)
Les fichiers au format PDF (Portable Document Format) sont largement utilisés pour les accords signés, les documents numérisés et les documents finalisés.
IdĂ©al pour : Les accords finalisĂ©s, les contrats signĂ©s et les documents oĂč la prĂ©servation de la mise en forme originale est importante.
FonctionnalitĂ©s : Extraction de texte, traitement OCR pour les documents numĂ©risĂ©s (y compris les PDF en image uniquement), analyse de clauses et rĂ©sultats prĂȘts pour citation.
Utilisation avec : Assistant pour l'analyse et les questions-réponses ; Révision Tabulaire pour la comparaison multi-documents.
Pour de meilleurs résultats avec les PDF numérisés, assurez-vous que le document est clairement lisible. August applique automatiquement l'OCR pour extraire le texte des PDF basés sur des images.
PDF protégés par mot de passe
August gÚre les PDF protégés par mot de passe différemment selon le type de protection :
Les PDF protĂ©gĂ©s par un mot de passe utilisateur nĂ©cessitent un mot de passe pour ĂȘtre ouverts. August vous demandera de saisir le mot de passe lors du tĂ©lĂ©chargement afin que le document puisse ĂȘtre traitĂ©.
Les PDF protégés par un mot de passe propriétaire (également appelés PDF à restrictions de permissions) restreignent l'édition, l'impression ou la copie, mais s'ouvrent sans mot de passe dans la plupart des lecteurs. August télécharge ces fichiers sans demander de mot de passe.
Si un PDF s'ouvre normalement dans Acrobat, Aperçu ou Chrome sans demander de mot de passe, il devrait pouvoir ĂȘtre chargĂ© dans August sans en nĂ©cessiter un, mĂȘme si des restrictions d'utilisation sont appliquĂ©es au fichier.
Texte brut (.txt)
Les fichiers texte brut fournissent un contenu non formaté pour l'analyse et le traitement.
Idéal pour : Le contenu textuel brut, les extraits de code, les notes et tout contenu ne nécessitant pas de mise en forme.
Fonctionnalités : Traitement direct du texte sans surcharge d'extraction, adapté pour une analyse rapide.
Utilisation avec : Assistant pour l'analyse et les questions-réponses.
Markdown et HTML (.md, .html)
Les fichiers Markdown et HTML sont des formats de texte structurés couramment utilisés pour la documentation et le contenu Web.
Idéal pour : La documentation technique, les notes structurées et le contenu avec balisage de mise en forme.
Fonctionnalités : Extraction de texte avec préservation de la structure le cas échéant.
Utilisation avec : Assistant pour l'analyse et la révision de contenu.
Formats de feuilles de calcul
Les formats de feuilles de calcul permettent l'analyse de données tabulaires, d'échéanciers financiers et d'informations structurées.
Excel (.xlsx)
Les feuilles de calcul Microsoft Excel sont le format de feuille de calcul principal pour les données financiÚres, les échéanciers et l'analyse tabulaire.
Idéal pour : Les échéanciers financiers, les tables de capitalisation, les matrices de transaction et les ensembles de données structurés nécessitant une analyse tabulaire.
Fonctionnalités : Extraction au niveau des cellules, prise en compte des formules et analyse de données structurées.
Utilisation avec : Assistant pour les questions-réponses sur le contenu des feuilles de calcul ; Révision Tabulaire pour l'extraction structurée.
CSV (.csv)
Les fichiers de valeurs séparées par des virgules fournissent des données tabulaires simples sans mise en forme ni formules.
Idéal pour : Les exportations de données, les données tabulaires simples et le contenu de feuille de calcul non formaté.
Fonctionnalités : Extraction de texte structuré pour l'analyse tabulaire.
Utilisation avec : Assistant pour l'analyse de données et les questions-réponses.
Formats de présentation
Les formats de présentation permettent l'analyse de diaporamas et de supports visuels.
PowerPoint (.pptx)
Les fichiers Microsoft PowerPoint contiennent des présentations de diapositives avec du texte, des images et du contenu structuré.
Idéal pour : Les pitch decks, les supports de formation et les présentations nécessitant une extraction de contenu ou une synthÚse.
Fonctionnalités : Extraction de texte diapositive par diapositive et analyse de contenu.
Utilisation avec : Assistant pour la révision de contenu, la synthÚse et les questions-réponses.
Formats d'image
Les formats d'image sont traités par OCR (reconnaissance optique de caractÚres) pour extraire le texte en vue de l'analyse.
TIFF (.tif, .tiff)
Le format TIFF (Tagged Image File Format) est courant dans les ensembles de production juridique et les collections de documents numérisés.
Idéal pour : Les productions de documents, les dépÎts juridiques numérisés et les documents d'archives reçus sous forme de fichiers images.
Fonctionnalités : Traitement OCR pour l'extraction de texte, analyse aux cÎtés d'autres types de documents.
Utilisation avec : Assistant pour les questions-réponses sur les productions numérisées ; Révision Tabulaire pour l'extraction à travers des ensembles de documents basés sur des images.
Autres formats d'image
D'autres formats d'image pris en charge pour le traitement OCR incluent les types de fichiers image courants utilisés dans les productions de documents.
Formats pris en charge : JPEG (.jpg, .jpeg), PNG (.png) et autres formats d'image standard.
Idéal pour : Les numérisations de documents d'une seule page, les piÚces jointes et les images intégrées nécessitant une extraction de texte.
Fonctionnalités : Traitement OCR pour l'extraction de texte, permettant l'analyse au sein d'Assistant et de la Révision Tabulaire.
Formats audio
Les fichiers audio sont traitĂ©s par transcription pour ĂȘtre utilisĂ©s dans Live Assist.
Types audio pris en charge
August prend en charge les formats audio courants pour la transcription en temps réel et l'analyse aprÚs conversation.
Formats pris en charge : MP3 (.mp3), WAV (.wav), M4A (.m4a)
Idéal pour : Les dépositions, les appels de clients, les entretiens avec des témoins et les négociations de rÚglement pour lesquels vous avez besoin d'une transcription interrogeable.
Fonctionnalités : Transcription en temps réel avec identification des intervenants, recoupement avec les documents téléchargés et signalement des contradictions avec citations.
Utilisation avec : Live Assist pour la transcription en temps réel pendant les conversations en direct.
Avant d'enregistrer une conversation, confirmez que vous disposez du consentement approprié en vertu des lois sur l'enregistrement et le consentement applicables dans votre juridiction. La conformité avec les lois locales sur l'enregistrement relÚve de votre responsabilité.
Formats d'e-mail
Les formats de fichiers d'e-mail vous permettent d'analyser les productions d'e-mails et les communications au sein des flux de travail d'August.
EML (.eml)
Les fichiers EML sont des fichiers de messages Ă©lectroniques standard qui prĂ©servent le contenu du message, les en-tĂȘtes et les piĂšces jointes.
IdĂ©al pour : Les productions d'e-mails lors de la phase de communication des piĂšces (discovery), les enquĂȘtes internes et l'analyse de correspondance.
FonctionnalitĂ©s : Extraction du corps du message, des en-tĂȘtes et des piĂšces jointes ; analyse au sein d'Assistant ; recoupement dans Live Assist.
Utilisation avec : Assistant pour l'analyse d'e-mails et l'extraction de faits ; Live Assist pour le recoupement des productions d'e-mails avec les témoignages en direct ; Révision Tabulaire pour l'extraction structurée à travers des ensembles d'e-mails.
MSG (.msg)
Les fichiers MSG sont des fichiers de messages Microsoft Outlook contenant le contenu de l'e-mail, les en-tĂȘtes et les piĂšces jointes.
Idéal pour : Les exportations d'e-mails Outlook, les productions de discovery au format MSG et l'analyse de correspondance à partir d'environnements Microsoft Exchange.
FonctionnalitĂ©s : Extraction du corps du message, des en-tĂȘtes et des piĂšces jointes ; analyse au sein d'Assistant et de la RĂ©vision Tabulaire.
Utilisation avec : Assistant pour l'analyse d'e-mails et l'extraction de faits ; Révision Tabulaire pour l'extraction structurée à travers des ensembles d'e-mails.
Résumé des formats par fonctionnalité
Différentes fonctionnalités d'August prennent en charge différentes combinaisons de formats selon le flux de travail :
Fonctionnalité | Formats pris en charge | Flux de travail |
|---|---|---|
Assistant | DOCX, PDF, XLSX, CSV, PPTX, TXT, MD, HTML, TIFF, images (JPEG, PNG), EML, MSG | Analyse, questions-réponses, rédaction, recherche |
Révision Tabulaire | DOCX, PDF, XLSX, CSV, TIFF, images, EML, MSG | Extraction structurée et comparaison |
Live Assist | Audio (MP3, WAV, M4A), ainsi que DOCX, PDF, TIFF, EML, MSG pour le recoupement | Transcription en temps réel et signalement |
Rédaction de clauses | DOCX | Rédaction en ligne et comparaison dans Word |
Choisir le bon format
Lors de la préparation des documents pour le téléchargement, suivez ces directives :
Pour le travail de rédaction et de révision
Utilisez le format DOCX lorsque vous devez produire des documents éditables ou des modifications suivies. Ce format préserve la mise en forme pour l'édition ultérieure et permet à August de générer directement des comparaisons.
Pour l'analyse et la révision
Le PDF et le DOCX fonctionnent tous deux trÚs bien pour l'analyse. Utilisez le PDF pour les documents signés et le DOCX pour les brouillons que vous pourriez vouloir modifier plus tard.
Pour les documents numérisés et les productions
TIFF, JPEG, PNG et les autres formats d'image sont automatiquement traités par OCR. Assurez-vous que les documents sont lisibles pour une extraction précise.
Pour l'analyse de feuilles de calcul et de données
Utilisez le format XLSX pour les feuilles de calcul formatées avec formules et structure. Utilisez le format CSV pour les exportations de données tabulaires simples sans mise en forme.
Pour l'analyse d'e-mails
Téléchargez les messages électroniques au format EML ou MSG. Les deux préservent la structure du message et les piÚces jointes pour l'analyse.
Pour les conversations en direct
Téléchargez les documents de référence (PDF, DOCX, TIFF, EML, MSG) avant d'utiliser Live Assist afin qu'August puisse recouper les déclarations en temps réel.
Nommage des fichiers et gestion des extensions
Lors du téléchargement de documents sur August, incluez l'extension de fichier correcte dans le nom du fichier. August utilise les extensions pour déterminer comment traiter, ouvrir et télécharger les fichiers.
Extensions requises pour le téléchargement
Les téléchargements via le Mode Génie et les flux de travail ReAct nécessitent des noms de fichiers avec des extensions reconnaissables. Si un nom de fichier n'a pas d'extension prise en charge ou utilise un format ambigu, le téléchargement sera rejeté.
Les extensions prises en charge incluent :
Documents :
.docx,.doc,.pdf,.txt,.md,.html,.jsonFeuilles de calcul :
.xlsx,.xls,.csvPrésentations :
.pptx,.pptImages :
.jpg,.jpeg,.png,.gif,.bmp,.webp,.tif,.tiffAudio :
.mp3,.wav,.m4aE-mail :
.msg,.eml
Comment August gĂšre les extensions manquantes ou incorrectes
Pour les fichiers dĂ©jĂ tĂ©lĂ©chargĂ©s dans votre espace de travail, August utilise la dĂ©tection du type de contenu pour dĂ©terminer comment ouvrir et tĂ©lĂ©charger les fichiers, mĂȘme lorsque l'extension du nom de fichier est manquante ou incorrecte.
Les documents Office (
.docx,.xlsx,.pptx) s'ouvrent dans le lecteur correct en fonction de leur contenu réel, et pas seulement de leur nom de fichier.Les téléchargements à partir du chat, du visionneur de fichiers et des vues des produits de travail utilisent l'extension correcte déduite du type de contenu du fichier.
Les fichiers Excel sont traités comme étant téléchargeables uniquement dans le visionneur de fichiers.
Les modĂšles de dates dans les noms de fichiers (tels que
[2026.05.11]) sont reconnus comme des dates, et non comme des extensions de fichiers.
Si vous rencontrez un fichier qui ne s'ouvre pas correctement, essayez de le télécharger à la place. Le nom du fichier téléchargé aura l'extension correcte basée sur le type de fichier réel.
Exemple : Normalisation du nom de fichier
Si vous téléchargez un document Word nommé Agreement (sans extension), August peut le normaliser en Agreement.docx en fonction du contenu du fichier. Lorsque vous téléchargerez le fichier plus tard, il aura l'extension correcte.
Ătapes suivantes
Consultez l'Aperçu d'Assistant pour les flux d'analyse et savoir comment télécharger des fichiers.
Lisez l'Aperçu de Live Assist pour la transcription en temps réel.
Explorez la Révision Tabulaire pour la comparaison structurée de documents.