<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>20.6</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-parser-cloud', version: '20.6')
<dependency org="com.groupdocs" name="groupdocs-parser-cloud" rev="20.6">
<artifact name="groupdocs-parser-cloud" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-parser-cloud" % "20.6"
API REST Java Cloud de l’analyseur de documents
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs.Parser Cloud SDK for Java vous aide à créer des applications Java Cloud Document Parser qui fonctionnent sans installer de logiciel tiers. Il s’agit d’un wrapper autour de GroupDocs.Parser Cloud REST APIs.
Fonctionnalités du SDK d’analyse de documents dans le cloud
- Create user-defined data extraction templates à extract data from the cloud documents.
- Retrieve user-defined templates created for parsing cloud data.
- Supports various ways of extracting text from cloud hosted files :
- Extraire du texte sous une forme simple
- Extraire du texte en gardant la mise en forme intacte
- Extraire le texte des pages spécifiques uniquement en fournissant la plage de pages.
- Extract images from files hosted on the cloud :
- Extraction d’images de toutes les images de l’ensemble du document cloud
- Extraction d’images à partir de pages spécifiques en fonction de la plage de pages souhaitée.
- Obtenez une liste de tous les formats de fichiers pris en charge.
- Fetch useful information regarding cloud document, tels que :
- Extension de fichier de document en nuage
- Taille du document cloud en octets
- Nombre de pages de documents en nuage
- Retrieve information about the items within a container, comme une archive zippée, un portfolio PDF, etc.
- Built-in cloud storage API pour travailler avec des fichiers et des dossiers sur le stockage cloud.
Formats de fichiers d’analyse de documents pris en charge
Microsoft Word® : DOC, DOT, DOCX, DOCM, DOTX, DOTM, TXT, RTF
OpenOffice Writer® : ODT, OTT
Microsoft Excel® : XLS, XLT, XLSX, XLSM, XLSB, XLTX, XLTM, CSV, XLA, XLAM
OpenOffice Calc® : ODS, OTS
Apple® iWork : CHIFFRES
Microsoft PowerPoint® : PPT, PPS, POT, PPTX, PPTM, POTX, POTM, PPSX, PPSM
OpenOffice Impress® : ODP, OTP
Microsoft Outlook® : PST, OST, EML, MSG
Apple® Mail EMLX
Microsoft OneNote® : ONE
Marquage : HTML, XHTML, MHTML, MD (Markdown), XML
eBooks : CHM, EPUB, FB2
Mise en page fixe : PDF
Archives : ZIP
Conditions
La création de la bibliothèque cliente de l’API nécessite :
- Java 1.7+
- Maven
Conditions préalables
Pour utiliser GroupDocs.Parser Cloud SDK pour Java, vous devez créer un compte avec GroupDocs Cloud et rechercher/créer l’ID client et le secret client sur Cloud Dashboard. Un quota gratuit est disponible. Pour plus de détails, consultez GroupDocs Cloud Pricing.
Installez GroupDocs.Parser-Cloud depuis Maven
Ajoutez le référentiel GroupDocs Cloud à votre application pom.xml
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
Installer depuis la source
Pour installer la bibliothèque cliente de l’API dans votre référentiel Maven local, exécutez simplement :
mvn clean install
Pour le déployer sur un référentiel Maven distant à la place, configurez les paramètres du référentiel et exécutez :
mvn clean deploy
Reportez-vous au OSSRH Guide pour plus d’informations.
Utilisateurs Maven
Ajoutez cette dépendance au POM de votre projet :
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
Les autres
Générez d’abord le JAR en exécutant :
mvn clean package
Ensuite, installez manuellement les fichiers JAR suivants :
target/groupdocs-parser-cloud-22.3.jar
cible/lib/*.jar
Commencer
Veuillez suivre les instructions Quick Start.
Extraire le texte par une plage de numéros de page via Java Cloud SDK
/ For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples
String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/four-pages.pdf");
TextOptions options = new TextOptions();
options.setStartPageNumber(1);
options.setCountPagesToExtract(1);
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
Autorisation et authentification
Authentication schemes défini pour l’API est le suivant :
JWT
- Type : OAuth 2.0
- Flux : candidature
- URL d’autorisation :https://api.groupdocs.cloud/connect/token
- Token Lifetime : 1 jour (par défaut)
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
File | Classifier | Size |
---|---|---|
groupdocs-parser-cloud-20.6-javadoc.jar | javadoc | 1 MB |
groupdocs-parser-cloud-20.6-sources.jar | sources | 177 KB |
groupdocs-parser-cloud-20.6.jar | 258 KB | |
groupdocs-parser-cloud-20.6.pom | 2 KB |
GroupDocs Java REST API Maven SDK Java SDK Cloud REST REST API Cloud API MIT JWT oauth GroupDocs.Total Cloud GroupDocs.Parser Cloud JAR document automation document automation cloud document DOC DOT DOCX DOCM DOTX DOTM TXT RTF ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM CSV XLA XLAM ODS OTS NUMBERS PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP OTP PST OST EML MSG EMLX ONE HTML XHTML MHTML MD Markdown XML CHM EPUB FB2 PDF ZIP parser parsing parse extract extraction extractor template user defined data template data extraction data information text hosted page page range file format cloud data