<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-parser-cloud', version: '22.3')
<dependency org="com.groupdocs" name="groupdocs-parser-cloud" rev="22.3">
<artifact name="groupdocs-parser-cloud" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-parser-cloud" % "22.3"
Analisador de documentos Java Cloud REST API
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs.Parser Cloud SDK for Java ajuda você a criar aplicativos Java do analisador de documentos na nuvem que funcionam sem instalar nenhum software de terceiros. É um wrapper em torno de GroupDocs.Parser Cloud REST APIs.
Recursos do SDK de análise de documentos na nuvem
- Create user-defined data extraction templates para extract data from the cloud documents.
- Retrieve user-defined templates created for parsing cloud data.
- Supports various ways of extracting text from cloud hosted files:
- Extrair texto de forma simples
- Extraia o texto mantendo a formatação intacta
- Extraia o texto das páginas específicas apenas fornecendo o intervalo de páginas.
- Extract images from files hosted on the cloud:
- Extração de todas as imagens de todo o documento na nuvem
- Extração de imagens de páginas específicas com base no intervalo de páginas desejado.
- Obtenha uma lista de todos os formatos de arquivo suportados.
- Fetch useful information regarding cloud document, como:
- Extensão de arquivo de documento em nuvem
- Tamanho do documento em nuvem em bytes
- Contagem de páginas de documentos na nuvem
- Retrieve information about the items within a container, como um arquivo compactado, portfólio em PDF, etc.
- Built-in cloud storage API para trabalhar com arquivos e pastas no armazenamento em nuvem.
Formatos de arquivo de análise de documento suportados
Microsoft Word®: DOC, DOT, DOCX, DOCM, DOTX, DOTM, TXT, RTF
OpenOffice Writer®: ODT, OTT
Microsoft Excel®: XLS, XLT, XLSX, XLSM, XLSB, XLTX, XLTM, CSV, XLA, XLAM
OpenOffice Calc®: ODS, OTS
Apple® iWork: NÚMEROS
Microsoft PowerPoint®: PPT, PPS, POT, PPTX, PPTM, POTX, POTM, PPSX, PPSM
OpenOffice Impress®: ODP, OTP
Microsoft Outlook®: PST, OST, EML, MSG
Apple® Mail EMLX
Microsoft OneNote®: UM
Markup: HTML, XHTML, MHTML, MD (Markdown), XML
e-books: CHM, EPUB, FB2
Layout Fixo: PDF
Arquivos: ZIP
Requisitos
A construção da biblioteca cliente da API requer:
- Java 1.7+
- Especialista
Pré-requisitos
Para usar GroupDocs.Parser Cloud SDK para Java, você precisa registrar uma conta com GroupDocs Cloud e pesquisar/criar ID e Segredo do cliente em Cloud Dashboard. Há cota gratuita disponível. Para obter mais detalhes, consulte GroupDocs Cloud Pricing.
Instalar GroupDocs.Parser-Cloud do Maven
Adicione o repositório GroupDocs Cloud ao seu aplicativo pom.xml
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
Instalar a partir da fonte
Para instalar a biblioteca cliente da API em seu repositório Maven local, basta executar:
mvn clean install
Para implantá-lo em um repositório Maven remoto, defina as configurações do repositório e execute:
mvn clean deploy
Consulte o OSSRH Guide para obter mais informações.
Usuários do Maven
Adicione esta dependência ao POM do seu projeto:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
Outros
Primeiramente gere o JAR executando:
mvn clean package
Em seguida, instale manualmente os seguintes JARs:
target/groupdocs-parser-cloud-22.3.jar
alvo/lib/*.jar
Iniciar
Siga as instruções Quick Start.
Extrair texto por um intervalo de número de página via Java Cloud SDK
/ For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples
String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/four-pages.pdf");
TextOptions options = new TextOptions();
options.setStartPageNumber(1);
options.setCountPagesToExtract(1);
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
Autorização e Autenticação
Authentication schemes definido para a API é o seguinte:
JWT
- Tipo: OAuth 2.0
- Fluxo: aplicativo
- URL de autorização:https://api.groupdocs.cloud/connect/token
- Token Lifetime: 1 dia (Padrão)
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs Java REST API Maven SDK Java SDK Cloud REST REST API Cloud API MIT JWT oauth GroupDocs.Total Cloud GroupDocs.Parser Cloud JAR document automation document automation cloud document DOC DOT DOCX DOCM DOTX DOTM TXT RTF ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM CSV XLA XLAM ODS OTS NUMBERS PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP OTP PST OST EML MSG EMLX ONE HTML XHTML MHTML MD Markdown XML CHM EPUB FB2 PDF ZIP parser parsing parse extract extraction extractor template user defined data template data extraction data information text hosted page page range file format cloud data