<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>20.6</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-parser-cloud', version: '20.6')
<dependency org="com.groupdocs" name="groupdocs-parser-cloud" rev="20.6">
<artifact name="groupdocs-parser-cloud" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-parser-cloud" % "20.6"
文档解析器 Java Cloud REST API
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs.Parser Cloud SDK for Java 帮助您构建无需安装任何第 3 方软件即可运行的云文档解析器 Java 应用程序。它是 GroupDocs.Parser Cloud REST APIs 的包装器。
云文档解析SDK功能
- Create user-defined data extraction templates 到 extract data from the cloud documents。
- Retrieve user-defined templates created for parsing cloud data。
- Supports various ways of extracting text from cloud hosted files:
- 以简单形式提取文本
- 通过保持格式不变来提取文本
- 仅通过提供页面范围从特定页面中提取文本。
- Extract images from files hosted on the cloud:
- 从整个云文档中提取所有图像
- 根据所需的页面范围从特定页面中提取图像。
- 获取所有支持的文件格式的列表。
- Fetch useful information regarding cloud document,例如:
- 云文档文件扩展
- 以字节为单位的云文档大小
- 云文档页数
- Retrieve information about the items within a container,例如压缩档案、PDF 作品集等。
- Built-in cloud storage API 用于处理云存储上的文件和文件夹。
支持的文档解析文件格式
Microsoft Word®: DOC、DOT、DOCX、DOCM、DOTX、DOTM、TXT、RTF
OpenOffice Writer®: ODT、OTT
Microsoft Excel®: XLS、XLT、XLSX、XLSM、XLSB、XLTX、XLTM、CSV、XLA、XLAM
OpenOffice Calc®: ODS、OTS
Apple® iWork: 数字
Microsoft PowerPoint®: PPT、PPS、POT、PPTX、PPTM、POTX、POTM、PPSX、PPSM
OpenOffice Impress®: ODP、OTP
Microsoft Outlook®: PST、OST、EML、MSG
Apple® 邮件 EMLX
**Microsoft OneNote®:**一个
标记: HTML、XHTML、MHTML、MD(Markdown)、XML
电子书: CHM、EPUB、FB2
固定布局: PDF
档案: ZIP
要求
构建 API 客户端库需要:
- Java 1.7+
- 行家
先决条件
要使用 GroupDocs.Parser Cloud SDK for Java,您需要在 GroupDocs Cloud 注册一个帐户并在 Cloud Dashboard 查找/创建客户端 ID 和客户端密码。有可用的免费配额。有关详细信息,请参阅GroupDocs Cloud Pricing。
从 Maven 安装 GroupDocs.Parser-Cloud
将 GroupDocs 云存储库添加到您的应用程序 pom.xml
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
从源安装
要将 API 客户端库安装到本地 Maven 存储库,只需执行:
mvn clean install
要将其部署到远程 Maven 存储库,请配置存储库的设置并执行:
mvn clean deploy
有关更多信息,请参阅 OSSRH Guide。
Maven 用户
将此依赖项添加到项目的 POM 中:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
### 其他
首先通过执行生成JAR:
mvn clean package
然后手动安装以下 JAR:
-target/groupdocs-parser-cloud-22.3.jar
-target/lib/*.jar
开始
请按照 Quick Start 说明进行操作。
通过 Java Cloud SDK 按页码范围提取文本
/ For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples
String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/four-pages.pdf");
TextOptions options = new TextOptions();
options.setStartPageNumber(1);
options.setCountPagesToExtract(1);
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
授权与认证
Authentication schemes API定义如下:
###智威汤逊
- 类型:OAuth 2.0
- 流程:应用
- 授权网址:https://api.groupdocs.cloud/connect/token
- 令牌生命周期:1 天(默认)
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
File | Classifier | Size |
---|---|---|
groupdocs-parser-cloud-20.6-javadoc.jar | javadoc | 1 MB |
groupdocs-parser-cloud-20.6-sources.jar | sources | 177 KB |
groupdocs-parser-cloud-20.6.jar | 258 KB | |
groupdocs-parser-cloud-20.6.pom | 2 KB |
GroupDocs Java REST API Maven SDK Java SDK Cloud REST REST API Cloud API MIT JWT oauth GroupDocs.Total Cloud GroupDocs.Parser Cloud JAR document automation document automation cloud document DOC DOT DOCX DOCM DOTX DOTM TXT RTF ODT 互联网电视 XLS XLT XLSX XLSM XLSB XLTX XLTM CSV XLA XLAM ODS OTS NUMBERS PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP OTP PST OST EML MSG EMLX ONE HTML XHTML MHTML MD Markdown XML CHM EPUB FB2 PDF ZIP parser parsing parse extract extraction extractor template user defined data template data extraction data information text hosted page page range file format cloud data