<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-parser-cloud', version: '22.3')
<dependency org="com.groupdocs" name="groupdocs-parser-cloud" rev="22.3">
<artifact name="groupdocs-parser-cloud" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-parser-cloud" % "22.3"
Анализатор документов Java Cloud REST API
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs.Parser Cloud SDK for Java помогает создавать облачные Java-приложения Document Parser, которые работают без установки какого-либо стороннего программного обеспечения. Это оболочка для GroupDocs.Parser Cloud REST APIs.
Возможности SDK для анализа облачных документов
- Create user-defined data extraction templates на extract data from the cloud documents.
- Retrieve user-defined templates created for parsing cloud data.
- Supports various ways of extracting text from cloud hosted files:
- Извлечение текста в простой форме
- Извлечь текст, сохранив форматирование без изменений
- Извлечение текста с определенных страниц только путем предоставления диапазона страниц.
- Extract images from files hosted on the cloud:
- Извлечение всех изображений из всего облачного документа
- Извлечение изображений с определенных страниц на основе желаемого диапазона страниц.
- Получить список всех поддерживаемых форматов файлов.
- Fetch useful information regarding cloud document, например:
- Расширение файла облачного документа
- Размер облачного документа в байтах
- Количество страниц облачного документа
- Retrieve information about the items within a container, например ZIP-архив, портфолио в формате PDF и т. д.
- Built-in cloud storage API для работы с файлами и папками в облачном хранилище.
Поддерживаемые форматы файлов для анализа документов
Microsoft Word®: DOC, DOT, DOCX, DOCM, DOTX, DOTM, TXT, RTF
OpenOffice Writer®: ODT, OTT
Microsoft Excel®: XLS, XLT, XLSX, XLSM, XLSB, XLTX, XLTM, CSV, XLA, XLAM
OpenOffice Calc®: ODS, OTS
Apple® iWork: НОМЕРА
Microsoft PowerPoint®: PPT, PPS, POT, PPTX, PPTM, POTX, POTM, PPSX, PPSM
OpenOffice Impress®: ODP, OTP
Microsoft Outlook®: PST, OST, EML, MSG
Почта Apple® EMLX
Microsoft OneNote®: ОДИН
Разметка: HTML, XHTML, MHTML, MD (Markdown), XML
Электронные книги: CHM, EPUB, FB2
Фиксированный макет: PDF
Архивы: ZIP
Требования
Для создания клиентской библиотеки API требуется:
- Ява 1.7+
- Мавен
Предпосылки
Чтобы использовать GroupDocs.Parser Cloud SDK для Java, вам необходимо зарегистрировать учетную запись в GroupDocs Cloud и найти/создать идентификатор клиента и секрет клиента в Cloud Dashboard. Есть бесплатная квота. Дополнительные сведения см. в разделе GroupDocs Cloud Pricing.
Установите GroupDocs.Parser-Cloud из Maven
Добавьте облачный репозиторий GroupDocs в ваше приложение pom.xml.
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
Установить из исходников
Чтобы установить клиентскую библиотеку API в локальный репозиторий Maven, просто выполните:
mvn clean install
Чтобы вместо этого развернуть его в удаленном репозитории Maven, настройте параметры репозитория и выполните:
mvn clean deploy
Обратитесь к OSSRH Guide для получения дополнительной информации.
пользователи Maven
Добавьте эту зависимость в POM вашего проекта:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
Другие
Сначала сгенерируйте JAR, выполнив:
mvn clean package
Затем вручную установите следующие JAR-файлы:
target/groupdocs-parser-cloud-22.3.jar
цель/библиотека/*.jar
Начать
Следуйте Quick Start инструкциям.
Извлечение текста по диапазону номеров страниц с помощью Java Cloud SDK
/ For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples
String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/four-pages.pdf");
TextOptions options = new TextOptions();
options.setStartPageNumber(1);
options.setCountPagesToExtract(1);
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
Авторизация и аутентификация
Authentication schemes определено для API следующим образом:
JWT
- Тип: OAuth 2.0
- Поток: приложение
- URL-адрес авторизации:https://api.groupdocs.cloud/connect/token
- Срок жизни токена: 1 день (по умолчанию)
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | Free Trial
GroupDocs Java REST API Maven SDK Java SDK Cloud REST REST API Cloud API MIT JWT oauth GroupDocs.Total Cloud GroupDocs.Parser Cloud JAR document automation document automation cloud document DOC DOT DOCX DOCM DOTX DOTM TXT RTF ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM CSV XLA XLAM ODS OTS NUMBERS PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP OTP PST OST EML MSG EMLX ONE HTML XHTML MHTML MD Markdown XML CHM EPUB FB2 PDF ZIP parser parsing parse extract extraction extractor template user defined data template data extraction data information text hosted page page range file format cloud data