<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
compile(group: 'com.groupdocs', name: 'groupdocs-parser-cloud', version: '22.3')
<dependency org="com.groupdocs" name="groupdocs-parser-cloud" rev="22.3">
<artifact name="groupdocs-parser-cloud" ext="jar"/>
</dependency>
libraryDependencies += "com.groupdocs" % "groupdocs-parser-cloud" % "22.3"
ドキュメントパーサー Java Cloud REST API
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | {{ハイパーリンク8}}
GroupDocs.Parser Cloud SDK for Java は、サードパーティ ソフトウェアをインストールしなくても動作するクラウド ドキュメント パーサー Java アプリを構築するのに役立ちます。 GroupDocs.Parser Cloud REST APIs のラッパーです。
Cloud Document Parsing SDK の機能
- Create user-defined data extraction templatesからextract data from the cloud documentsへ。
- Retrieve user-defined templates created for parsing cloud data。
- Supports various ways of extracting text from cloud hosted files:
- テキストを単純な形式で抽出する
- フォーマットをそのまま維持してテキストを抽出する
- ページ範囲を指定するだけで、特定のページからテキストを抽出します。
- Extract images from files hosted on the cloud:
- クラウド ドキュメント全体からのすべての画像の画像抽出
- 目的のページ範囲に基づく特定のページからの画像の抽出。
- サポートされているすべてのファイル形式のリストを取得します。
- Fetch useful information regarding cloud document など:
- クラウド ドキュメント ファイルの拡張子
- クラウド ドキュメント サイズ (バイト単位)
- クラウド ドキュメントのページ数
- Retrieve information about the items within a container (Zip アーカイブ、PDF ポートフォリオなど)
- Built-in cloud storage API クラウド ストレージ上のファイルとフォルダーを操作します。
サポートされているドキュメント解析ファイル形式
Microsoft Word®: DOC、DOT、DOCX、DOCM、DOTX、DOTM、TXT、RTF
OpenOffice Writer®: ODT、OTT
Microsoft Excel®: XLS、XLT、XLSX、XLSM、XLSB、XLTX、XLTM、CSV、XLA、XLAM
OpenOffice Calc®: ODS、OTS
Apple® iWork: 数字
Microsoft PowerPoint®: PPT、PPS、POT、PPTX、PPTM、POTX、POTM、PPSX、PPSM
OpenOffice Impress®: ODP、OTP
Microsoft Outlook®: PST、OST、EML、MSG
Apple® Mail EMLX
Microsoft OneNote®: 1
マークアップ: HTML、XHTML、MHTML、MD (マークダウン)、XML
電子書籍: CHM、EPUB、FB2
固定レイアウト: PDF
アーカイブ: ZIP
要件
API クライアント ライブラリを構築するには、次のものが必要です。
- Java 1.7+
- メイヴン
前提条件
GroupDocs.Parser Cloud SDK for Java を使用するには、GroupDocs Cloud でアカウントを登録し、Cloud Dashboard でクライアント ID とクライアント シークレットを検索/作成する必要があります。無料枠あります。詳細については、GroupDocs Cloud Pricing を参照してください。
Maven から GroupDocs.Parser-Cloud をインストールします
GroupDocs Cloud リポジトリをアプリケーションの pom.xml に追加します
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
ソースからインストール
API クライアント ライブラリをローカルの Maven リポジトリにインストールするには、次のコマンドを実行するだけです。
mvn clean install
代わりにリモートの Maven リポジトリにデプロイするには、リポジトリの設定を構成して実行します。
mvn clean deploy
詳細については、OSSRH Guide を参照してください。
Maven ユーザー
この依存関係をプロジェクトの POM に追加します。
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>22.3</version>
</dependency>
その他
最初に、次を実行して JAR を生成します。
mvn clean package
次に、次の JAR を手動でインストールします。
target/groupdocs-parser-cloud-22.3.jar
target/lib/*.jar
始めましょう
Quick Startの指示に従ってください。
Java Cloud SDK を介してページ番号範囲でテキストを抽出する
/ For complete examples and data files, please go to https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples
String MyAppKey = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppSid = ""; // Get AppKey and AppSID from https://dashboard.groupdocs.cloud
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/four-pages.pdf");
TextOptions options = new TextOptions();
options.setStartPageNumber(1);
options.setCountPagesToExtract(1);
options.setFileInfo(fileInfo);
TextRequest request = new TextRequest(options);
TextResult response = apiInstance.text(request);
承認と認証
API 用に定義された Authentication schemes は次のとおりです。
JWT
- タイプ: OAuth 2.0
- フロー: アプリケーション
- 認証 URL:https://api.groupdocs.cloud/connect/token
- トークンの有効期間: 1 日 (デフォルト)
Product Page | Docs | Live Demos | Swagger UI | Code Samples | Blog | Free Support | {{ハイパーリンク8}}
GroupDocs Java REST API Maven SDK Java SDK Cloud REST REST API Cloud API MIT JWT oauth GroupDocs.Total Cloud GroupDocs.Parser Cloud JAR document automation document automation cloud document DOC DOT DOCX DOCM DOTX DOTM TXT RTF ODT OTT XLS XLT XLSX XLSM XLSB XLTX XLTM CSV XLA XLAM ODS OTS NUMBERS PPT PPS POT PPTX PPTM POTX POTM PPSX PPSM ODP OTP PST OST EML MSG EMLX ONE HTML XHTML MHTML MD Markdown XML CHM EPUB FB2 PDF ZIP parser parsing parse extract extraction extractor template user defined data template data extraction data information text hosted page page range file format cloud data