1. 接口描述
接口请求域名: lkeap.tencentcloudapi.com 。
用于创建一个文档拆分任务,支持多种文件类型,具备mllm能力,能够解析并深入理解图表中的信息。
默认接口请求频率限制:20次/秒。
推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。
2. 输入参数
以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数。
参数名称 | 必选 | 类型 | 描述 |
---|---|---|---|
Action | 是 | String | 公共参数,本接口取值:CreateSplitDocumentFlow。 |
Version | 是 | String | 公共参数,本接口取值:2024-05-22。 |
Region | 是 | String | 公共参数,详见产品支持的 地域列表。 |
FileType | 是 | String | 文件类型。 支持的文件类型: - PDF 、DOC 、DOCX 、XLS 、XLSX 、PPT 、PPTX 、MD 、TXT 、PNG 、JPG 、JPEG 、CSV 、HTML 、EPUB 支持的文件大小: - PDF 最大500M- DOCX 、DOC 、PPT 、PPTX 最大 200M- TXT 、MD 最大10M- 其他 最大20M 示例值:PDF |
FileUrl | 是 | String | 文件的 URL 地址。 文件存储于腾讯云的 URL 可保障更高的下载速度和稳定性,建议文件存储于腾讯云。 非腾讯云存储的 URL 速度和稳定性可能受一定影响。 参考:腾讯云COS文档 示例值:https://example.com/example.pdf |
FileName | 否 | String | 文件名,可选。 需带文件类型后缀,当文件名无法从传入的 FileUrl 获取时需要通过该字段来明确。示例值:example.pdf |
FileStartPageNumber | 否 | Integer | 文档的起始页码。 当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的起始页码,识别的页码包含当前值。 示例值:1 |
FileEndPageNumber | 否 | Integer | 文档的结束页码。 当传入文件是PDF、PDF、PPT、PPTX、DOC类型时,用来指定识别的结束页码,识别的页码包含当前值。 示例值:100 |
Config | 否 | CreateSplitDocumentFlowConfig | 文档拆分任务的配置信息。 示例值:{"EnableMllm":true,"MaxChunkSize":4800} |
3. 输出参数
参数名称 | 类型 | 描述 |
---|---|---|
TaskId | String | 拆分任务唯一ID。 30天内可以通过 GetSplitDocumentResult 接口查询TaskId对应的拆分结果。示例值:236e51fd-827b-41cb-b303-56003a817ce5 |
RequestId | String | 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。 |
4. 示例
示例1 创建PDF拆分任务
对外部在线文档进行拆分
输入示例
POST / HTTP/1.1
Host: lkeap.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: CreateSplitDocumentFlow
<公共请求参数>
{
"FileType": "PDF",
"FileName": "example.pdf",
"FileUrl": "https://qidian-qbot-1251316161.cos.ap-guangzhou.myqcloud.com/public/example/example.pdf",
"FileStartPageNumber": 1,
"FileEndPageNumber": 2,
"Config": {
"EnableMllm": true
}
}
输出示例
{
"Response": {
"RequestId": "5e148c27-9c21-43cd-992c-799117bb4216",
"TaskId": "236e51fd-827b-41cb-b303-56003a817ce5"
}
}
5. 开发者资源
腾讯云 API 平台
腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。
API Inspector
用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。
SDK
云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。
- Tencent Cloud SDK 3.0 for Python: GitHub Gitee
- Tencent Cloud SDK 3.0 for Java: GitHub Gitee
- Tencent Cloud SDK 3.0 for PHP: GitHub Gitee
- Tencent Cloud SDK 3.0 for Go: GitHub Gitee
- Tencent Cloud SDK 3.0 for Node.js: GitHub Gitee
- Tencent Cloud SDK 3.0 for .NET: GitHub Gitee
- Tencent Cloud SDK 3.0 for C++: GitHub Gitee
- Tencent Cloud SDK 3.0 for Ruby: GitHub Gitee
命令行工具
6. 错误码
以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码。
错误码 | 描述 |
---|---|
FailedOperation | 操作失败。 |
InternalError | 内部错误。 |
InvalidParameter | 参数错误。 |
ResourceUnavailable.ResourcePackageRunOut | 账号资源包耗尽。 |