我的任务是使用IBM Watson将PDF转换为文本文件或对我的任务有用的任何输出。
PDF是由客户创建的采购订单,并以不同的格式发送给我们。客户可以以任何他们想要的方式创建这些采购订单,我必须解析它们。
我已经尝试使用默认设置的文档转换器,输出到处都是。
任何关于这方面的建议都是很棒的……也许可以使用IBM Watson智能来更好地在这些采购订单中查找所需的信息,即使这些采购订单没有使用定义。
谢谢你的帮助。
发布于 2017-05-05 04:45:03
您可以很容易地查看来自IBM开发人员的API Reference文档,以确定我的答案。
我假设你使用的是curl,但如果你愿意的话,链接里面有一些Nodejs,Python,Java的例子。但使用条件实际上是相同的。
查看使用CURL的转换方法示例:
curl -X POST -u "{username}":"{password}" -F config="{\"conversion_target\":\"answer_units\"}" -F "file=@sample.pdf" "https://gateway.watsonplatform.net/document-conversion/api/v1/convert_document?version=2015-12-15"在file中,您将从您的文件中选择格式,例如:PDF来构建您的own conversion,在cURL中,将被调用的文件替换为您自己的PDF、HTML或Word文档文件,并将config中的"conversion_target"替换为您要转换为的格式。有效值为"answer_units"、"normalized_html"或"normalized_text"。
在官方文档中,您可以看到一个来自IBM Developers inside here.
https://stackoverflow.com/questions/43792118
复制相似问题