首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用boto3提取所有aws转录结果

使用boto3提取所有aws转录结果
EN

Stack Overflow用户
提问于 2019-03-05 17:06:53
回答 2查看 1.3K关注 0票数 0

我有几百个转录结果在aws转录,我想得到所有转录文本,并将其存储在一个文件。有没有办法做到这一点,而不点击每一个转录的结果,复制和粘贴的文本?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-03-05 22:21:57

您可以通过AWS API来实现这一点。

例如,如果使用的是Python,则可以使用Python boto3 SDK

  • list_transcription_jobs()将返回一个转录作业名称列表
  • 对于每个作业,您可以调用get_transcription_job(),它将提供存储转录的位置的TranscriptFileUri
  • 然后可以使用get_object()从S3下载该文件。
  • 然后,您的程序需要将每个文件的内容合并到一个文件中。

看看你是怎么做的。如果遇到任何具体的困难,用代码发布一个新的问题并解释问题。

票数 2
EN

Stack Overflow用户

发布于 2020-09-14 18:36:45

我在GitHub上举了一个例子,展示了如何:

  • 运行AWS转录作业,
  • 使用请求包获取输出,
  • 将输出写入控制台。

为了你的目的,你应该能很容易地改装它。下面是一些代码,但是如果您查看全例,它会更有意义

代码语言:javascript
运行
复制
job_name_simple = f'Jabber-{time.time_ns()}'
print(f"Starting transcription job {job_name_simple}.")
start_job(
    job_name_simple, f's3://{bucket_name}/{media_object_key}', 'mp3', 'en-US',
    transcribe_client)
transcribe_waiter = TranscribeCompleteWaiter(transcribe_client)
transcribe_waiter.wait(job_name_simple)
job_simple = get_job(job_name_simple, transcribe_client)
transcript_simple = requests.get(
    job_simple['Transcript']['TranscriptFileUri']).json()
print(f"Transcript for job {transcript_simple['jobName']}:")
print(transcript_simple['results']['transcripts'][0]['transcript'])
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55008092

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档