我正在尝试创建一个控件,允许用户创建视频剪辑。剪辑的建模包含视频的Uri和开始/结束TimeSpan:
public class ClipModel
{
public Uri Source { get; }
public TimeSpan Start{ get; }
public TimeSpan End { get; }
}
我想显示控件中所有剪辑的预览,但我的实现存在性能问题。我相信这是因为我为每个剪辑创建了一个MediaElement,这将强制多次加载该文件。我希望为一个给定的视频有几十个剪辑,所以加载一个视频文件~20倍,真正的坦克性能。
所有这些的xaml是:
所以我一直在玩一个特定的想法。我的计划是使用HTML5拖放和FileReader()应用程序接口让人们上传视频。我想做一些客户端处理,以显示视频。然而,当我运行代码时,我发现Chrome崩溃了。有没有比文件阅读器更好的方法来处理大的视频文件?
下面是我的示例代码:
function handle_video(e) {
e.stopPropagation(); // Stops some browsers from redirecting.
e.preventDefault();
var files = e.dataTransfer.files;
elem = d
我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
当我用ffmpeg转换视频,并使用mediaInfo查看元数据时,我看到了视频编解码器的如下内容:
Format : AVC
Format/Info : Advanced Video Codec
Format profile : Baseline@L3.1
Format settings : 1 Ref Frames
而对于其他一些视频,mediaInfo则显示如下:
Format : AVC
Format/Info : Advanced Video Codec
Format profile : High@L4.2
Format settings : CABAC / 4 Ref