
Paper2GUI 🚀🚀🌟: 让每个人都简单方便的使用前沿人工智能技术

Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 20+AI 模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。
经过两个月的开发,我们将现有的优秀 AI 模型进行了统一融合,Paper2GUI 现在有了一个中文名 “小白兔 AI”。

文字转语音工具,适用于配音、讲解、说书、广告等场景。
文本转图片,想象力与 AI 的完美结合
视频超分工具,适用于 720p 或 360p 视频转 1080p 或 4k 视频, 画质升级且不模糊,目前主要用于动漫视频超分。
运动类视频流畅度升级工具,可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。
图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。
AI 一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。
人像修复,可以将人像修复为清晰的图片,提升清晰度
视频抠图,利用 RVM 等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。
适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。
辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。
小白兔 AI 是一款功能非常强大的人工智能软件, 实现了语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片 OCR 批量识别等十余种功能,致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向专业用户,可免费试用 7 天。
已内置功能 | 适用场景 | 功能简介 |
|---|---|---|
RealCugan-Pro 动漫超分辨 | 动漫图片或视频超分辨放大 | 自研 AI 引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件 |
RealESRGAN 动漫超分辨 | 动漫图片或视频 | 推理速度快,质量比 waifu2x 好太多,常规超分辨首选 |
智能抠图 | 任意图片或视频 | 推理速度快,一键获得透明图片或绿幕视,进行二次创作 |
人像动漫化 | 仅适合头像处理 | 转换效果出众,有趣又好玩 |
语音合成 | 自媒体视频配音、有声读书等 | 效果逼近真人,发音自然、带呼吸声、支持 txt 大文件极速合成 |
录音降噪 | 真人配音后处理 | 一键去除环境和背景噪音,提升录音清晰度,效果明显 |
视频补帧 | 运动类视频流畅度升级工具 | 可获得丝滑观感,已支持 RIFE 和 IFRNET 两种 AI 模型 |
一键超补 | 同时完成超分和补帧 | 融合超分和补帧模型,一键获得超补结果 |
AI 一键跑分 | 一键查看设备 AI 性能数据 | 模拟真实推理任务,统一量化推理任务,耗时越小越好 |
图片 OCR 识别 | 图片转文字 | 基于 Paddle-OCR-v3 模型,迄今最优秀的 OCR 识别模型、效果出众 |
视频字幕 OCR 提取 | 硬字幕提取 | 使用 PP-OCR 自动识别字幕位置及文字,输出字幕文件 |
视频上色 | 老旧黑白照片或视频上色 | 适合风景类黑白视频上色,推理速度快 |
人脸修复 | 人脸照片修复 | 可增强老旧照片、修复人脸,提高清晰度 |
目标检测 | 图像检测和分割 | 展示 AI 技术在通用场景下的检测、分割、追踪等效果 |
聚合版面向专业需求用户,付费只是为了做的更好更专业。功能持续添加中,已开源的 20 个单独 APP 完全免费,各取所需,请勿喷我,如果项目帮到了你,不妨点个 Star。














本人开发环境为
Windows系统,默认会发布Windows和Linux版本,得益于微软Sandbox和WSL2,可随时测试这些环境。Mac 版需要主动参与反馈。为了拓展和持续产出优质又实用的 AI 生产力工具,现已上架 “小白兔 AI”,欢迎大家助力开发者,推动人工智能的普及化。
地址:https://github.com/Baiyuetribe/paper2gui
更多功能广大网友可以继续挖掘。