前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于tensorflow 1.x 的bert系列预训练模型工具

基于tensorflow 1.x 的bert系列预训练模型工具

作者头像
机器学习AI算法工程
发布于 2021-10-14 02:11:00
发布于 2021-10-14 02:11:00
1.1K00
代码可运行
举报
运行总次数:0
代码可运行

tfbert

  • 基于tensorflow 1.x 的bert系列预训练模型工具
  • 支持多GPU训练,支持梯度累积,支持pb模型导出,自动剔除adam参数
  • 采用dataset 和 string handle配合,可以灵活训练、验证、测试,在训练阶段也可以使用验证集测试模型,并根据验证结果保存参数。

源代码获取方式

关注微信公众号 datayx 然后回复 tf 即可获取。

AI项目体验地址 https://loveai.tech

说明

config、tokenizer参考的transformers的实现。

内置有自定义的Trainer,像pytorch一样使用tensorflow1.14,具体使用下边会介绍。

目前内置 文本分类、文本多标签分类、命名实体识别例子。

内置的几个例子的数据处理代码都支持多进程处理,实现方式参考的transformers。

内置代码示例数据集百度网盘提取码:rhxk

支持模型

bert、electra、albert、nezha、wobert、ChineseBert(GlyceBert)

requirements

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tensorflow==1.x
tqdm
jieba

目前本项目都是在tensorflow 1.x下实现并测试的,最好使用1.14及以上版本,因为内部tf导包都是用的

import tensorflow.compat.v1 as tf

使用说明

Config 和 Tokenizer

使用方法和transformers一样

多卡运行方式,需要设置环境变量CUDA_VISIBLE_DEVICES,内置trainer会读取参数:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
CUDA_VISIBLE_DEVICES=1,2 python run.py

详情查看代码样例

XLA和混合精度训练训练速度测试

使用哈工大的rbt3权重进行实验对比,数据为example中的文本分类数据集。开启xla和混合精度后刚开始训练需要等待一段时间优化,所以第一轮会比较慢, 等开启后训练速度会加快很多。最大输入长度32,批次大小32,训练3个epoch, 测试环境为tensorflow1.14,GPU是2080ti。

开启混合精度比较慢,base版本模型的话需要一两分钟,但是开启后越到后边越快,训练步数少的话可以只开启xla就行了,如果多的话 最好xla和混合精度(混合精度前提是你的卡支持fp16)都打开。

可加载中文权重链接

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
移动app开发流程,app开发步骤
个人github:https://github.com/qiilee 欢迎follow
全栈程序员站长
2022/06/27
3.6K0
安卓和ios常用的开发工具,适合所有开发者,小白也可以哦
随着移动互联网的飞速发展,智能手机的普及化,手机app应用软件已经成为了人们生活中的一部分,APP开发行业也由过去的蓝海变成红海了。
知识与交流
2024/04/02
3580
安卓和ios常用的开发工具,适合所有开发者,小白也可以哦
移动端app开发流程分析「建议收藏」
随着信息技术的不断发展,互联网早已经向移动互联网过渡,而智能手机正在逐步取代桌面电脑的地位,手机APP成为人们获取各类信息、服务的强大渠道。
全栈程序员站长
2022/07/04
1.2K0
一个古典App开发者的DApp开发之路
技术重构世界,而欢迎主流人群去往新世界的,只会是游戏。 技术作为底层世界的基石,革命性的创新总是在大众看不见的地方静静的进行,但当一款基于新技术的游戏开始流行时,这样的改变是藏也藏不住的,对区块链行业
区块链大本营
2018/06/19
9170
原生app、webapp、混合app的区别介绍
目前市场上主流的APP分为三种:原生APP、Web APP(即HTML5)和混合APP三种,相对应的定制开发就是原生开发、H5开发和混合开发。那么这三种开发模式究竟有何不同呢?下面我们就分别从这三者各自的优劣势来区分比较吧! 一、APP原生开发 原生开发(Native App开发),是在Android、IOS等移动平台上利用提供的开发语言、开发类库、开发工具进行App软件开发。比如Android是利用Java、Eclipse、Android studio;IOS是利用Objective-C 和Xcode进行开发。 通俗点来讲,原生开发就像盖房子一样,先打地基然后浇地梁、房屋结构、一砖一瓦、钢筋水泥、电路走向等,都是经过精心的设计。原生APP也一样:通过代码从每个页面、每个功能、每个效果、每个逻辑、每个步骤全部用代码写出来,一层层,一段段全用代码写出来。 优点: 1、可访问手机所有功能(如GPS、摄像头等)、可实现功能齐全; 2、运行速度快、性能高,绝佳的用户体验; 3、支持大量图形和动画,不卡顿,反应快; 4、兼容性高,每个代码都经过程序员精心设计,一般不会出现闪退的情况,还能防止病毒和漏洞的出现; 5、比较快捷地使用设备端提供的接口,处理速度上有优势。 缺点: 1、开发时间长,快则3个月左右完成,慢则五个月左右; 2、制作费用高昂,成本较高; 3、可移植性比较差,一款原生的App,Android和IOS都要各自开发,同样的逻辑、界面要写两套; 4、内容限制(App Store限制); 5、获得新版本时需重新下载应用更新。 二、Web APP (HTML5)开发 HTML5应用开发,是利用Web技术进行的App开发。Web技术本身需要浏览器的支持才能进行展示和用户交互,因此主要用到的技术是HTML5、Javascript、CSS等。 优点: 1、支持设备范围广,可以跨平台,编写的代码可以同时在Android、IOS、Windows上运行; 2、开发成本低、周期短; 3、无内容限制; 4、适合展示有大段文字(如新闻、攻略等),且格式比较丰富(如加粗,字体多样)的页面; 5、用户可以直接使用新版本(自动更新,不需用户手动更新)。 缺点: 1、由于Web技术本身的限制,H5移动应用不能直接访问设备硬件和离线存储,所以在体验和性能上有很大的局限性; 2、对联网要求高,离线不能做任何操作; 3、功能有限; 4、APP反应速度慢,页面切换流畅性较差; 5、图片和动画支持性不高; 6、用户体验感较差; 7、无法调用手机硬件(摄像头、麦克风等)。 三、混合APP开发(原生+H5) 混合开发(Hybrid App开发),是指在开发一款App产品的时候,为了提高效率、节省成本而利用原生与H5的开发技术的混合应用。通俗点来说,这就是网页的模式,通常由“HTML5云网站+APP应用客户端”两部份构成。 混合开发是一种取长补短的开发模式,原生代码部分利用Web View插件或者其它框架为H5提供容器,程序主要的业务实现、界面展示都是利用与H5相关的Web技术进行实现的。比如京东、淘宝、今日头条等APP都是利用混合开发模式而成的。 优点: 1、开发效率高,节约时间。同一套代码Android和IOS基本上都可使用; 2、更新和部署比较方便,每次升级版本只需要在服务器端升级即可,不再需要上传到App Store进行审核; 3、代码维护方便、版本更新快,节省产品成本; 4、比web版实现功能多; 5、可离线运行。 缺点: 1、功能/界面无法自定:所有内容都是固定的,不能换界面或增加功能; 2、加载缓慢/网络要求高:混合APP数据需要全部从服务器调取,每个页面都需要重新下载,因此打开速度慢,网络占用高,缓冲时间长,容易让用户反感; 3、安全性比较低:代码都是以前的老代码,不能很好地兼容新手机系统,且安全性较低,网络发展这么快,病毒这么多,如果不实时更新,定期检查,容易产生漏洞,造成直接经济损失; 4、既懂原生开发又懂H5开发的高端人才难找。 以上就是原生开发、H5开发和混合开发各自的优缺点。相比之下,由于现代人的个性化需求越来越明显,所以原生APP开发也越来越多,定制化的服务更能满足消费者的需求。
江一铭
2022/06/16
1.5K0
小心你手机里的每一款APP,第三方SDK可能正在收集你的隐私
你大概知道自己的手机里装了多少个APP,你也知道APP在收集你的个人隐私数据。但你或许不知道,除此之外,你的数据还可能同时被隐藏在APP里的第三方SDK收集。 SDK是SoftwareDevelopm
BestSDK
2018/03/02
3.4K0
小心你手机里的每一款APP,第三方SDK可能正在收集你的隐私
直播系统开发过程中应该注意哪些事项
直播最重要的是用户体验,用户体验决定着直播APP的用户留存率,关乎着直播软件的存活,这也是直播系统来一个很大的考验,那么在直播系统开发过程中应该注意哪些事项呢?下面一起来详细了解下吧! 一、多平台互通
布谷安妮
2019/10/09
6090
直播系统开发过程中应该注意哪些事项
又一个项目开源,阿里已成为中国开源的关键力量
今天,开源软件托管平台github上的阿里巴巴主页又增加了一个新项目:Atlas。Atlas意指巨人,它是Google闻名遐迩的波士顿机器人的外号,也是手机淘宝团队的移动容器化框架的代号。在去年的云栖
罗超频道
2018/04/26
9880
又一个项目开源,阿里已成为中国开源的关键力量
BUF大事件丨1780个流行安卓APP违反加密规则;工信部通报101款违规APP
本周BUF大事件还是为大家带来了新鲜有趣的安全新闻,1780个流行的Android应用程序全都违反加密规则;工信部通报101款侵害用户权益行为APP;英特尔修复了企业远程管理平台中的严重漏洞;新型信用卡窃密工具出现,黑客利用Telegram提取数据。想要了解详情,来看本周的BUF大事件吧!
FB客服
2020/09/22
5580
BUF大事件丨1780个流行安卓APP违反加密规则;工信部通报101款违规APP
十大技巧快速提升原生APP开发性能
移动应用市场用户争夺战日益激烈,原来做APP拼想法拼创意拼是否抓住用户痛点。现在,精细化用户体验成为了一个APP能否留存用户的关键问题,一旦用户觉得体验不畅,马上就有竞品APP后补,如何开发高性能的移动应用,小编总结了以下十大技巧: 1.规划好应用功能,做好应用架构评估 用户体验开始于APP开发初始规划阶段,当你梦想开发一个APP改变世界之前,先想好APP主要解决用户的哪些真实需求,提炼出APP的核心功能,一个APP并不是功能越丰富越好,核心功能才能为用户带来不可替代的价值。 想清楚核心功能,才能做好应用架
非著名程序员
2018/02/09
8790
直播源码APP开发,不容忽视的问题的解决方案
直播行业从2015年就开始酝酿发展,2016年可以说是视频直播APP开发的元年,一直以来,视频直播行业都处于野蛮生长的状态,不少企业和投资人都争先恐后的进行直播源码APP软件的开发,那么在开发的过程中不容忽视的问题有哪些呢?视频直播源码APP开发比较容易遇到的问题是哪些呢?
布谷安妮
2019/08/12
6440
直播源码APP开发,不容忽视的问题的解决方案
如何改变APP命若昙花?只有实现万物互联
《捕鱼达人》、《疯狂猜图》、《脸萌》、《小偶》……这些曾经火爆过的App(移动应用)如今还有多少在你的手机上存在?即使依旧存在,你又是否还会去打开它? 最近,一份咨询调查机构的调查报告显示:“当前AP
人称T客
2018/03/20
8000
8个hybridapp开发工具_android hybrid
Hybrid App(混合模式移动应用)是指介于web-app、native-app这两者之间的app,兼具“Native App良好用户交互体验的优势”和“Web App跨平台开发的优势”。
全栈程序员站长
2022/09/30
2.4K0
8个hybridapp开发工具_android hybrid
鸿蒙APP开发的技术架构
鸿蒙(HarmonyOS)应用开发的技术架构是一个分层设计,旨在实现跨设备、全场景的无缝体验。其核心理念是“一次开发,多端部署”。以下是鸿蒙APP开发的主要技术架构组成部分。
数字孪生开发者
2025/04/08
2190
鸿蒙APP开发的技术架构
移动端开发之混合开发优劣势分析
2020年,我国互联网行业实现快速发展,网民规模稳定增长。截至2020年底,我国5G网络用户数超过1.6亿,约占全球5G总用户数的89%。
二山山记
2022/11/25
1.3K0
移动端开发之混合开发优劣势分析
App运营者不可不知的33款数据分析工具
如今的移动应用早已不再是某种结构单一、功能简单的工具了。当我们的移动应用变得越来越庞杂,我们便会需要借用分析工具,来跟踪和分析App内的每一个部分。幸运的是,目前市面上有许多数据分析工具可供App开发
灯塔大数据
2018/04/09
2.6K0
App运营者不可不知的33款数据分析工具
苹果强制使用HTTPS传输后APP开发者必须知道的事
作者asher,加入腾讯多年,主要负责腾讯CDN和云业务的HTTPS开发和运营工作。
WeTest质量开放平台团队
2018/10/29
1.5K0
移动APP安全行业报告金融篇
移动 APP 安全行业现状与导读 移动 APP 已逐步渗透入我们的生活,据统计,2016年,APP 发行数量仅电商、金融、游戏这三大类共计高达2万左右,国内移动互联网活跃用户数已经突破10亿,移动互联网这样快速的推移,移动互联网的安全问题更为严峻,基于腾讯云乐固和腾讯平台的大数据分析, 整个移动应用开发者所面临的安全问题主要涉及面有终端漏洞威胁,应用重打包威胁,应用仿冒威胁。 本移动 APP 安全行业报告将对金融、电商、游戏三大重灾区行业进行举例分析并配以图表说明,还原移动 APP 安全行业本貌。本期来
FB客服
2018/02/23
1.9K0
移动APP安全行业报告金融篇
如何做APP测试?
到今天为止,移动互联网已经走过了十个年头。虽然,行业红利早已经过去,但是移动端依旧是大厂纷纷争抢的流量入口。
测试小牛
2022/04/25
6620
视频社交APP开发功能特点优势分析
人口红利在给移动互联网带来增长机遇的同时,还推动着智能移动终端的普及,以及带动国内移动社交应用覆盖设备规模的逐渐扩大,目前预计覆盖了10.41亿部终端,包括陌生人社交和熟人社交,其中陌生人社交用户规模达3.5亿。 视频社交APP开发能为用户带来什么 视频社交APP开发是一种更快速的即时通讯工具,具有零资费、跨平台沟通、显示实时输入状态等功能,与传统的短信沟通方式相比,更灵活、智能,且节省资费,它的优势是: 1、基础社交,社交最基本的需求就是可以发语音、发图片、发文字。目前的一般通讯工具APP都可以实现该功能。 2、私信,典型案例是微信,在微信刚开始只是作为一个基础社交的文字,后面发展到语音,文件。现在能够实现实时视频通话。 3、实时客服,这个主要应用在特殊行业上,如医疗、教育、证券开户等行业,通过移动端的客服服务,及时解决客户的需要。 4、群聊,如蜻蜓FM,他为每个音乐电台创建了一个聊天频道,大家在这个频道里面进行聊天。 视频社交APP开发特点 1、陌生交友:从多个市场的下载量数据分析,很多视频社交APP开发公司热衷于进入到陌生交友领域,尤其是在垂直细分的陌生交友领域,该类应用存在着生存空间。 2、社会关系链整合:社交APP能将多种关系整合,并且展现为简捷的界面,类似于微信APP对多种社会化关系进行了深度整合。 3、熟人圈:移动互联网的发展给熟人关系领域搭建沟通桥梁,从目前该领域的情况来看,无疑腾讯、新浪遥遥领先,而腾讯通过移动QQ、微信、朋友网等应用,在关系深度上更胜一筹。 视频社交APP开发功能 1、聊天:支持发送语音短信、视频、图片(包括表情)和文字,是一种聊天软件,支持多人群聊(最高40人,100人和200人的群聊正在内测)。 2、添加好友:搜号码,然后输入想搜索的号码,然后点击查找即可 3、实时对讲机功能:用户可以通过语音聊天室和一群人语音对讲,但与在群里发语音不同的是,这个聊天室的消息几乎是实时的,并且不会留下任何记录,在手机屏幕关闭的情况下也仍可进行实时聊天。 4、语音提醒:用户可以通过语音告诉Ta提醒打电话或是查看邮件。 5、私信助手:开启后可接收来自QQ微博的私信,收到私信后可直接回复。 6、查看附近的人:微信将会根据您的地理位置找到在用户附近同样开启本功能的人。 7、语音记事本:可以进行语音速记,还支持视频、图片、文字记事。 8、账号保护:微信与手机号进行绑定,该绑定过程需要四步:1.在“我”的栏目里进入“个人信息”,点击“我的帐号”;2.在“手机号”一栏输入手机号码;
用户4551288
2019/04/17
1.6K0
视频社交APP开发功能特点优势分析
推荐阅读
相关推荐
移动app开发流程,app开发步骤
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档