这里记录我过去一周看到的新闻、故事、技术、资料等等,分享给各位。同时也欢迎各位投稿,投稿地址zhenhai.gl@gmail.com。
1.全国首个5G地铁站
四川移动宣布,继2018年底在成都远洋太古里开通全国首个5G示范街区之后,全国首个5G地铁站又在成都正式开通。在地铁10号线太平园站内,由移动5G网络转化而来的高速wifi信号已经悄然覆盖整个站厅,此地铁站将成为移动对5G室内分布系统进行测试的重要场所,这也标志着5G网络距离我们已经越来越近。
2.Wing公司正测试静音无人机
提供无人机送货服务的 Wing 公司近日表示,正测试一种更加安静的无人机设备,具有噪音程度更低的推进器,能和人们日常生活场景中的声音融合在一起。此外,Wing的无人机会改变飞行路线,放慢飞行速度,尽量做到送货的同时不扰民。Wing 原本是Google X 实验室的项目之一,在 2018 年 12 月剥离成独立公司,目前正在澳大利亚进行测试。
3.马斯克晒出 SpaceX 星际飞船概念图
马斯克最近在 Twitter 上晒出 SpaceX 星际飞船测试版的概念图,不锈钢外观闪闪发光。目前这款测试版飞船正在位于德克萨斯州的发射基地组装,组装后大致跟图片相似,而真正投入使用的飞船将会更长,且有舷窗。预计亚轨道试飞时间为今年 3 月或 4 月。
4.机器人自动叠衣服
FoldiMate 最近在 CES 现场展示了一款自动叠衣服机器人。这辆机器跟洗衣机差不多大,只要将需折叠的衬衫、裤子等平整放入,几秒钟就会从出口「吐」出来。目前这款叠衣服机器暂时没法处理更大件(如床单)、更小件(如内衣、袜子、婴儿衣服)或更厚的衣物。现在还只是原型展示,预计今年年底发售,价格在 1000 美元左右。
5.DNA 是一种新式数据,也会有安全问题
基因检测服务变得流行,用唾液检测出家族史等解读似乎很有趣。而很多人还未意识到,DNA 正成为一种新式数据,它跟你其他的数据一样存在安全风险。人们对基因检测的狂热是因为内心需要寻求文化身份认同,而Staton 认为,我们现在还对自己 DNA 里藏着信息力量还不为所知,它不只代表我们的家谱,还代表着我们可能治愈的疾病,或是我们未来可能创造的新的痛苦。它对医学研究有极大帮助,但也很容易被用于作恶。
6.中科院作者将导师告至法庭
事情起源于2015年6月欧洲化学出版协会旗下ChemCatChem杂志发表的一篇英语论文。在该论文中,李啸是第一作者,他当时指导的硕士研究生刘毅(化名)是第二作者。刘毅认为,李啸利用自己实验得出的数据撰写成稿,成为论文第一作者,侵犯了自己的署名权。于是,他将李啸告上法庭,希望法院认定自己是论文的第一作者。目前在知乎专栏研究生教无良导师做人连载。
7.微信发布2018年度数据报告
报告显示,2018年每天有1,010,000,000位用户登陆微信、有45,000,000,000条短信发送、有410,000,000次音视频呼叫成功、通讯录朋友比三年前人均多110%。人群方面,00后最爱的表情是捂脸哭、90后最爱哭笑、80后最爱呲牙笑、70后最爱捂嘴笑、55岁以上最爱很棒。打造智慧生活方面,每个月使用微信搭公交地铁的乘客比去年增加4.7倍、每个月使用微信高速出行的人数比去年增加6.3倍、每个月使用微信零售消费的买家比2017年增加1.5倍、每个月使用微信吃饭买单的食客比去年增加1.7倍、每个月使用微信支付医疗费用的人数比去年增加2.9倍。
8.GitHub私有仓库免费 限制协作者最多三位
GitHub CEO Nat Friedman宣布了两个重要更新:一是 GitHub 私有库现在可免费使用,每个免费的存储库最多可以有3人协作,如果想要更多的协作者,则需要付费。二是将 Enterprise Cloud(前身为 GitHub Business Cloud)和Enterprise Server(前身为 GitHub Enterpris)统一为GitHub Enterprise,想要在云或自托管配置中灵活使用 GitHub 的组织现在只需付一个产品的价格就能同时使用这两项服务。
9.阿里开源超大规模矩阵计算框架Mars
Mars是由阿里云高级软件工程师秦续业等人开发的一个基于张量的大规模数据计算的统一框架,目前已在 GitHub上开源。该工具能用于多个工作站,而且即使在单块 CPU 的情况下,它的矩阵运算速度也比 NumPy(MKL)快。
10.雷军:生死看淡 不服就干
短短一个小时的红米Note7手机产品发布会,雷军怼了友商8次,甚至在媒体群访环节,雷军也抑制不住愤怒之情,提到友商面色铁青。雷军说:“这全都是友商给我逼的,红米独立就是为了在磕高品质,证明不弱于甚至强于友商,有人说小米便宜但品质有问题,我气得半死,小米也不做华为跟保时捷合作的这样门面产品,该多少钱就卖多少钱。”雷军还说:“友商总是很爱吐槽,小米喜欢搞饥饿营销,说我们是PPT手机,但是你看看他们这才是PPT手机,有能耐就拿现货出来卖!都在圈子里混。再把我惹急了,我就科普一下你们穿孔屏的技术缺陷,不要装。生死看淡,不服就干!”
11.买机票可以少花钱了
燃油附加费在去年 6 月开始恢复征收,最开始是 10 元,后来随着国际航油价格不断上涨价格也随之上涨。而从 2018 年末开始,国际航油价格一路下跌,目前,包括南航、海航、东航等 9 家航司已经正式发布公告,从 1 月 5 日(出票日期)起,暂停收取燃油附加费。目前只是一个暂时的政策,一旦国际油价上涨,可能也会进行恢复征收。 国际机票的燃油费则不在这次调整范围内。
1.bigjpg图片无损放大软件
bigjpg 是一个无损放大图片的软件,http://bigjpg.com。其利用人工智能和深度神经网络来无损放大图片,将噪点和锯齿进行自动补充。最大支持10M和3000*3000 大小,已经能够满足我们日常需求。同时还可以进行注册,注册之后能够查看历史放大记录。目前支持下载Win、Mac、Android版本。
2.OneTab标签管理插件
OneTab 是一个可以将很多打开Tab 网页折叠起来的Chrome插件。当你有很多页面打开,而短时间内又不会用到,此时可以用OneTab折叠成一个页面。当折叠之后,内存也能够减少使用95%左右,对于狂吃内存的Chrome 来说,简直是救星。当再次使用时,可以全部恢复或者单独恢复。
3.划词翻译
划词翻译是一个Chrome 翻译插件,支持有道、百度、谷歌、谷歌(中国)四种翻译引擎,不用担心速度。在Chrome之中,划词即可进行翻译,非常方便。
1.特别喜欢凌晨醒来,发现外面天还是黑的,有着雨声,并且不用工作上课,然后继续呆在温暖的被窝,再睡去这种满足感。
2.你如果缓缓把手举起来,举到顶,再突然张开五指,那恭喜你,你刚刚给自己放了个烟花。——里尔克《为我庆祝》
3.你必须退让的时候,就必须退让。但在你必须选择机会前进的时候,必须前进。这是一种火候的拿捏,需要对自己的终极目标非常清醒,非常冷静,对支撑这种目标的理念非常清醒,非常冷静。你非常清楚你的靶子在哪儿,退到一环,甚至脱靶都没关系。环境需要你脱靶的时候,你可以脱靶,这就是运作的策略,但你不能失去自己的目标。那是堕落。——柴静《看见》
4.心太软的人快乐是不容易的,别人伤害她或她伤害别人,都让她在心里病一场。——严歌苓《陆犯焉识》
5.你问人问题,她若答非所问,便已是答了,毋需再问。——木心《素履之往》
道德无法触及8000米以上空气稀薄地带
1998年5月,美国女登山家阿森蒂夫在成功登顶后下撤的途中因为严重缺氧而虚脱倒地。当时经过她身边的南非登山家沃达尔和队友因为不忍心见死不救,但又清楚知道自己没有能力把她背下山,所以选择放弃登顶计划,下山寻找救援。可是不幸的是,阿森蒂夫没有等到救援,就已经死去。阿森蒂夫的遗体后来一直被留在她遇难的地方,就像一个地标一样矗立在原地。
一直到九年以后,一直沉浸在自我良心责备里的沃达尔带着一支队伍,专程上山把阿森蒂夫的遗体运到海拔5000多米的营地,才给了她一个体面的葬礼。
8000米不是道德的边界,而是能力的边界,人们选择见死不救,不是道德的缺失,更大的原因是能力的不足,而这种不足值得被理解并原谅。
1.线性判别分析(LDA)
线性判别分析(Linear Discriminant Analysis, LDA)是一种Supervised Learning。LDA是在目前机器学习、数据挖掘领域经典且热门的算法,常用于降维。LDA的原理是,将带上标签的数据(点),通过投影的方法,投影到维度更低的空间中,使得投影后的点,会形成按类别区分。目标是使得类间方差最大,类内方差最小。右图为LDA投影后的结果。
2.参数服务器parameter server
参数服务器是个编程框架,用于方便分布式并行程序的编写,其中重点是对大规模参数的分布式存储和协同的支持。工业界需要训练大型的机器学习模型,一些广泛使用的特定的模型在规模上的两个特点:
这种需求下,当前类似MapReduce的框架并不能很好适合, 因此需要自己实现分布式并行程序。其实在Hadoop出来之前,对于大规模数据的处理,都需要自己写分布式的程序(MPI), 之后这方面的工作流程被Google的工程师总结和抽象成MapReduce框架。参数服务器就类似于MapReduce,是大规模机器学习在不断使用过程中,抽象出来的框架之一。重点支持的就是参数的分布式,毕竟巨大的模型其实就是巨大的参数。
3.Linux wc命令
统计指定文件中的字节数、字数、行数,并将统计结果显示输出。 例如
wc test.txt
7 8 9 test.txt
分别为行数、单词数、字节数、文件名
命令参数有-c统计字节数、-l统计行数、-m统计字符数,该标志不能与-c标志一起使用 、-w统计字数 、-L打印最长行的长度 、-help显示帮助信息。
4.Linux tar命令
tar -xzvf a.tar.gz解压文件
tar -czvf a.tar.gz a压缩文件
tar命令参数解释有-c建立压缩档案、-x解压、-t查看内容、-r向压缩归档文件末尾追加文件、-u更新原压缩包中的文件。这5个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用,但是只能用一个。
其中-z有gzip属性的、-j有bz2属性的、-Z有compress属性的、-v显示所有过程、-O将文件解开到标准输出。参数-f是必须的,-f表示使用档案名字,这个参数只能是最后一个参数,后面只能接档案名。
5.分布式服务框架 Zookeeper
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。 ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。
ZooKeeper是以Fast Paxos算法为基础的,Paxos 算法存在活锁的问题,即当有多个proposer交错提交时,有可能互相排斥导致没有一个proposer能提交成功,而Fast Paxos作了一些优化,通过选举产生一个leader (领导者),只有leader才能提交proposer,具体算法可见Fast Paxos。
你可能还想看