Knowledge
/ def mix( ):
本期收录
新增20+
NO. 38
#机器学习##电影评分#
使用kaggle上的IMDb的电影数据集,通过深度学习识别电影海报的人脸数量,作为特征补充到数据集,然后把IMDb的评分作为目标值,训练一个基于catboost的回归模型,并通过shap值研究高分的决定特征是哪些。
结合以上2张图,我们有以下的洞察:
年份虽然是主要的决定因素,但与评分的关系比较复杂;
海报中是否出现人物也是一个关键的因素;
喜剧、爱情、战争、犯罪剧普遍具有较高的评分;
动作、历史、科幻具有较低的评分。
#遗传算法#强化学习#
OpenAI教给机器人使用强化学习(一种更复杂的优化方法)玩捉迷藏的游戏。机器人首先学习了“人性化”的策略,最终又自我学习了新的策略。
#AR#Web#
谷歌宣布将在搜索结果中加入3D模型,而且还可以直接通过AR的形式直接预览,例如在线购物,或者其它娱乐场景。
#沉浸式新闻#AR#
《时代周刊》杂志最近推出了一种体验新方式“TIME Immersive”。这款身临其境的应用程序可在谷歌游戏和Apple App Store中使用,利用AR和VR的强大功能,将故事和报道带入生活。例如该APP允许用户沉浸在1969年7月阿波罗11号登月的历史当中。
#辛普森悖论# #统计学#
图中是中国和意大利的新冠死亡率,每个年龄段,中国的都大于意大利,但意大利的总死亡率却比中国更高,这在统计学中被称为辛普森悖论,指在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。
https://github.com/ninoch/Trend-Simpsons-Paradox
#跨域推荐# #推荐系统#
什么是"跨域推荐"呢?比如,我要给“新闻”推荐东西,但是使用的数据不只是“新闻”自己的,它还包括了"房"、"车"、"招聘"等其他域产生的数据。
通过用户的基本信息建模用户的内在长期兴趣源域短期兴趣。
(Short-term interest from the source domain)
https://arxiv.org/abs/2008.02974