所以我是DDD的新手,我正在尝试正确地设计一个应用程序。但我在识别聚合根时遇到了一些困难。
我的需要或多或少是一棵树
*Customers
*Each customer can have 0 or more licenses
*Each license can have 0 or more courses
*Each course can have 0 or more lessons
*Each lesson can have 0 or more slides and videos
最后,我有测验/测试,可以链接到几乎任何东西,甚至一节课的视频中的某个时间。
无论我如何思考它,我只得到客户将是
我在SAS中有一个数据集,比方说: ID、类、组
组有4个值:{1,2,3,4}和未知数量的类{Class1,...,类n }。
为每一组找到最常用的课程的最快方法是什么?
我可以看到两个选项,使用Proc freq或使用类似于
proq sql;
Select count(*)
From Have
group by group, class;
取各组最大值后。但是我不知道怎么结束..。
编辑
我说的是最快的,但这更多的是关于有效性的,我在一个1000万行的大桌子上工作,而且我真的经常运行它
我主要感兴趣的是创造性的东西,但也感兴趣的科学背后的观众和营销的一种媒体。考虑在数据科学上有一个稳定的职业生涯,你认为我应该从哪里开始?媒体分析和商业智能一样大吗?我查看了在线课程,比如谷歌分析学院( google analytics academy )和其他类似的课程:
https://www.edx.org/xseries/data-science-analytics-context
https://www.coursera.org/specializations/jhudatascience
这是正确的道路吗?即使这个人是编程初学者,也很容易在这样的领域找到工作吗?
当我为出版物和演讲生成图形时,我倾向于使用ggplot2。然而,对于非常大的数据集,我想要生成一个快速的绘图,或者对于学生在R方面没有很好的基础的课程,我使用基础图形。
有什么好的(简单的!)如何增加R图形的趣味性?例如,你是否使用了很好的颜色和线型的组合。我倾向于这样做:
#Functional but not that nice
plot(x1,y1, type="l")
lines(x2, y2, col=2, lty=2)
特别是,我正在考虑plot、hist和density函数,但我认为这个问题适用于所有的基本R图形。