首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    伪数据科学家 VS 真数据科学家

    R语言编程跟伪数据科学为何扯上了关系?R是一种有20多年历史的开源统计编程语言及编译环境,是商业化产品S+的后继者。R一直以来都局限于内存数据处理,在统计圈子里非常流行,并因其出色的可视化效果为人称道。一些新型的开发环境通过创建R程序包或者将其扩展到分布式架构里(比如将R与Hadoop结合的RHadoop),将R(限于在内存里处理数据)的能力扩大。其他程序语言当然也存在跟伪数据科学沾边的情况,比如说SAS,但不及R这么流行。说到SAS,它价格高昂,在政府机构或者实体企业的应用更为广泛。但在过去10年数据快速增长的领域(如搜索引擎、社交媒体、移动数据、协同过滤推荐等)运用不多。R跟C、Perl或者Python的语法不一样(后三者语法根源一样),其简易性使得写R的程序员比较广泛。R还有很多程序包和不错的用户界面,SAS却难学很多。

    02

    大数据的起源和错失大数据市场的鼻祖Google

    大家好,我是飞总。目前就职与全球领先的大数据可视化公司Tableau。应该有很多人以前就读过我的大数据系列的公众号文章,我今天的这个讲座和以往的嘉宾都有一些不同。讲的不是现在流行的大数据工具和使用大数据来解决业务的具体问题。主要的原因有两个,一个是我主要做系统的研究和开发,而且讲的不是现在流行的大数据工具和使用大数据来解决业务的具体问题。做的都不是开源的系统。开发和使用来说差别比较大。所以我并没有使用系统解决实际问题的经验。二是我本身的背景很多出自学术圈,读论文讲八卦为主,所以大家可以听得轻松一点。 今

    014
    领券