我正在使用PageRankBenchmark示例测试我的单个节点集群Gi相图的安装,方法如下:
$HADOOP_HOME/bin/hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/giraph-examples-1.1.0-for-hadoop-2.4.0-jar-with-dependencies.jar org.apache.giraph.benchmar
我在一个由5台机器(1台主机和4台从机)组成的集群中运行hadoop。我正在运行一个用于共同好友推荐的map-reduce算法,并且我使用了一个49995行的文件(或者49995个人,每个人后面跟着他的朋友)。问题是,在集群上执行算法比在一台机器上执行算法需要更多的时间!我不知道这是否正常,因为文件不够大(因此,由于机器之间的延迟,时间会变慢),或者我必须更改一些东西,以便在不同的节点上并行运行算法,但我认为这是自动完成的。通常,在一台机器上运行该算法需要执行以下操作:
real