我在mysql中有表测试,如下所示:
id name address
1 Km sky
2 hd heaven
3 Ab null
4 en null
现在我做了一个sqoop导入,如下所示
sqoop import--connect jdbc:mysql://XXXXXX/testing --username XXXX --password XXXX --query "select * from testing.test where \$CONDITIONS" --null-string '' --null-non-string '
我正在从mysql向hive导入一个表。该表包含2115584行。在导入期间,我看到
13/03/20 18:34:31 INFO mapreduce.ImportJobBase: Retrieved 2115584 records.
但是,当我在导入的表上执行count(*)时,我看到它有49262250行。怎么一回事?
更新:指定--direct时,导入可以正常工作。