我需要导入维基百科转储(mysql表,解压的文件需要大约50 to )到Hadoop(hbase)。现在,我首先将dump加载到mysql中,然后将数据从mysql传输到hadoop。但是将数据加载到mysql需要大量的时间--大约4-7天。是否可以将mysql转储直接加载到hadoop中(通过转储文件解析器或其他类似工具)?
我将尝试将mysql表导入sqoop,但我将面临以下异常:运行在本地计算机表创建中的MySql和数据库创建工作正常,而当我尝试sqoop导入作业时,自动失败。请帮帮我。提前谢谢。'MySQL' is not recognized as an internal or external command,
operable program or batch file.at org.apache.hadoop.util.Shell.runCommand(Shell.java: