我在一个数据库中有几个表。一个表(tbl_transactions)包含数以千计的孤立记录,这些记录没有链接到任何剩余的表。我需要运行一个脚本来删除这些记录,以便在我的数据库中重新获得一些丢失的空间。我试图运行一个删除所有记录的脚本,但是日志文件占用了20 GB的空间,从而填满了HDD,并且脚本没有完成。我的脚本如下所示:
delete tbl_Transactions
where not exists (select *
From tbl_SocketConnections
where tbl_Transacti
如何处理Apache猪脚本中的坏记录。在我的例子中,我处理的是一个逗号分隔的文件,通常每一行都有14个字段。
但是,有时行包含\n,记录被分割成两行,我的猪脚本无法将此记录和所有记录插入到HBase中。
问题是,UDF中映射的长度总是3,可能是因为PIG脚本中定义的模式。如何确定记录的字段数是否等于架构.
猪
REGISTER 'files.py' using jython as myfuncs
A = LOAD '/etl/incoming/test.txt' USING PigStorage(',') AS (name:chararray,
我有一个包含5条记录的Employee表,并且我正在运行以下脚本。脚本的结果是返回一个带有EmpID 2的记录。同时记录正在被删除。这条路对吗?
begin transaction A
select * from Employee where EmpID=2
begin transaction B
delete from Employee where EmpID=2
commit transaction B
commit transaction A