我有一个包含多个日期类型字段的集合。我知道我可以根据它们的键来更改它们,但是是否有一种方法可以找到所有将日期作为类型并在一个脚本中更改它们的字段呢?
更新
非常感谢chridam帮助我。基于他的代码,我想出了这个解决方案。(注意:我有Mongo3.2.9,一些来自chridam的答案的代码片段就是无法运行。它可能是有效的,但对我不起作用。)
map = function() {
for (var key in this) {
if (key != null && this[key] != null && this[key] instanceof Date){
emit(key, null);
}
}
}
collectionName = "testcollection_copy";
mr = db.runCommand({
"mapreduce": collectionName,
"map": map,
"reduce": function() {},
"out": "map_reduce_test" // out is required
})
dateFields = db[mr.result].distinct("_id")
printjson(dateFields)
//updating documents
db[collectionName].find().forEach(function (document){
for(var i=0;i<dateFields.length;i++){
document[dateFields[i]] = new NumberLong(document[dateFields[i]].getTime());
}
db[collectionName].save(document);
});
由于投影不起作用,我使用了上面的代码来更新文档。我唯一的问题是为什么要使用bulkWrite?
(而且,getTime()似乎比减法日期更好。)
发布于 2017-01-04 10:02:06
这样的操作将涉及两个任务:一个是通过MapReduce获取日期类型的字段列表,另一个是通过聚合或散装写操作更新集合。
NB:以下方法假设所有日期字段都位于文档的根级,而不是嵌入nor子文档。
MapReduce
您需要的第一件事是运行以下mapReduce操作。这将帮助您确定集合中每个文档的每个属性是否为日期类型,并返回日期字段的不同列表:
// define helper function to determine if a key is of Date type
isDate = function(dt) {
return dt && dt instanceof Date && !isNaN(dt.valueOf());
}
// map function
map = function() {
for (var key in this) {
if (isDate(value[key])
emit(key, null);
}
}
// variable with collection name
collectionName = "yourCollectionName";
mr = db.runCommand({
"mapreduce": collectionName,
"map": map,
"reduce": function() {}
})
dateFields = db[mr.result].distinct("_id")
printjson(dateFields)
//output: [ "validFrom", "validTo", "registerDate"" ]
选项1:通过聚合框架更新集合
您可以使用聚合框架更新您的集合,特别是在$addFields版本3.4和更高版本中可用的MongoDB操作符。如果您的MongoDB服务器版本不支持此功能,则可以使用其他解决方案更新您的集合(如下一个选项所述)。
时间戳的计算采用$subtract算术聚合算子,以日期字段为分钟,以历元new Date("1970-01-01")
为减法。
然后通过$out操作符将聚合管道的结果文档写入同一个集合,从而用新字段更新集合。
本质上,您可能希望运行以下聚合管道,该管道使用上述算法将日期字段转换为时间戳:
pipeline = [
{
"$addFields": {
"validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
"validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
"registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
}
},
{ "$out": collectionName }
]
db[collectionName].aggregate(pipeline)
给定日期字段的列表,您可以动态创建上述管道数组,如下所示:
var addFields = { "$addFields": { } },
output = { "$out": collectionName };
dateFields.forEach(function(key){
var subtr = ["$"+key, new Date("1970-01-01")];
addFields["$addFields"][key] = { "$subtract": subtr };
});
db[collectionName].aggregate([addFields, output])
选项2:通过大容量更新集合
由于当不支持上述$addFields运算符时,此选项是一种解决方法,因此可以使用$project管道创建具有相同$subtract实现的新时间戳字段,但是可以使用forEach()方法和每个文档从聚合结果中使用bulkWrite()方法更新集合,而不是将结果写入相同的集合。
下面的示例说明了这种方法:
ops = []
pipeline = [
{
"$project": {
"validFrom": { "$subtract": [ "$validFrom", new Date("1970-01-01") ] },
"validTo": { "$subtract": [ "$validTo", new Date("1970-01-01") ] },
"registerDate": { "$subtract": [ "$registerDate", new Date("1970-01-01") ] }
}
}
]
db[collectionName].aggregate(pipeline).forEach(function(doc) {
ops.push({
"updateOne": {
"filter": { "_id": doc._id },
"update": {
"$set": {
"validFrom": doc.validFrom,
"validTo": doc.validTo,
"registerDate": doc.registerDate
}
}
}
});
if (ops.length === 500 ) {
db[collectionName].bulkWrite(ops);
ops = [];
}
})
if (ops.length > 0)
db[collectionName].bulkWrite(ops);
使用与上面的选项1相同的方法动态创建管道和bulk方法对象:
var ops = [],
project = { "$project": { } },
dateFields.forEach(function(key){
var subtr = ["$"+key, new Date("1970-01-01")];
project["$project"][key] = { "$subtract": subtr };
});
setDocFields = function(doc, keysList) {
setObj = { "$set": { } };
return keysList.reduce(function(obj, key) {
obj["$set"][key] = doc[key];
return obj;
}, setObj )
}
db[collectionName].aggregate([project]).forEach(function(doc) {
ops.push({
"updateOne": {
"filter": { "_id": doc._id },
"update": setDocFields(doc, dateFields)
}
});
if (ops.length === 500 ) {
db[collectionName].bulkWrite(ops);
ops = [];
}
})
if (ops.length > 0)
db[collectionName].bulkWrite(ops);
https://stackoverflow.com/questions/41458544
复制相似问题