日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

使用aggregate在MongoDB中查找重复的数据记录

發(fā)布時(shí)間:2023/12/2 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 使用aggregate在MongoDB中查找重复的数据记录 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

  我們知道,MongoDB屬于文檔型數(shù)據(jù)庫(kù),其存儲(chǔ)的文檔類型都是JSON對(duì)象。正是由于這一特性,我們?cè)贜ode.js中會(huì)經(jīng)常使用MongoDB進(jìn)行數(shù)據(jù)的存取。但由于Node.js是異步執(zhí)行的,這就導(dǎo)致我們無(wú)法保證每一次的數(shù)據(jù)庫(kù)save操作都是原子型的。也就是說(shuō),如果客戶端連續(xù)兩次發(fā)起同一事件將數(shù)據(jù)存入數(shù)據(jù)庫(kù),很可能會(huì)導(dǎo)致數(shù)據(jù)被重復(fù)保存。高并發(fā)的情況下,哪怕是你在代碼中已經(jīng)做了非常嚴(yán)格的校驗(yàn),例如插入數(shù)據(jù)前判斷要保存的數(shù)據(jù)是否已經(jīng)存在,但仍然有可能會(huì)出現(xiàn)數(shù)據(jù)被重復(fù)保存的風(fēng)險(xiǎn)。因?yàn)樵诋惒綀?zhí)行中,你沒(méi)有辦法保證哪個(gè)線程先執(zhí)行,哪個(gè)線程后執(zhí)行,客戶端發(fā)起的所有請(qǐng)求并非按我們想象的都是順序執(zhí)行的。一個(gè)較好的解決辦法是在Mongo數(shù)據(jù)庫(kù)的所有表中創(chuàng)建唯一索引。事實(shí)上,MongoDB默認(rèn)會(huì)為所有表創(chuàng)建一個(gè)_id字段的唯一索引(可以取消)。如果你想在Node.js中通過(guò)mongoose.schema來(lái)自動(dòng)創(chuàng)建索引,可以參考下面的代碼:

var mongoose = require('mongoose'); var Schema = mongoose.Schema;var customerSchema = new mongoose.Schema({cname: String,cellPhone, String,sender: String,tag: String,behaviour: Number,createTime: {type: Date,default: Date.now},current:{type: Boolean,default: true} }, {versionKey: false });customerSchema.index({cname:1,cellPhone:1,sender:1,tag:1,behaviour:1}, {unique: true});

module.exports = mongoose.model('customer', customerSchema);

  上面的model中我們定義了表customer的結(jié)構(gòu),并通過(guò)index()方法在字段cname,cellPhone,sender,tag,behaviour上創(chuàng)建了唯一索引,這樣當(dāng)包含這些字段的重復(fù)數(shù)據(jù)被插入時(shí),數(shù)據(jù)庫(kù)會(huì)拋出異常。借用mongoose,如果數(shù)據(jù)庫(kù)表之前已經(jīng)被創(chuàng)建并且程序正在運(yùn)行中,當(dāng)我們修改model并添加索引,然后重新啟動(dòng)app,只要有對(duì)該model的訪問(wèn),mongoose會(huì)自動(dòng)進(jìn)行檢測(cè)并創(chuàng)建索引。當(dāng)然,如果數(shù)據(jù)出現(xiàn)重復(fù),則索引創(chuàng)建會(huì)失敗。此時(shí)我們可以通過(guò)在創(chuàng)建索引時(shí)添加dropDups選項(xiàng),讓數(shù)據(jù)庫(kù)自動(dòng)將重復(fù)的數(shù)據(jù)刪除,如:

customerSchema.index({cname:1,cellPhone:1,sender:1,tag:1,behaviour:1}, {unique: true, dropDups: true});

  不過(guò)據(jù)MongoDB的官方說(shuō)明,自3.0以后的版本不再使用該選項(xiàng),而且也并沒(méi)有提供替代的解決辦法。貌似官方不再提供創(chuàng)建索引時(shí)自動(dòng)刪除重復(fù)記錄的功能。那如何才能快速有效地找出重復(fù)的記錄并且刪除呢?首先我們要找出這些記錄,然后通過(guò)remove()方法進(jìn)行刪除。下面的查詢語(yǔ)句可以找出給定字段有重復(fù)數(shù)據(jù)的記錄:

db.collection.aggregate([{ $group: { _id: { firstField: "$firstField", secondField: "$secondField" }, uniqueIds: { $addToSet: "$_id" },count: { $sum: 1 } }}, { $match: { count: { $gt: 1 } }} ])

  替換_id屬性的值以指定你想要進(jìn)行判斷的字段。相應(yīng)地,在Node.js中代碼如下:

var deferred = Q.defer(); var group = { firstField: "$firstField", secondField: "$secondField"};model.aggregate().group({_id: group,uniqueIds: {$addToSet: '$_id'},count: {$sum: 1} }).match({ count: {$gt: 1}}).exec(deferred.makeNodeResolver());return deferred.promise;

  上述代碼使用了Q來(lái)替換函數(shù)執(zhí)行中的回調(diào)。在Node.js的異步編程中,使用Q來(lái)處理回調(diào)是個(gè)不錯(cuò)的選擇。

  下面是返回的結(jié)果:

/* 1 */ {"result" : [ {"_id" : {"cellPhone" : "15827571111","actId" : ObjectId("5694565fa50fea7705f01789")},"uniqueIds" : [ ObjectId("569b5d03b3d206f709f97685"), ObjectId("569b5d01b3d206f709f97684")],"count" : 2.0000000000000000}, {"_id" : {"cellPhone" : "18171282222","actId" : ObjectId("566b0d8dc02f61ae18e68e48")},"uniqueIds" : [ ObjectId("566d16e6cf86d12d1abcee8b"), ObjectId("566d16e6cf86d12d1abcee8a")],"count" : 2.0000000000000000}],"ok" : 1.0000000000000000 }

  從結(jié)果中可以看到,一共有兩組數(shù)據(jù)相同的記錄,所以返回的result數(shù)組的長(zhǎng)度為2。uniqueIds屬性為一個(gè)數(shù)組,其中存放了重復(fù)記錄的_id字段的值,通過(guò)該值我們可以使用remove()方法來(lái)查找并刪除對(duì)應(yīng)的數(shù)據(jù)。

?

補(bǔ)充:Mongoose支持findOneAndUpdate(在MongoDB中對(duì)應(yīng)的方法叫findAndModify),選項(xiàng)upsert=true表示當(dāng)要要更新的數(shù)據(jù)不存在時(shí)會(huì)自動(dòng)創(chuàng)建。該選項(xiàng)默認(rèn)值為false。示例代碼如下:

var query = {'username':req.user.username}; req.newData.username = req.user.username; MyModel.findOneAndUpdate(query, req.newData, {upsert:true}, function(err, doc){if (err) return res.send(500, { error: err });return res.send("succesfully saved"); });

  通過(guò)該方法我們可以將數(shù)據(jù)的唯一性校驗(yàn)交給MongoDB來(lái)完成。

?


更多專業(yè)前端知識(shí),請(qǐng)上 【猿2048】www.mk2048.com

總結(jié)

以上是生活随笔為你收集整理的使用aggregate在MongoDB中查找重复的数据记录的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。