网易首页 > 网易号 > 正文 申请入驻

【159期】面试官问:说说 MongoDB 批量操作与 MySQL 效率对比?

0
分享至

点击上方“Java精选”,选择“设为星标”

别问别人为什么,多问自己凭什么!

下方留言必回,有问必答!

每天 08:35 更新文章,每天进步一点点...

本文主要通过批量与非批量对比操作的方式介绍MongoDB的bulkWrite()方法的使用。顺带与关系型数据库MySQL进行对比,比较这两种不同类型数据库的效率。如果只是想学习bulkWrite()的使用的看第一部分就行。

一、MongoDB批量操作

MongoDB对数据的操作分为Read Operations和Write Operations,Read Operations包含查询操作,Write Operations包含删除、插入、替换、更新几种操作。MongoDB提供客户端用bulk方式执行Write Operations,也就是批量写操作。在java driver中,对应MongoCollection的bulkWrite()方法,先来看下这个方法签名:

BulkWriteResult com.mongodb.client.MongoCollection.bulkWrite(List> requests)

这个方法要求传入一个List集合,集合中的元素类型为WriteModel,它表示一个可用于批量写操作的基类模型,它有以下几个子类DeleteManyModel、DeleteOneModel、 InsertOneModel、ReplaceOneModel、 UpdateManyModel、UpdateOneModel,从名字可以看出来它对应了删除、插入、替换、更新几种操作。该方法返回一个BulkWriteResult对象,代表一个成功的批量写操作结果,封装了操作结果的状态信息,如插入、更新、删除记录数等。

1、插入操作

(1)、批量插入

代码如下,该方法接收一个包含要进行插入的Document对象的集合参数,遍历集合,使用Document构造InsertOneModel对象,每个InsertOneModel实例代表一个插入单个Document的操作,然后将该实例添加List集合中,调用bulkWrite()方法,传入存储所有插入操作的List集合完成批量插入。

public void bulkWriteInsert(List documents){
List> requests = new ArrayList>();
for (Document document : documents) {
//构造插入单个文档的操作模型
InsertOneModel iom = new InsertOneModel(document);
requests.add(iom);
}
BulkWriteResult bulkWriteResult = collection.bulkWrite(requests);
System.out.println(bulkWriteResult.toString());
}

测试:下面通过一个main函数测试下。首先构造10万个Product实体对象,使用一个工具类将其转换成json字符串,然后解析成Document对象,保存到一个list集合中,然后调用上面编写的方法测试10万个对象插入时间。

TestMongoDB instance = TestMongoDB.getInstance();
ArrayList documents = new ArrayList();
for (int i = 0; i < 100000; i++) {
Product product = new Product(i,"书籍","追风筝的人",22.5);
//将java对象转换成json字符串
String jsonProduct = JsonParseUtil.getJsonString4JavaPOJO(product);
//将json字符串解析成Document对象
Document docProduct = Document.parse(jsonProduct);
documents.add(docProduct);
}

System.out.println("开始插入数据。。。");
long startInsert = System.currentTimeMillis();
instance.bulkWriteInsert(documents);
System.out.println("插入数据完成,共耗时:"+(System.currentTimeMillis() - startInsert)+"毫秒");

结果:1560毫秒,多次测试基本在1.5秒左右

(2)、逐条插入

下面再通过非批量插入10万个数据对比下,方法如下:

public void insertOneByOne(List documents) throws ParseException{
for (Document document : documents){
collection.insertOne(document);
}
}

测试:10万条数据

System.out.println("开始插入数据。。。");
long startInsert = System.currentTimeMillis();
instance.insertOneByOne(documents);
System.out.println("插入数据完成,共耗时:"+(System.currentTimeMillis() - startInsert)+"毫秒");

结果:12068毫秒,差距非常大。由此可见,MongoDB批量插入比逐条数据插入效率提高了非常多。

补充:

MongoCollection的insertMany()方法和bulkWrite()方法是等价的,测试时间差不多,不再贴图。

public void insertMany(List documents) throws ParseException{
//和bulkWrite()方法等价
collection.insertMany(documents);
}
2、删除操作

(1)、批量删除

掌握了批量插入,批量删除就是依葫芦画瓢了。构造DeleteOneModel需要一个Bson类型参数,代表一个删除操作,这里使用了Bson类的子类Document。重点来了,这里的删除条件使用文档的_id字段,该字段在文档插入数据库后自动生成,没插入数据库前document.get("_id")为null,如果使用其他条件比如productId,那么要在文档插入到collection后在productId字段上添加索引

collection.createIndex(new Document("productId", 1));

因为随着collection数据量的增大,查找将越耗时,添加索引是为了提高查找效率,进而加快删除效率。另外,值得一提的是DeleteOneModel表示至多删除一条匹配条件的记录,DeleteManyModel表示删除匹配条件的所有记录。为了防止一次删除多条记录,这里使用DeleteOneModel,保证一个操作只删除一条记录。当然这里不可能匹配多条记录,因为_id是唯一的。

public void bulkWriteDelete(List documents){
List> requests = new ArrayList>();
for (Document document : documents) {
//删除条件
Document queryDocument = new Document("_id",document.get("_id"));
//构造删除单个文档的操作模型,
DeleteOneModel dom = new DeleteOneModel(queryDocument);
requests.add(dom);
}
BulkWriteResult bulkWriteResult = collection.bulkWrite(requests);
System.out.println(bulkWriteResult.toString());
}

测试:10万条数据

System.out.println("开始删除数据。。。");
long startDelete = System.currentTimeMillis();
instance.bulkWriteDelete(documents);
System.out.println("删除数据完成,共耗时:"+(System.currentTimeMillis() - startDelete)+"毫秒");

结果:2251毫秒

(2)、逐条删除

来看看在非批量下的删除

public void deleteOneByOne(List documents){
for (Document document : documents) {
Document queryDocument = new Document("_id",document.get("_id"));
DeleteResult deleteResult = collection.deleteOne(queryDocument);
}
}

测试:10万条数据

System.out.println("开始删除数据。。。");
long startDelete = System.currentTimeMillis();
instance.deleteOneByOne(documents);
System.out.println("删除数据完成,共耗时:"+(System.currentTimeMillis() - startDelete)+"毫秒");

结果:12765毫秒,比批量删除效率低很多

3、更新操作

(1)、批量更新

再来看看批量更新,分UpdateOneModel和UpdateManyModel两种,区别是前者更新匹配条件的一条记录,后者更新匹配条件的所有记录。对于ReplaceOneModel,表示替换操作,这里也归为更新,现在以UpdateOneModel为例进行讲解。UpdateOneModel构造方法接收3个参数,第一个是查询条件,第二个参数是要更新的内容,第三个参数是可选的UpdateOptions,不填也会自动帮你new一个,代表批量更新操作未匹配到查询条件时的动作,它的upser属性值默认false,什么都不干,true时表示将一个新的Document插入数据库,这个新的Document是查询Document和更新Document的结合,但如果是替换操作,这个新的Document就是这个替换Document。

这里会有个疑惑:这和匹配到查询条件后执行替换操作结果不一样吗?区别在于_id字段,未匹配查询条件时插入的新的Document的_id是新的,而成功执行替换操作,_id是原先旧的。

public void bulkWriteUpdate(List documents){
List> requests = new ArrayList>();
for (Document document : documents) {
//更新条件
Document queryDocument = new Document("_id",document.get("_id"));
//更新内容,改下书的价格
Document updateDocument = new Document("$set",new Document("price","30.6"));
//构造更新单个文档的操作模型
UpdateOneModel uom = new UpdateOneModel(queryDocument,updateDocument,new UpdateOptions().upsert(false));
//UpdateOptions代表批量更新操作未匹配到查询条件时的动作,默认false,什么都不干,true时表示将一个新的Document插入数据库,他是查询部分和更新部分的结合
requests.add(uom);
}
BulkWriteResult bulkWriteResult = collection.bulkWrite(requests);
System.out.println(bulkWriteResult.toString());
}

测试:10万条数据

System.out.println("开始更新数据。。。");
long startUpdate = System.currentTimeMillis();
instance.bulkWriteUpdate(documents);
System.out.println("更新数据完成,共耗时:"+(System.currentTimeMillis() - startUpdate)+"毫秒");

结果:3198毫秒

(2)、逐条更新

对比非批量下的更新

public void updateOneByOne(List documents){
for (Document document : documents) {
Document queryDocument = new Document("_id",document.get("_id"));
Document updateDocument = new Document("$set",new Document("price","30.6"));
UpdateResult UpdateResult = collection.updateOne(queryDocument, updateDocument);
}
}

测试:10万条数据

System.out.println("开始更新数据。。。");
long startUpdate = System.currentTimeMillis();
instance.updateOneByOne(documents);
System.out.println("更新数据完成,共耗时:"+(System.currentTimeMillis() - startUpdate)+"毫秒");

结果:13979毫秒,比批量更新效率低很多

4、混合批量操作

bulkWrite()方法可以对不同类型的写操作进行批量处理,代码如下:

public void bulkWriteMix(){
List> requests = new ArrayList>();
InsertOneModel iom = new InsertOneModel(new Document("name","kobe"));
UpdateManyModel umm = new UpdateManyModel(new Document("name","kobe"),
new Document("$set",new Document("name","James")),new UpdateOptions().upsert(true));
DeleteManyModel dmm = new DeleteManyModel(new Document("name","James"));
requests.add(iom);
requests.add(umm);
requests.add(dmm);
BulkWriteResult bulkWriteResult = collection.bulkWrite(requests);
System.out.println(bulkWriteResult.toString());
}

注意:updateMany()、deleteMany()两个方法和insertMany()不同,它俩不是批量操作,而是代表更新(删除)匹配条件的所有数据。

版权声明:本文为CSDN博主「风树种子」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 https://blog.csdn.net/u014513883/article/details/49365987

公众号“Java精选”所发表内容注明来源的,版权归原出处所有(无法查证版权的或者未注明出处的均来自网络,系转载,转载的目的在于传递更多信息,版权属于原作者。如有侵权,请联系,笔者会第一时间删除处理!

------ THE END -------

精品资料,超赞福利!


3000+ 道面试题在线刷,最新、最全 Java 面试题!

期往精选 点击标题可跳转

文章有帮助的话,在看,转发吧!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
厨房里有它快扔掉!癌症、老年性痴呆、心血管疾病全因它而起

厨房里有它快扔掉!癌症、老年性痴呆、心血管疾病全因它而起

凤凰卫视
2026-06-11 16:34:19
浙江省委副秘书长陈衡治,履新职!赵聪,已任文旅部公共服务司司长!

浙江省委副秘书长陈衡治,履新职!赵聪,已任文旅部公共服务司司长!

叮当当科技
2026-06-13 14:18:23
虎扑网友自曝婚前过往:破过三个c

虎扑网友自曝婚前过往:破过三个c

自愈小日子
2026-06-12 01:03:28
吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

吃完嫩的吃老的,山西儿媳出轨公公10年,亲自给丈夫生下一个妹妹

莫地方
2026-06-02 00:10:26
“我就递个娃,凭什么要多花2块钱?”新加坡爸爸怒了,发公开信直指交通部长

“我就递个娃,凭什么要多花2块钱?”新加坡爸爸怒了,发公开信直指交通部长

新加坡眼
2026-06-12 19:20:10
6月13日足球世界杯推荐:精选4场世界杯解析,含比分,进球数参考

6月13日足球世界杯推荐:精选4场世界杯解析,含比分,进球数参考

足球二串大王
2026-06-13 12:09:02
大家都难了吗?网传胖东来要降薪,成本会计3600工资竟来23人面试

大家都难了吗?网传胖东来要降薪,成本会计3600工资竟来23人面试

慧翔百科
2026-06-12 08:39:57
口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

口交、肛交等进入式性服务是卖淫行为吗?最高院定调了!

黯泉
2026-06-02 11:54:54
保姆给中风父亲洗澡,每次都要两小时,我打开监控一看,果断报警

保姆给中风父亲洗澡,每次都要两小时,我打开监控一看,果断报警

千秋文化
2026-05-27 20:02:00
“孩子等了一个月的硬菜被你毁了!”家长给娃请假,被嘲自我感动

“孩子等了一个月的硬菜被你毁了!”家长给娃请假,被嘲自我感动

熙熙说教
2026-06-12 19:28:35
惊天反转,18万亿损失打醒日本!小泉喊话中国,求帮日本渡难关

惊天反转,18万亿损失打醒日本!小泉喊话中国,求帮日本渡难关

探索新高度
2026-06-13 00:12:57
暨南大学硕市论文题目惊呆国人,终于知道为啥文科就业差了…

暨南大学硕市论文题目惊呆国人,终于知道为啥文科就业差了…

慧翔百科
2026-06-12 08:19:04
三大运营商终于作“死”了自己

三大运营商终于作“死”了自己

细雨中的呼喊
2026-06-10 23:49:50
4年1.785亿顶薪,好几支球队疯抢,詹姆斯这下高兴了

4年1.785亿顶薪,好几支球队疯抢,詹姆斯这下高兴了

从零到一研究所
2026-06-13 12:54:31
捞钱没底线?94岁胡枫开演唱会仅过去2天,“恶心”一幕出现

捞钱没底线?94岁胡枫开演唱会仅过去2天,“恶心”一幕出现

傲傲讲历史
2026-06-12 12:10:22
伊朗外长:霍尔木兹海峡相关服务将收费

伊朗外长:霍尔木兹海峡相关服务将收费

财联社
2026-06-13 03:52:12
43岁男子体检“心电图正常”,冠脉却堵了近九成!医生提醒:三类人群需提高警惕

43岁男子体检“心电图正常”,冠脉却堵了近九成!医生提醒:三类人群需提高警惕

极目新闻
2026-06-13 13:59:12
广厦核心赵岩昊顶薪到期离队,球迷直呼背叛

广厦核心赵岩昊顶薪到期离队,球迷直呼背叛

梦忆之浅
2026-06-13 13:37:17
光通信真正的王炸,是这5家龙头,谁在偷偷卡住AI命门?

光通信真正的王炸,是这5家龙头,谁在偷偷卡住AI命门?

林子说事
2026-06-13 13:07:34
英格兰内讧!阿森纳核心质疑国家队队友:他根本不配进世界杯

英格兰内讧!阿森纳核心质疑国家队队友:他根本不配进世界杯

奶盖熊本熊
2026-06-13 04:47:30
2026-06-13 15:28:49
Java精选
Java精选
一场永远也演不完的戏
1794文章数 3859关注度
往期回顾 全部

科技要闻

SpaceX上市首日破2万亿美元,马斯克再封神

头条要闻

专家:中国制裁外国防长及其亲属极为少见 是杀鸡儆猴

头条要闻

专家:中国制裁外国防长及其亲属极为少见 是杀鸡儆猴

体育要闻

东道主三战不败!美墨开门红加拿大零的突破

娱乐要闻

12年情怀碎一地!跑男接连翻车

财经要闻

梁文锋向左,杨植麟向右

汽车要闻

2026重庆车展 长城炮Hi4-T正式上市售14.98万起

态度原创

旅游
教育
游戏
本地
公开课

旅游要闻

夏天就该这样过!大别山的夏天,从霍山大峡谷漂流的第一声尖叫开始。

教育要闻

已知ABCDEF✖️F=999999,求ABCDEF各等于多少?

前棒鸡员工发声:马拉松绝非失败!它是工作室存亡关键

本地新闻

AK刘彰邂逅河北南大港湿地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版