不提升性能也拿奖?Dynamic Copysets 降低数据丢失概率 | TiDB Hackathon 2020 优秀项目分享
近日,由 TiDB 社区主办,专属于全球开发者与技术爱好者的顶级挑战赛事——TiDB Hackathon 2020 比赛圆满落幕。今年是 TiDB Hackathon 第四次举办,参赛队伍规模创历届之最,共有 45 支来自全球各地的队伍报名,首次实现全球联动。经过 2 天时间的极限挑战, 大赛涌现出不少令人激动的项目。为了让更多小伙伴了解这些参赛团队背后的故事, 我们开启了 TiDB Hackathon 2020 优秀项目分享系列,本篇文章将介绍 CNCF 特别奖森海飞霞团队赛前幕后的精彩故事。
Q
为什么叫森海飞霞这个队伍名?
Q
你们最初为什么会想到要做这样一个项目?能分享下你们的灵感是什么吗?
队长高松:项目起源于上海 Office 的一次争论,这次讨论发生在 2020 年 2 月,当时冯立元在群里提出了「假设一个集群机器无限多,Raft Group 无限多的情况下, 我随便挑 3 台 总能找到一个 Raft Group,所以命中 3 台就会丢数据」起初东旭不相信这个结论,直到冯立元甩出论文,看似反直觉的结论竟然是经过论证的。这次辩论也为 Hackathon 埋下了种子。目前最大的 TiKV 单体集群可能只有几百台,但我们不能等到有上千台集群时才考虑这个问题。Copysets 离真正生产环境 GA 的标准还需要非常久的调试和测试,必须在集群规模达到之前做好应对。由于 Dynamic Copysets 本身是一个调度问题,我的工作也与调度相关,因此在 Hackathon 消息刚公布时就我默默想好了选题,加上讨论中舌战群儒的冯立元,我们两人一拍即合组成了队伍。
评委唐刘:Copysets 是我一直关注的领域,几年前我就写过相关文章,但这个实现难度高并且很难模拟,所以能在 Hackathon 上看到静态的 Copysets,并通过 PD simulator 模拟出来真的很振奋。
Q
知乎上你们的帖子里写到是唯一一个让 TiDB 性能倒退的项目,能详细说说为什么吗?
Q
在比赛过程中你们遇到过比较大的技术困难是什么?后续维护的最大的挑战是?
Q
你们认为 Dynamic Copysets 为什么很少有人做呢?
Q
在参赛过程中有什么有趣的事儿可以分享吗?
Q
除了自己的项目,最喜欢哪个项目?
To 冯立元:
在 2020 年我们一起合作了很多项目,谢谢你帮助我成长了很多,希望今后还能继续合作。
——高松
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- 1 农文旅融合绘就美丽乡村新图景 7957457
- 2 130亿三岁影帝接了多少广告 7916311
- 3 女子误踩油门撞入医院致1死1伤 7857076
- 4 春回大地农事起 春耕备耕正当时 7704419
- 5 车牌尾号666过完户车主突然失联 7682296
- 6 下周将迎超级大回暖 气温火箭式飙升 7523995
- 7 男生用镜头记录下女友5年的蜕变 7487206
- 8 深圳女子报警:“我举报我自己” 7322399
- 9 乌克兰被曝并无大量稀土 7250346
- 10 码农辞职成网约车单王3年赚近70万 7125528