「分布式系统之美」知乎圆桌精选大放送第二期|不要放过任何你感兴趣的话题
相信大家看完上周「分布式系统之美」知乎圆桌精选大放送后还意犹未尽,新的一轮热门讨论已被小编盘点下来,快来跟随小编一起看看有什么新的答案吧。
精选问题 & 回答
1. MySQL 单表日均 15 万数据,主要用来存储数据。有什么可靠的方案?
作者:cx3ptr (伴鱼基础架构负责人)
单表、单日 15w,一年数据是 5000w,三年是 1.5 亿,从数据量的角度来看并不算大。“主要是存储数据” 可以认为没有复杂的计算,那就从容量、高可用两个角度来阐述下吧。
容量方面: 保存三年热数据
1. 字段少且简单:直接用 MySQL 来扛也没问题,超过三年的冷数据逐渐归档到 hdfs、s3 之类的文件存储上或者 Hbase 上作为冷数据提供查询。
2. 字段比较多或容量增加比较大:这里其实假定单机容量、IO 性能达到瓶颈,需要进行分片存储,也就是常说的分库、分表操作。以分表为例也有几种方式: hash、range、日期,hash 方式比较均匀,但是扩容不方便,只能进行翻倍扩容(像是 vitess 具备 resharding 能力,也是我感觉 proxy 里做的最好的,这种可以任意增减分片扩缩容量),rang 方案没有扩容的压力,但是不能缩容并且随着时间的推移,最近访问的范围往往会成为热点,如果是 IM 业务我们可以按照日期进行分表。当然分库分表也有客户端、proxy 代理、data mesh (趋势,很少用)几种方式,可能因为自己做中间件,我比较喜欢 proxy 的方式,控制力比较足、业务侵入小,方便架构、运维统一治理。这类 proxy 有很多 vitess (部署难度比较大,但是功能很强大)、kingshard、gaea、shardingsphere (好像也有 proxy 方案)、mycat 等...
我以前也搞过 kingshard、gaea,中间件方案搞起来是真挺痛苦的,加入分布式事务、resharding 功能也挺难的,所以如果有容量问题,还是比较推荐 TiDB 的...
扫描二维码查看完整回答
2. 什么是云原生数据库?
云数据库时代,云厂商承接了数据库的基础设施支撑,把传统 DBA 从日常繁杂琐碎的运维工作中解脱出来,我理解中的云原生数据库包括以下几大特性:
扫描二维码查看完整回答
3. 目前有哪些先进的存储模型适合 HTAP 数据库?
扫描二维码查看完整回答
4. 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?
作者:Xiaoyu Ma (工程师 @PingCAP)
扫描二维码查看完整回答
5. 学计算机专业的你后悔了吗?
作者:kylin (伴鱼技术中台负责人)
扫描二维码查看完整回答
6. 未来的数据库是什么样的,应该有哪些特征?
作者:孙晓光 (知乎)
扫描二维码查看完整回答
「分布式系统之美」线上圆桌直播来啦!周三晚上 20:00 不见不散!查看下方海报获取更多直播详情。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 澳门是伟大祖国的一方宝地 7920800
- 2 女子穿和服在南京景区拍照遭怒怼 7970885
- 3 日本火山喷发灰柱高达3400米 7897551
- 4 2024 向上的中国 7782548
- 5 肖战新片射雕英雄传郭靖造型曝光 7695582
- 6 大三女生练咏春一起手眼神骤变 7583201
- 7 胡军演洪七公 7406230
- 8 男子钓上一条自带“赎金”的鱼 7323565
- 9 赵丽颖带儿子探班 7259615
- 10 高考601分女生为何选择殡葬专业 7127520