360 x TiDB|性能提升 10 倍,360 如何轻松抗住双十一流量
「我们已经用起来了」,是我们最喜欢听到的话,简简单单几个字的背后代表着沉甸甸的信任和托付。我们将通过「相信开放的力量」系列深度案例分享,从业务的角度,看看一个数据库为各行业用户带来的业务价值。本篇文章将介绍 TiDB 在 360 网盾业务、智慧商业业务、广告物料数据业务等核心场景的应用与实践。
360 公司创立于 2005 年,是中国领先的互联网和安全服务提供商,先后推出 360 安全卫士、360 手机卫士、360 安全浏览器等安全产品。
业务挑战
网盾业务
360 网盾是一款免费的上网保护软件,可以拦截木马、欺诈网站等等保护消费者不受到病毒及虚假网站的欺诈。它的运行机制是会针对每一条 URL 进行分析,经过网址检测系统判别后,能够精准识别出该 URL 属于哪个类别。对有问题的 URL 发布到云,其他安全服务商就可以通过订阅云服务,来检测相关的 URL 是否安全,以向自己用户提供更加安全的网页内容服务。
目前整个网盾业务核心场景可以分为以下四个部分:
网址威胁监测:每天入库 1 亿条数据,8 亿多资源链接数据;
关联分析场景:进行大规模恶意网址、黄赌毒等网站的关联分析;
高速返回:897 亿条数据表,每个场景 100+ 条数的查询需要在 5 秒内返回;
人工运营分析:每天每个人不断反复查询统计、分析。
针对业务爆发式增长的数据量,读写上 MySQL 已经出现瓶颈。例如磁盘空间,虽然可以通过分库分表的方式,拆分出来,但这对业务和 DBA 来说都是不小的工作量;最痛苦的无异于这些大表的改表,对一张大表执行 DDL 的代价是非常大的。总的来说,MySQL 已经无法满足网盾业务需求,这对负责底层数据平台支撑的 360 云平台技术团队提出了新的选型需求。
360 云平台负责对 360 集团各大业务线提供服务支持,涉及的数据库支持方案有:MySQL、Redis、MongoDB、ElasticSearch、Greenplum、PiKA。在经过充分的市场调研后,360 云平台团队决定引入 TiDB 来满足业务这一需求。
360 云平台 TiDB 整体架构
整体架构如上,使用 TiDB 的业务主要有两种:
原有 MySQL 业务迁移。因单机磁盘受限,导致单实例磁盘无法支撑爆炸式增长的数据量,数据比较重要,需要备份和支持 7*24 小时的恢复。这类业务通过 DM 套件来实现无障碍迁移,1TB 的导入时间在 16 小时,如果是比较大的数据源,且 TiDB 是全新集群,可以使用 TiDB Lightning 进行数据导入,速度可以达到 100G/小时。
全新的业务。全新的业务目前全部都会放到 TiDB 中,这种业务数据量一般都会比较大,目前网盾业务有多张表都过 10 亿级别,其中有张表到达了 100亿+。
智慧商业业务
广告主实时 & 离线报表业务
广告主的实时报表业务流程:业务数据入 Kafka,一条处理链路是通过 Druid 获取 Kafka 的数据提供实时分析,另一条链路通过 Flink 进行聚合后写入 MySQL 分库分表数据库,然后通过广告主维度提供实时查询需求。
广告主的离线报表业务流程:每天凌晨,数仓从 MySQL 分库分表中抽取前一天的所有数据入 Hive,通过 Spark 或者业务程序统计聚合后将结果数据写入 MySQL 结果表,提供给离线报表平台或者 Console 平台查询。
报表作为广告平台的核心业务,面临的问题如下:
数据量大:总数据千亿级别,单表数据量 1.2~1.5 亿。
响应延时低:需要对用户的任意周期及关键词的查询进行实时反馈。
查询复杂:时间维度、地域、行业、关键词等等,同时满足多样化的展示。
架构复杂:基于 MySQL 的分库分表无法进行全局统计,只能基于广告主 UID 来出明细报表,全局的统计需要引入 Druid 来辅助处理;离线报表需要 Hive 数仓抽取全量数据来实现。
数据库选型:MySQL or TiDB?
MySQL 分库分表架构图
TiDB HTAP 架构图
部署 TiDB 后,TiDB 良好的扩展性完全解决了分库分表的问题,同时经过性能压测,2 小时 1.5 亿的数据存储(TPS:2W/s),整个系统负载完全满足业务需求,通过搭配 TiFlash (TiDB 的实时分析引擎插件),我们可以对合并后的单表进行各种维度的全局以及明细的实时分析,并且实现了离线报表的在线统计,免去了离线数仓这种 T+1 的时效和同步流程,同时还提供金融级别的强一致性保证。
广告物料数据业务
对于广告主而言,在搜索推广中,基于安全、精准、可信赖的新一代搜索引擎360搜索,通过关键词技术匹配,定位目标网民,精准展现企业推广信息,物料创意的作用则是帮助广告主吸引潜客,进而产生转化行为,比如注册、在线提交订单、电话咨询、上门访问等等。
目前 360 广告的物料平台会承载客户制作图片、文字、视频等的信息,支持对推广账户、推广计划、推广组、关键词、推广创意、高级样式各个层级的物料进行上传、下载、导入、导 出、添加、编辑、删除等操作。
在使用 TiDB 之前,点睛物料数据底层使用了 16 套分库 * 4 的 MySQL 架构,每套分库 MySQL 单表已经到达 10 亿,单表数据规模在 370G,对于单库 QPS 过万的 SQL 请求,MySQL 表已经到达性能瓶颈,高峰期频繁抖动,并且新业务想对大表新增字段,由于硬盘空间不足,也不能支持新业务上线。如果继续使用 MySQL ,则需要将目前的 16 套分库拆分成 64 套分库(需要新增约上百服务器),除了新增服务器,迁移和运维成本也非常高。
360 商业化业务线技术团队通过技术选型调研,最终确定了以 TiDB 作为物料平台底层的数据库。目前支撑物料平台的 TiDB 集群规模为 63 个节点,日 SQL请求在 70 亿次以上,在刚刚过去的双十一 QPS 最高达 25 W/s,工作日 99% 的 SQL 请求都在 15ms 以内,响应快、稳定性、扩展性都达到预期。
通过部署 TiDB 收益如下:
成本节约
相较之前 MySQL 部署模式,节约了 40% 的服务器成本。
之前是业务维护的分库分表路由规则,现在对于业务来说都是一张表,提升了业务的开发效率,让研发更多的关注在业务上。
运维成本降低,TiDB 提供丰富的工具链生态,覆盖数据迁移、同步、备份等多种场景,提升了运维效率。
性能提升
618、双十一 QPS 最高能到 25 W/s,工作日 99% 的 SQL 请求都在 15 ms。
相对于基于 VIP 切换的 MySQL 主从架构,TiDB 的可用性超过 99.95%。
纯分布式架构,拥有良好的扩展性,支持弹性的扩缩容,吞吐跟存储都可以在线平滑扩容,数据库扩展能力提升了 1~2 个数据量级。
未来,360 技术团队也计划将 TiDB 推上 360 HULK 云平台,为 360 集团安全大脑、360 游戏、核心安全服务平台等更多业务线提供稳定可靠的数据库服务。
与客户同行,相信开放的力量
延伸阅读
TiDB x 平安金管家 | 拥抱 NewSQL 数据库,加速敏态业务创新
TiDB x 中通科技 | 提效 300%,TiDB 联手中通让你的包裹“实时可见”
TiDB x 微众银行 | 耗时降低 58%,分布式架构助力实现普惠金融
TiDB X 伴鱼 | 「宁花机器一分,不花程序员一秒」,用户增幅 300% 背后的秘密武器 TiDB x 中国电信翼支付 | 「效率提升 5 倍」,TiDB 在电信翼支付金融核心场景的应用
下一篇精彩案例,coming soon…
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 澳门是伟大祖国的一方宝地 7970632
- 2 央视曝光未成年人绕开防沉迷只需4元 7971784
- 3 特朗普赞成TikTok继续在美国运营 7861385
- 4 2024 向上的中国 7718551
- 5 张雨绮 为了讨大家喜欢才穿成这样 7635776
- 6 星巴克大罢工 7525924
- 7 停个车数据就泄露了 7432863
- 8 大S老公具俊晔站C位跳女团舞 7363757
- 9 男子暴瘦110斤后被质疑戴人皮面具 7215583
- 10 老人花2万买保健床垫后再不愿去医院 7127810