并发冲突导致流量放大的线上问题解决
事故现象生产环境,转账相关请求失败量暴增。直接原因现网多个重试请求同时到达svr,导致内存数据库大量返回时间戳冲突。业务方收到时间戳冲突,自动进行业务重试,服务内部也存在重试,导致流量放大。转账首先我们一起了解一下转账。…
事故现象生产环境,转账相关请求失败量暴增。直接原因现网多个重试请求同时到达svr,导致内存数据库大量返回时间戳冲突。业务方收到时间戳冲突,自动进行业务重试,服务内部也存在重试,导致流量放大。转账首先我们一起了解一下转账。…
软件从来不是一次就能完美的,需要以包容的眼光看待它的残缺。那问题究竟为何产生,如何去除呢?1、软件问题从哪来?软件缺陷问题千千万万,主要是需求、实现、和运行环境三方面。1.1需求描述偏差客户角度的描述,在经过业务对接、产品经…
只有被线上服务问题毒打过的人才明白日志有多重要!谁赞成,谁反对?如果你深有同感,那恭喜你是个社会人了:)日志对程序的重要性不言而喻,轻巧、简单、无需费脑,程序代码中随处可见,帮助我们排查定位一个有一个问题问题。但看似不起眼的日…
什么是契约测试?契约测试是一种用于独立检验每个应用程序之间集成问题的测试技术,验证系统发送或接收的格式化数据,是否匹配“契约”文档。对于通过HTTP协议进行通信的程序,这些“消息”将是HTTP的请求和响应,而对于使用队列的程序,则是队…
互联网测试少,测试研发比大概在1:5,再加上产品再使足了劲上需求,导致了测试需求量大,测试准备时间短,从而降低了上线质量。那么如何解决呢?测试是质量负责人,要对平台质量负责,于是就需要做一些取舍,挑重点测。因此,在时间不充裕的前提下…
如何理解性能测试场景?性能测试场景,其实和功能测试没什么区别,只是侧重点不同。我们在功能测试中经常用到的等价类边界值等分析和设计测试case的方法,目的是为了尽可能的覆盖业务场景,避免遗漏导致的功能逻辑缺失或者未达到预期。而在性…
测试体系建设背景现在随着各科技的公司业务的快速发展,对科技信息系统的建设速度和质量均提出了较高的要求,然而规范、高效、高质的测试是保障软件质量的重要环节。具备一套符合自身IT系统建设的测试体系,显得十分必要!这样才能最大程度…
无论在工作还是生活中,提问无处不在。每个人都可以是问题提出者(简称“提问者”),也都可能成为问题解答者(简称“提问对象”、“被提问者”)。只不过,相对而言,尤其是在技术圈子中,被提问者更多是更有经验、更有能力的那部分人。而这部分人…
小酋进入新公司后,刚完成了第一个由我负责项目的测试工作,感触颇多,过程中存在的问题也颇多,做好测试总结给出可能的建议后终于松了一口气。今天不谈问题,毕竟每个制度、环境下都有问题,无非大与小;今天谈谈我是如何快速融入项目团队的,希望…
一天晚上,给娃讲绘本《肚子里有个火车站》,故事用形象生动的比喻讲解消化吸收的原理与科学饮食的重要性。简单描述一下:我们的肚子里有个火车站,吃进来的食物会被小精灵们加工好后进行装车,然后以一定的频率发车。有时很久没有食物进来…
想一想,测试人员在什么场景下会跟测试面试官有交集?一般就两种情况,在一场测试人员招聘的面试中,我作为面试官,或者我作为应聘者。先来看一下“测试人员招聘”这个典型场景吧。测试人员招聘招聘,指的是为组织内的某个工作岗位(全职或兼职…
2年9个月,马上要告别2年9个月的项目,也应该给自己做个总结。即将迎来新的项目,未来依旧充满挑战。一、之前计算机专业出身的我,在2017年秋招的时候,需要做一个选择。这是离开校园对人生做出的第一个选择,“是做开发?”“是做产品?”“…
背景最近经常发现一个线上服务的响应时间会变长,分析线上metrics统计,发现偶尔会有一两台机器问题比较严重,经过多番追查,确定了问题,并修复了,在这儿回顾一下这个过程;服务基本逻辑客户端不同类别请求,由服务端的不同逻辑处理,每…
市面上流行的压力/负载/性能测试工具多是来自国外,近年来国内的性能测试工具也如雨后春笋般崛起,但大部分产品是基于Jmeter开源内核包装起来的性能测试工具,其中也不乏佼佼者,如:kylinTOP测试与监控平台,它是一款集性能测试、自动化测试、业务…
每年双十一,对买家来说是一场买买买的剁手之旅,但对于电商公司的技术人员来说,却是一次严峻的技术期末考。如何保证系统在预估的流量洪峰来临时,既能保证用户的买买买不受影响,促进业务及营销活动的目标达成,又能用尽可能少的成本投入保障系…