2021年7月13日

故事会:关于我服务器网络坏掉这档事

作者 TheWhiteDog9487

事情是这样的:
我用我在大嘤弟国的服务器装Nginx,跑网站和反向代理。
重点是反向代理,这货可以充当加速器用,具体可以看这个(没准我之后可以做个视频版教程),我用这个方法加速Hypixel(实际上主要是抗丢包)
在前几天,这货出现了一点问题,表现为Hypixel内几秒钟卡一次,每次卡顿时间不一致,从几秒到十几秒不等,但就是不/断连接(手动断句,因为可能产生歧义),每次连接恢复都会出现天堂制造那种效果,然后又卡住,不断循环。我愣是顶着这问题玩了两天,直到昨天我再也受不了了,决心检测并消除问题。


首先我怀疑是Nginx撑不住了,换OpenVPN还是一样
我又怀疑是不是流量太大或不正常(有一群傻狗一直在爆破SSH),我就去看了一下Cockpit控制面板,发现了这个现象:

发现问题没?两个激活网卡的发送和接收数值都不见了,而正常是会显示的,像这样:

注:每次我Hypixel卡住的时候两张网卡的数值都会消失,从而可以通过这个判断问题
注2:SSH连接也会受到这个问题的影响,表现一模一样,所以可以排除Hypixel的问题
我以为是我电脑的问题,就RDP到NAS上看控制面板,这个现象还是有(顺带一提,如果浏览器使用的是Google的那个内核的话可能会报错,具体情况可以看这个
我以为是中国移动这个阴间ISP又来搞事了,就把我那个澳门电信的卡开流量共享,还是一样
我怀疑KAV(指Kaspersky Anti-Virus,实际上我用的是卡巴斯基安全软件,但任务管理器显示的是这个名字我就习惯这么叫了)管制又变严格了,停掉后还是一样
我甚至把Windows Defender防火墙关了,一样
我终于把目标对准了VPS和VPS的ISP,我能直接操纵的是VPS,所以做了很多尝试,最终还是那样
我以为是服务器被入侵或者被病毒感染了,就继续在大嘤地区开了一台配置和系统一模一样的全新服务器,结果还是那样子,至此我排除了服务器导致问题的可能。所以问题的根源是:Vultr的ISP!


经过一段时间的思想斗争,我最终还是给Vultr发出了一份Ticket(就是国内说的工单),因为我只有很基础的英语能力,所以我用的方法是让Google翻译先把中文转换成英语,我再校对一次,修正明显不合理的翻译。
很快技术部就给回复了,要求我提供由MTR生成的双向路由信息,源IP和目标IP,以及其他任何可能帮助问题排查的信息。
之后他们就把这个问题转发给网络部门了,并告诉我需要一定的时间来排查问题。
再过了一点时间,回复说已经发现了这个问题并进了临时修复,完全修复时会通知我。这时的时间是昨天晚上(具体多久不记得了,大概在九点左右,+-2小时)
顺便不得不夸一下,工单处理效率是真的高
我先拿Ping测了一下,丢包率暴涨,测也完全没法测,网络状况不行。
到了今天早上,我直接去Hypixel试了一下,确实修好了,丢包也是正常情况,昨天晚上应该是中国移动或者国际出口的问题。


至此,整件事情暂时结束了。

2021 07 14更新

今天网络部又给我更新了一下信息,说问题原因是数据中心的光纤插座上有一个交叉连接(原文是cross connection,这个我不知道准确翻译是什么)连接不良,导致一个冗余交换机不正常工作。现在线也换了一根新的,全都恢复正常了。