昔日在华为的时候在深圳出差,带领团队开发一款宽带接入服务器,一段时间辛苦工作以后

黄河边边 2025-09-09 19:21:25

昔日在华为的时候在深圳出差,带领团队开发一款宽带接入服务器,一段时间辛苦工作以后,总算在义乌开了个实验局。奇怪的是在实验室里没有任何问题的产品,在局方却频频出现问题,但是我们在实验室里却没有办法复现问题。 前方的兄弟都急疯了,说你们再不解决问题我就回去了,这事儿我就不管了。问题的核心就是一个转发表里的MAC地址老是被修改,一旦修改了,这个兄弟就得通过命令行接口手动修改内存转发表内容,把MAC地址改对了,但是过了几个小时又会错。最后这个兄弟没有办法了,把所有的电话机都挂掉,这样电话就不会响了。 后来更麻烦的事情发生了,由于宽带接入服务器下面下挂的都是网吧,网吧的老板上出现问题打不通电话,就骑着摩托直接来了。。。局方的房子外面摩托声此起彼伏。 我在后方实在没有办法,我最初的想法应该是非法野指针,在某个时刻刚好把转发表的那个内容修改了。这种问题根据经验很难解决,只能让同组的开发人员review代码,期望能发现问题bug,折腾了一星期也没有解决,突然一天我灵机一动,先把转发表写在SDRAM内存,然后一下memory copy到转发内存,结果问题就解决了,但是我们也不知道什么原因。 我们的转发机使用的是英特尔的芯片,英特尔后来发布了bug list,说他们的芯片在按位操作写的时候不稳定,容易出错,特别是在温度高的时候。由于在我们实验室里,空调温度一直很低,这也是华为的习惯,干活的时候有利于振奋精神,得穿上长袖才行。但是设备在局方的时候,那里的温度就很高,导致芯片按位操作屡屡出错。而我使用的方法先在普通内存里写完操作表,然后在memory拷贝方法整体写入转发机内存,刚好避开了这个问题。

0 阅读:6

猜你喜欢

黄河边边

黄河边边

感谢大家的关注