程序員最重要的兩個東西

jopen 10年前發布 | 5K 次閱讀程序員

開篇

先來講一個故事，最近在改造項目中日志處理服務，使用了公司內部公共的一些組件與服務。好不容易改造完成了，前幾天開始灰度上線，上線觀察了一天，從監控平臺上可以看到，每次流量高峰期（一般早中晚各一次）就會出現大量的thrift反序列化失敗的問題。出現問題怎么辦呢？解決唄，就這樣，故事開始了…

先來介紹整個服務的數據流示意圖，如下：

</div>

然后我這邊有一個服務去消費kafka的數據，做一些數據分析。

服務跑了一天多，我從公司內部的監控平臺上發現，我的服務（消費kafka的服務）在每一個日志高峰期都會出現大量的thrift結構反序列化失敗的異常。

發現問題之后我有幾個可以懷疑的地方：

其中第三點可以細分為以下幾個可能：

一般來說，排查問題都應該從自身問題找起，所以首先來證明自己的清白：

做了上述修改與實驗之后，還是沒有解決問題，所以可以斷定問題出在第四步： 日志在傳輸過程中被篡改。

于是發郵件咨詢相關的同事，得到的回答都是沒有問題的，很多業務都使用我們的服務，從來沒出現過問題，你再找找原因吧。，沒辦法啊，氣場不夠，只能說聲謝謝，然后繼續自己摸索。

三天時間過去了，還是沒能找到自己的原因，我真是快要奔潰了，于是在leader的陪同下親自去找之前郵件溝通過的同事，大概聊了20分鐘，最后對方突然說：流量高峰期的時候，我們會將日志寫到本地文件，隨后再次讀取的時候可能真的會有問題，巴拉巴拉一堆，說我們看看吧，一會兒給你們回郵件。

回來等了幾分鐘，收到郵件了：這個確實是我們的一個bug，你們流量太大了，之前都沒有遇到過，我們會盡快修復，到時候通知你們。

程序員最最重要的兩個東西： 技術，名氣 ，如果沒有技術和名氣，別人根本不把你當回事，遇到問題時都會認為是你自己的問題，所以，努力提升自己技術和影響力吧！

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！