Network Troubleshooting Methodology - The Systematic Approach

Network Troubleshooting Methodologiya: Sistematik əlaqə

Niyə metodologiya mövzuları

Problem: A bazar proqramı "slow"dur. Ağ komandası server komandasını günahlandırır. Server komandası şəhərinə qəbul edir. Bu arada, istifadəçilər güclü, və saat ümumi debugging boşanmışdır.

Çözüm: Əməliyyatdan istifadə etmək üçün sistematik, elmi yanaşma, qadın səbəblərini müəyyən etmək.

Haphazard Troubleshooting qiyməti: Ətraflı vaxt, maska real problemləri, komandalar arasında barmaq, və degraded user experience.

Giriş: Networking üçün hazırlanmış Elmi Metod

Ağ problemliyi əsasən elmi üsulda bir egzersizdir:

  1. Qeydiyyat simptomlar və data toplamaq
  2. Bir hipotez kök mövzu
  3. Arxa diqqoriyalar
  4. Analyze və ya hipotezini redaktə və ya redaktə
  5. Bir düzeltme təsdiq kök sənayesi
  6. Axtarış Problem haqqında

Bu məhsul kimi ümumi pitfalls qarşısını qarşısını almaq üçün yapılandırılmış bir səhifə verir:

  • təsdiqliyyat (başa ilk tahmin dəstəyini dəstəkləyən sübut üçün görünür)
  • Tanınma olmadan Random dəyişikliklər (səfər və dualar)
  • Kök səbəblərinin yerine simptomları düzeltmek
  • s s s s

Beş Key məlumat

texniki diaqnostikaya daldırmadan əvvəl, bu beş kritik sualları araşdırmaq üçün:

Tarix 1: Son zamanlarda dəyişdirilmişdir?

Konfiqurasiya dəyişiklikləri? Yeni hardware? Yadda saxla Topologiya məlumatları?

  • Check-in idarə edilməsi
  • konfiqurasiya idarəetmə sistemləri üzrə son işləri
  • Sorğun: "Bu dün işləyir?"
Question 2: Kim səslənir?

Bir istifadəçi? Bir bina? Haqqımızda Xüsusi proqram yalnız?

  • Bir cihaz: Bir yerli mövzu kimi (NIC, kabel, konfiqurasiya)
  • One subnet: Gateway, DHCP
  • Ümumi: Core infrastruktur, ISP və ya geniş məhsul
  • Xüsusi proqram: Application server, firewall qorunması və ya DNS
Question: Bu Constant və ya Intermittent?

Bütün vaxt olur? Yalnız müxtəlif saatlar? Random hallar?

  • Ümumi: Hard çatışmazlığı (sable cut, yanlış konfiqurasiya, aşağı xidmət)
  • Vaxt-based: Biznes saatları zamanı kongestion, planlaşdırılmış proseslər
  • Intermittent/Random: Avtomobil, distent link
Question: Can You Reproduce It?

İstehsal problemini tetikləyə bilərsiniz?

  • Yes: Tanınmaq üçün çox daha asan (d testi hipotez)
  • No: monitorinq / qazanmaq və recurrence üçün baxmaq
Niyə 5: Digər Side baxır?

Yadda saxla

  • Yadda saxla
  • Pulsuz mövcuddur.
  • Asimmetrik routing? vs göndərmək üçün müxtəlif yollar?

OSI Model-based diqqqoriya

OSI modeli problemləşdirilməsi üçün yapılandırılmış bir çərçivə verir. Layer 1 (Physical) upward, və ya Layer 7 (Application) aşağı, simptomlar asılı olaraq.

Alt-Up haqqında (Layer 1 → Layer 7)

istifadə etmək üçün: Tam bağlantı itkisi, heç bir link işıq, və ya fiziki kağız simptomları

Kataloq 1: Fiziki
  • Check: Kabel bağlı? Yadda saxla Fiber təmiz?
  • Komissiyalar: show interfaces, ethtool eth0
  • Axtarış: CRC hataları, döyüşlər, gecikmiş döyüşlər, runts, devs
Layer 2: Data Link
  • Check: Düz VLAN? Port xidməti? STP bloklaşdırmaq
  • Komissiyalar: show mac address-table, show spanning-tree
  • Axtarış: MAC flapping, STP topologiya dəyişiklikləri, VLAN yanlış
Kataloq: Network
  • Qeydiyyatdan keçmək: Routing masa düz?
  • Komissiyalar: ping, traceroute, show ip route
  • Axtarış: Xüsusi marşrutlar, yanlış bir nömrə, routing loops
Layer 4: Avtomobil
  • Check: TCP bağlantısı yaradır? Yadda saxla
  • Komissiyalar: telnet host port, netstat -an, ,
  • Axtarış: TCP retransmissions, sıfır windows, RST paketləri
Layer 5-7: Session/Presentation/Applications
  • Check: DNS qarşılaşdırılması? Proqram xidməti? E-poçt ünvanı
  • Komissiyalar: nslookup, dig, curl -v
  • Baxış: DNS hataları, proqramlar, vaxtlar

Top-Down Approach (Layer 7 → Layer 1)

istifadə etmək üçün: Əsas bağlantının var olduğu kompüter-spublika problemləri

Example: "İnternet baxa bilərim, lakin şirkət SharePoint saytına daxil ola bilərim."

Layer 7 başlayır ( SharePoint xidməti çalışır? DNS düzgün IP qarşılaşdırılması?) və yalnız lazım olsaydı aşağı iş.

Qalereya: Bu Layer 1, 2 və ya 3?

bu sürətli diqqqoriyasını qaldırmaq üçün istifadə edin:

Siz yerlihost (127.0.0.1) ping edə bilərsiniz?
↓ NO
Problem: İşletim Sistemi / Software Issue

TCP/IP yığın işləyir. OS xidmətlərini kontrol edin, ağacaq sürücülərini yeniləyin.

E-poçt
Öz IP ünvanınızı dəyə bilərsiniz?
↓ NO
Problem: Layer 1/2 - Local Network Interface

NIC, yanlış sürücü, istehsalsız. Giriş: ip link show Cihaz meneceri

↓ YES
Siz default Gateway ping edə bilərsiniz?
↓ NO
Problem: Layer 1/2 - Yerli Ağ

Check: Fiziki kabel, qazanma port statusu, VLAN təhlükəsizlik, ARP masa

↓ YES
IP ünvanı ilə uzaq host?
↓ NO
Problem: Layer 3 - Routing

Check: Routing masa, firewall qaydaları, ACLs. Daxil ol traceroute paketin qaldığını tapmaq

↓ YES
DNS (nslookup hostname) haqqında müəyyən edə bilərsiniz?
↓ NO
Problem: DNS konfiqurasiyası

Check: DNS server ayarları, DNS server təhlükəsizlik, firewall blok port 53

↓ YES
Proqram limanına (telnet host port) baxa bilərsiniz?
↓ NO
Problem: Firewall / Port Blocking

Check: Firewall qaydaları, təhlükəsizlik qrupları, limanda dinləmə xidmət

↓ YES
Network OK - Application Layer Issue

Problem proqramın özü, təhlükəsizlik və ya proqram konfiqurasiyası ilə

Layihələri

Kök mövzu haqqında bir hipoteziniz varsa, bu soyutma texnologiyalarından istifadə edin və ya redaktə:

1. Komponentlərini dəstəkləyir

Axtarış: Bir vaxtda BİR dəyişdirin. Siz həmçinin kabelini və şüşə port dəyişdirmək varsa, bunu sabitləyirsiniz.
  • tanınan-good kabel ilə Swap yama kabel
  • müxtəlif şüşə limanında test
  • müxtəlif NIC (or USB ağ adapter)
  • müxtəlif müştəri cihazdan test
  • müxtəlif VLAN/subnet

2. Paket Çıxışları Birden çox Points

Yüksək, orta xüsusiyyətlər və paketin düşmüş və ya dəyişdirilən yerləşdirilməsi:

# Capture on client tcpdump -i eth0 -w client.pcap host server.example.com # Capture on server tcpdump -i eth0 -w server.pcap host client.example.com # Compare: # - Do packets leave client? (check client.pcap) # - Do packets arrive at server? (check server.pcap) # - If yes/no: problem is in the path between # - If yes/yes but server doesn't respond: server-side issue

3. Çapa Testi

Bir cihaz daxil olmaqla xarici növbətlərin qarşısını almaq:

# Test TCP stack without network ping 127.0.0.1 # Test application listening locally telnet localhost 80 # Test loopback on network interface (if supported) # Some NICs support physical loopback for Layer 1 testing

4. tanınan-Good Baseline müqavilələri

İş sisteminin qarşı konfiqurasiyası və davranışı ilə əlaqə edin:

# Compare interface settings diff <(ssh working-switch "show run int gi1/0/1") \ <(ssh broken-switch "show run int gi1/0/1") # Compare routing tables diff <(ssh router1 "show ip route") \ <(ssh router2 "show ip route")

İmtahanlar

Proper məsləhətləri, onu təhlükəsiz bir çox dəfəsiz eyni şeyi axtardığınız ümumi debugging qarşısını alır.

Şablonlar

Issue ID: TICKET-12345 Date/Time: 2026-02-02 14:30 UTC Reported By: Jane Smith (jane.smith@company.com) Affected Users: ~50 users in Building A, 3rd floor Symptom: Cannot access file server \\fileserver01 Initial Observations: - Issue started around 14:00 UTC - Only affects Building A, 3rd floor - Other buildings can access fileserver01 - Ping to fileserver01 (10.1.50.10) times out from affected users - Ping to default gateway (10.1.30.1) succeeds Tests Performed: 1. [14:35] Checked switch port status: gi1/0/15 is UP/UP 2. [14:38] Checked VLAN assignment: Port is in VLAN 30 (correct) 3. [14:42] Checked interface errors: 1,234 CRC errors on gi1/0/15 4. [14:45] Replaced patch cable - still seeing CRC errors 5. [14:50] Moved uplink to different port (gi1/0/16) - errors persist 6. [14:55] Checked fiber cleanliness - dirty connector found Root Cause: Dirty fiber connector on uplink between Building A floor switch and distribution switch causing CRC errors and packet loss Resolution: Cleaned fiber connector with proper cleaning kit. CRC errors dropped to zero. File server access restored. Verification: Users confirmed file server accessible. Monitored for 15 minutes with no errors. Time to Resolution: 25 minutes
Niyə məlumatlar: Bu rekord olmadan, bir dahaki vaxt kim bu şəkildə CRC hataları görür, onlar dərhal lif təmizləşdirilməsi üçün kabel dəyişdirmək və test limanları dəyişdirə bilər.

Real-World Case Studies

Case Study 1: "The Network's Slow" (Actually: TCP Sərgisi)

Qalereya

Database proqramı cavab vaxtı <100ms-dən 5+ sm-ə qəbul edilir. Proqram komandası "network latency".

Baş inkişaf (Wrong)

  • Axtarış
  • WAN link doyğu
  • Qablaşdırma

Diaqnostik proses

  1. Ping testi: RTT = 2ms (excellent, diametri 3 latency)
  2. Banden test (iperf): 950 Mbps haqqında 1 Gbps link (heç bir kongestion)
  3. Paket çıxış: Açıq TCP Zero Window paketləri məlumat server
  4. Yadda saxla Database server buffers almaq = 64KB (tiny!)

Kateqoriya

Database server OS buffers yüksək × gecikmə məhsul üçün çox kiçik idi. TCP qapı doldurmaq, baxmaq üçün.

Qeyd

# Increased TCP receive buffers on Linux database server sysctl -w net.ipv4.tcp_rmem="4096 87380 16777216" sysctl -w net.core.rmem_max=16777216

Onlayn

Qeyd etməyin: "Slow" hər zaman "network latency" deyil. Hər zaman məlumat toplamaq (sonsuzluq üçün qazanmaq, davranış üçün paket tutmaq) məlumat toplamaq.

Case Study 2: Intermittent Connectivity (Actually: Duplex Mismatch)

Symptom

Yadda saxla Ən çox yaxşı işləyir, əvvəl məlumat.

Initial Assumptions (Wrong)

  • Qeydiyyat
  • Pulsuz kabel
  • Laptop məlumatı

Diagnostic Process

  1. İnterfeys: Yadda saxla
  2. Qeyd: Ətraflı döyüş sayı
  3. Son döyüşlər: duplex qaynaq

Root Cause

Auto-negotiation başarısız oldu. Yadda saxla Collisions həmçinin tərəfindən istifadə etdiyi zaman yük altında yalnız meydana gəldi.

Resolution

! Cisco switch - force full duplex interface GigabitEthernet1/0/10 speed 1000 duplex full

Lesson Learned

Check: Interface status müzakirə edilmiş ayarları göstərir. Yanlış bir xüsusiyyət auto-negotiation başarısız deyil. serverlər üçün daima sabit kodlu sürət/duplex.

Case Study 3: "MTU/PMTUD Black Hole"

Symptom

Yadda saxla Kiçik HTTP məlumatları işlədi, böyük pages vaxt.

Initial Assumptions (Wrong)

  • DNS məlumat
  • Daxili saytların bloklanması
  • Uşaq problemləri

Diagnostic Process

  1. DNS haqqında Bütün saytlar üçün gözəl iş
  2. Ping testi: "İctimai" saytları qazanmaq
  3. Kiçik HTTP istəyi (curl): Kiçik pages üçün iş
  4. Böyük download: Oxunub: 30
  5. MTU testi: ping -M do -s 1472 uğurlu, ping -M do -s 1473 qarşı
  6. ICMP monitorinq: No "Fragmentation Needed" (Type 3 Kodu 4) mesaj alındı

Root Cause

VPN tüneli MTU-yu 1400-də azaldır, lakin firewall ICMP "Fragmentation Needed" mesajlarını blokladı. Yol MTU Discovery (PMTUD) işləyib, MTU qara deyil. Kiçik paketlər uyğun, DF bit set ilə böyük paketlər sıxdı.

Resolution

! Implemented TCP MSS clamping on router interface Tunnel0 ip tcp adjust-mss 1360 ! Alternative: Allow ICMP Type 3 Code 4 through firewall access-list 101 permit icmp any any packet-too-big

Lesson Learned

Ölçü mövzuları: Kiçik məsləhətlər işləyir, lakin böyük transferlər başarısız, MTU/fragmenta məsləhətləri. MTU sınaq yolu üçün DF bit ilə istifadə edin.

Case Study 4: VoIP Quality Issues (Actually: QoS Misconfiguration)

Symptom

Ses çağrıları doğranmış audio, intermittent dropouts idi. Yalnız iş saatları zamanı (9am-5pm).

Initial Assumptions (Wrong)

  • Xüsusi bant
  • VoIP server yüklədi
  • ISP bağlantısı keyfiyyət

Diagnostic Process

  1. Banden testi: İş saatı zamanı yalnız 40% istifadə olunur
  2. QoS konfransı: DSCP EF ilə qeyd olunan səyahət
  3. Qeydiyyat Voice sıra yalnız 5% bantlıq ayrılması idi (3% olmalıdır)
  4. Paket çıxış: Voice gest gest gest

Root Cause

QoS siyasəti mövcuddur, lakin bant ayrılması geri idi: ən yaxşı-effort 60%, səs 5% aldı. Data trafik artır zaman iş saatları vasitəsilə, səyahət paketləri qaldırılmışdır.

Resolution

! Corrected QoS policy policy-map WAN-QOS class VOICE priority percent 33 class VIDEO bandwidth percent 25 class CRITICAL-DATA bandwidth percent 20 class class-default bandwidth percent 22

Lesson Learned

Vaxt-based məlumatlar = gücü: Problemlər yalnız məhsul saatları çıxırsa, ağır bir çatışmazlığı deyil, lakin bir gücü / QoS problemi deyil. Check sıra statistika, yalnız ümumi bant.

Symptom

Qalereya Kataloq Daxil ol Bakı
No link işıq Kataloq 1 show interfaces
ethtool eth0
Status: aşağı, heç bir operator, kabel çıxış
Pulsuz Kataloq 1 show interfaces
show interfaces counters errors
CRC hataları, runts, devs, çatışmazlıqlar, gecikmiş çatışmazlıqlar
Qeydiyyat Kataloq arp -a
show mac address-table
show spanning-tree
No ARP giriş, MAC öyrənilmədi, STP blok
uzaq subnet çatdırmaq Kataloq traceroute
show ip route
show ip route summary
Missing, yanlış next-hop, routing loop
E-poçt Kataloq 4 telnet host port
netstat -an
tcpdump
Yadda saxla
Yavaş performans Kataloq ping (RTT)
iperf3
tcpdump
show interfaces
Yüksək latency, bantlı limit, TCP retransmissions, sıfır windows
Hostnameni qarşılamaq Kataloq 7 nslookup
dig
cat /etc/resolv.conf
DNS server məlumatsız, yanlış DNS config, NXDOMAIN
Intermittent damlaları Layer 1/2 ping -f (flood)
show logging
show interfaces
Avtomobil, qızıllıq kabel, STP rekonvergence
Ətraflı işlər, başqaları Daha çox Extended ping
Packet capture
Interface statistics
Yük balans xidməti, ECMP asimmetri, dövr masa üstü

Ətraflı

Satıcı TAC və ya üst mühəndislər qaldırmaq zaman bilir. ::

  • Siz məlumat bazarında bütün problemli addımları bitkinir
  • Qeyd etdiyiniz giriş/permissions
  • Problem satıcı proqram bug və ya hardware defekt daxildir
  • Biznes haqqında kritik və vaxt-səssiz
  • Bir çox komanda əməkdaşlıq lazımdır (application + ağ + server)
Escalating əvvəl: Siz sınaqladığınız haqqında məlumat. TAC mühəndislərin bu məlumatları sizin addımlarınızı cavablamaq üçün lazımdır. Include:
  • İnformasiya
  • Vaxt başladı
  • Müəlliflik hüquqları və onların çıxışları
  • Konfiqurasiya backups
  • Packet qazanmaq (gə müvafiq)
  • Siz artıq çalışdıq

Kişisel məlumat bazası

Hər problemli sessiyası bir öyrənmək imkanıdır. Xüsusi məlumat bazası yaradır:

1. Troubleshooting Jurnalı

# Example structure ~/troubleshooting-journal/ ├── 2026-01-15-duplex-mismatch.md ├── 2026-01-22-mtu-black-hole.md ├── 2026-02-02-tcp-window-exhaustion.md └── README.md # Index of all issues # Each file contains: # - Symptom # - Diagnostic steps # - Root cause # - Resolution # - Lessons learned # - Related tickets/documentation

2. Kompüter Cheat Sheet inşa

Problemləndirilməsi vasitəsində sürətli məlumatlar ilə çıxış edirik.

3. Sizin Network

  • Topologiya divarları (Layer 2 və Layer 3)
  • IP ünvanı məlumatları
  • Axtarış
  • Standart konfiqurasiyalar (templates)
  • Ətraflı üslublar (həm problemlərdən əvvəl statistika)

İctimai Anti-Patterns

❌ DON'T: diqqqoriyasız dəyişikliklər edin

Problemi anlamadan konfiqurasiyaların dəyişdirilməsi çox şeylər və ya maskaları real mövzu edir.

❌ DON'T: Ağacaq hər zaman səviyyədədir

Ən çox "network issues" proqram, server, və ya müştəri-sayt problemləridir. Təhlükəsizliyi qəbul etməyə məlumat verir.

❌ DON'T: Problemsizlik addımları

Siz əvvəl etdiyiniz testlərini reaksiya etmək olacaqsınız, və ya çalışdığınız yoldaşlara izah edə bilərsiniz.

❌ DON'T: Ignore intermittent

İntermittent problemləri çox əvvəl çatışmazlığı qeyd edir. Onlar ehtiyac olmaqdan əvvəl onları inkişaf edin.

❌ DON'T: Kök səbəblərinin əlavə simptomları

Bir cihaz rebooting xidmət dəstəkləyir, lakin nömrənin yeniləndirilməsini tapmaq istəyirsinizsə, problem recur.

Kateqoriya: Sistematik Problemləri

✓ Başlamadan əvvəl

  • Beş əsas sualları cavablayın (Ne dəyir? Kim dəstəyir? Yadda saxla Reproducible? Digər yan görə?)
  • Gather ilk simptomlar və istifadəçi hesabatları
  • Son dəyişikliklər və ya təhlükəsizlik üçün baxın

Qeydiyyat zamanı

  • OSI kağızı (aşağı və ya top-down) ilə iş üsulu
  • Test zamanı bir neçə növbəti dəyişdirin
  • Hər bir test və onun nəticəsi
  • Daxili trafik davranış görmək üçün paket tutmaq
  • müxtəlif üslublara qarşı

✓ Qaydadan sonra

  • fix the the the
  • Document Document Document Document
  • İnformasiya bazası
  • Konfiqurasiya dəyişikləyir
  • Consider: monitorinq bu əvvəl başa düşməyə bilər?

Conclusion

Ağ problemləri hər iki elm və sanatdır. Elm sistemli bir metodoloji aşağıdakıdır, diqqqoriyaları düzgün istifadə etmək və protokolları anlamaq. Sanat, ilk simptomlar tərəfindən işləyən testlər bilir, təcrübə nümunələrin tanınması və qaldırılması zamanı bilmək.

Bu məhsulda yerləşdirilmiş sistematik yanaşma aşağıdakılar - doğru suallar, OSI model vasitəsilə iş üsullub, addımları qazanmaq və hər hansı bir məhsuldan öyrənmək - Siz problemləşdirilməsi daha effektiv olacaq və boşa zaman və yanlış düzeltmelər qarşısına yol açan ümumi pisliklər qarşısını almaq.

Oxunub: məqsədi yalnız xidmət dəyişdirmək deyil, lakin N-i anlamaq ola bilər ki, onu bir daha çıxa bilərsiniz.


Son Güncelleme: Fevral 2, 2026 | Author: Baud9600 Texniki Komissiyası