Problém:
Riešenie:
Náklady na riešenie problémov v prípade hapnie:
Riešenie problémov siete je v podstate cvičenie vo vedeckej metóde:
Tento článok poskytuje štruktúrovaný rámec pre riešenie sieťových problémov, ktorý zabraňuje spoločným nástrahám, ako sú:
Pred ponorením do technickej diagnostiky odpovedzte na týchto päť kritických otázok, aby ste zúžili váš výskumný rozsah:
Model OSI poskytuje štruktúrovaný rámec na riešenie problémov. Práca z vrstvy 1 (Fyzikálne) nahor, alebo z vrstvy 7 (Aplikácia) nadol, v závislosti od príznakov.
Kedy používať:
Kedy používať:
Spustiť na vrstve 7 (Je služba SharePoint bežiaca? DNS riešenie opraviť IP?) a pracovať dole len v prípade potreby.
Použite tento rýchly diagnostický strom identifikovať, ktorá vrstva zlyháva:
Keď máte hypotézu o príčine, použite tieto izolačné techniky na potvrdenie alebo odmietnutie:
Zachyťte prevádzku pri zdroji, medziľahlých miestach a mieste určenia, aby ste zistili, kde sa pakety spúšťajú alebo upravujú:
# Capture on client
tcpdump -i eth0 -w client.pcap host server.example.com
# Capture on server
tcpdump -i eth0 -w server.pcap host client.example.com
# Compare:
# - Do packets leave client? (check client.pcap)
# - Do packets arrive at server? (check server.pcap)
# - If yes/no: problem is in the path between
# - If yes/yes but server doesn't respond: server-side issue
Odstránenie externých premenných testovaním konektivity v rámci jedného zariadenia:
# Test TCP stack without network
ping 127.0.0.1
# Test application listening locally
telnet localhost 80
# Test loopback on network interface (if supported)
# Some NICs support physical loopback for Layer 1 testing
Porovnanie konfigurácie a správania s pracovným systémom:
# Compare interface settings
diff <(ssh working-switch "show run int gi1/0/1") \
<(ssh broken-switch "show run int gi1/0/1")
# Compare routing tables
diff <(ssh router1 "show ip route") \
<(ssh router2 "show ip route")
Správna dokumentácia zabraňuje kruhovému ladeniu, kde skúsite to isté viackrát bez toho, aby ste si to uvedomili.
Issue ID: TICKET-12345
Date/Time: 2026-02-02 14:30 UTC
Reported By: Jane Smith (jane.smith@company.com)
Affected Users: ~50 users in Building A, 3rd floor
Symptom: Cannot access file server \\fileserver01
Initial Observations:
- Issue started around 14:00 UTC
- Only affects Building A, 3rd floor
- Other buildings can access fileserver01
- Ping to fileserver01 (10.1.50.10) times out from affected users
- Ping to default gateway (10.1.30.1) succeeds
Tests Performed:
1. [14:35] Checked switch port status: gi1/0/15 is UP/UP
2. [14:38] Checked VLAN assignment: Port is in VLAN 30 (correct)
3. [14:42] Checked interface errors: 1,234 CRC errors on gi1/0/15
4. [14:45] Replaced patch cable - still seeing CRC errors
5. [14:50] Moved uplink to different port (gi1/0/16) - errors persist
6. [14:55] Checked fiber cleanliness - dirty connector found
Root Cause:
Dirty fiber connector on uplink between Building A floor switch
and distribution switch causing CRC errors and packet loss
Resolution:
Cleaned fiber connector with proper cleaning kit. CRC errors
dropped to zero. File server access restored.
Verification:
Users confirmed file server accessible. Monitored for 15 minutes
with no errors.
Time to Resolution: 25 minutes
Časy odozvy aplikácie databázy sa zmenšili z <100 ms na 5+ sekúnd. Aplikačný tím obvinil "sieťovú latenciu."
Databázový server OS nárazníky boli príliš malé pre vysokopásmový šírka × oneskorený produkt. Okno TCP by naplnilo, nútilo odosielateľa čakať.
# Increased TCP receive buffers on Linux database server
sysctl -w net.ipv4.tcp_rmem="4096 87380 16777216"
sysctl -w net.core.rmem_max=16777216
Nepredpokladajte:
Pripojenie k serveru by kleslo náhodne, najmä pri zaťažení. Niekedy to fungovalo dobre, niekedy úplne nereagovalo.
Auto-rokovanie zlyhalo. Server vyjednal full-duplex, prepínač padol späť do polovice-duplex. K zrážkam došlo len pri zaťažení, keď sa obe strany snažili prenášať súčasne.
! Cisco switch - force full duplex
interface GigabitEthernet1/0/10
speed 1000
duplex full
Kontrola oboch koncov:
Užívatelia by mohli prechádzať niektoré webové stránky (Google, Yahoo), ale nie iné (bankové webové stránky, firemný portál). Malé HTTP požiadavky fungovali, veľké stránky vypršali.
ping -M do -s 1472ping -M do -s 1473VPN tunel znížil MTU na 1400, ale firewall blokoval ICMP "Fragmentácia Potrebné" správy. Cesta MTU Discovery (PMTUD) nemohol fungovať, čím sa vytvorila čierna diera MTU. Malé balíčky fit, veľké balíčky s DF bitovou sadou boli ticho stiahnuté.
! Implemented TCP MSS clamping on router
interface Tunnel0
ip tcp adjust-mss 1360
! Alternative: Allow ICMP Type 3 Code 4 through firewall
access-list 101 permit icmp any any packet-too-big
Záleží na veľkosti:
Hlasové hovory mali horúci zvuk, občasné výpadky. K tomu došlo len počas pracovných hodín (9 hodín - 5 hodín).
Politika QoS existovala, ale prideľovanie šírky pásma bolo naopak: najlepšie úsilie dostalo 60%, hlas dostal 5%. Počas pracovných hodín, keď sa prenos dát zvýšil, boli hlasové pakety znížené kvôli pretoku fronty.
! Corrected QoS policy
policy-map WAN-QOS
class VOICE
priority percent 33
class VIDEO
bandwidth percent 25
class CRITICAL-DATA
bandwidth percent 20
class class-default
bandwidth percent 22
Časové problémy = kapacita:
| Symptómy | Vrstva | Príkazy na spustenie | Čo hľadať |
|---|---|---|---|
| Žiadne prepojenie svetla | Vrstva 1 | show interfaces |
Stav: dole, žiadny nosič, kábel odpojený |
| Strata paketu | Vrstva 1/2 | show interfaces |
CRC chyby, runy, obri, zrážky, neskoré zrážky |
| Can't ping gate | Vrstva 2 | arp -a |
Žiadna položka ARP, MAC sa nepoučil, STP blokovanie |
| Nedočiahnem na diaľkový subnet | Vrstva 3 | traceroute |
Chýbajúca trasa, zlý ďalší obchod, smerová slučka |
| Spojenie odmietnuté | Vrstva 4 | telnet host port |
Služba nepočúva, firewall blok, TCP RST |
| Pomalý výkon | Vrstva 4+ | ping (RTT) |
Vysoká latencia, limit šírky pásma, retransmisie TCP, nulové okná |
| Nemôžem vyriešiť meno hostiteľa | Vrstva 7 | nslookup |
DNS server nedosiahnuteľný, zlé DNS konfigurácia, NXDOMAIN |
| Prerušované kvapky | Layer 1/2 | ping -f (flood) |
Duplex nesúlad, zlyháva kábel, STP reverzia |
| Niekedy to funguje, nie iné | Viacnásobné | Extended ping |
Emisie vyrovnávania zaťaženia, asymetria ECMP, pretečenie v tabuľke |
Vedieť, kedy eskalovať na predajcu TAC alebo senior inžinieri. Eskalovať, keď:
Každé stretnutie na riešenie problémov je príležitosťou na učenie. Vybudovať osobnú znalostnú základňu:
# Example structure
~/troubleshooting-journal/
├── 2026-01-15-duplex-mismatch.md
├── 2026-01-22-mtu-black-hole.md
├── 2026-02-02-tcp-window-exhaustion.md
└── README.md # Index of all issues
# Each file contains:
# - Symptom
# - Diagnostic steps
# - Root cause
# - Resolution
# - Lessons learned
# - Related tickets/documentation
Organizovať často používané príkazy podľa scenára pre rýchlu referenciu pri riešení problémov.
Zmena konfigurácie bez pochopenia problému často veci zhoršuje alebo maskuje skutočný problém.
Často "sieťové problémy" sú problémy aplikácie, servera alebo klienta. Zhromaždite dôkazy, než prijmete vinu.
Budeš strácať čas opakovaním testov, ktoré si už urobil, alebo nebudeš schopný vysvetliť kolegom, čo si skúšal.
Prerušované problémy sú často včasnými varovnými príznakmi blížiaceho sa zlyhania. Vyšetrujte ich skôr, ako sa stanú kritickými.
Reštartovanie zariadenia môže obnoviť službu, ale ak nezistíte, prečo bolo potrebné reštartovať, problém sa zopakuje.
Riešenie problémov siete je veda aj umenie. Veda sa riadi systematickou metodikou, pomocou diagnostických nástrojov správne, a pochopenie protokolov. Umenie je vedieť, ktoré testy spustiť ako prvý na základe príznakov, rozoznáva vzory zo skúseností, a vedieť, kedy eskalovať.
Nasledovaním systematického prístupu načrtnutého v tomto článku sa pýta na správne otázky, pracovné metodicky prostredníctvom modelu OSI, dokumentovanie svoje kroky, a učenie sa z každého problému sa stane efektívnejšie pri riešení problémov a vyhnúť sa spoločné nástrahy, ktoré vedú k plytvanie časom a nesprávne opravy.
Pamätajte:
Posledná úprava: Február 2, 2026