System Buffer Tuning - TCP and Network Performance Optimization
Systém Buffer Tuning: skrytý Culprit za "Network problémy"
Shrnutí
Síťoví inženýři se často setkávají s situacemi, kdy je na síťovou infrastrukturu zaviněna navigace TCP nebo výkonnost aplikace. Po provedení rozsáhlých zachytávek paketů, tcpdrops, a síťová analýza, je pravda úzká strana často objevena: vyčerpaný NIC (Network Interface Card) nebo OS- level bufers na klientovi nebo serverové systémy.
Tento článek poskytuje jak dědičné (cca 2009), tak aktuální (2025-2026) konfigurace bufferů pro Linux, Windows a macos, spolu s diagnostickými technikami k identifikaci vyčerpání bufferu před tím, než se stane kritickým problémem.
Časté příznaky bufferu vyčerpání
- Události TCP Zero Window v zachytávání paketů
- Vysoká míra opětovného přenosu i přes nízkou latenci sítě
- Provedení aplikace výrazně pod dostupnou šířku pásma
- Degradace výkonu při zatížení, která se zlepšuje při poklesu zatížení
- Nekonzistentní výkon napříč podobnými konfiguracemi hardwaru
- Chyby v zásuvce nebo zprávy "zdroj dočasně nedostupný"
Pochopení problému
Mechanismus škálování oken TCP
TCP používá mechanismus řízení průtoku, kde přijímač inzeruje "velikost okna", což ukazuje, kolik dat může přijmout. Když se systémové buffery naplní, toto okno se scvrkne na nulu a nutí odesílatele čekat. To se jeví jako problém sítě, ale je to vlastně problém hostitelských zdrojů.
Kde Buffers hmota
- Nástrčné buffery (SO _ SNDBUF / SO _ RCVBUF): Per- socket send and receive bufers
- TCP okenní buffery: Maximální velikost okna TCP pro připojení
- Síťové buffery zařízení: Name
- System- wide Paměť: Celková paměť přidělená pro vytváření sítí
Diagnostické příkazy
Diagnostika Linux
# Check current TCP buffer settings sysctl net.ipv4.tcp_rmem sysctl net.ipv4.tcp_wmem sysctl net.core.rmem_max sysctl net.core.wmem_max # Check NIC ring buffer sizes ethtool -g eth0 # Monitor socket buffer usage ss -tm # Check for TCP zero window events tcpdump -i any 'tcp[tcpflags] & tcp-push != 0' -vv # Check network statistics for buffer issues netstat -s | grep -i "buffer\|queue\|drop"
Diagnostika Windows
# Check TCP parameters
netsh interface tcp show global
# View network adapter buffer settings
Get-NetAdapterAdvancedProperty -Name "Ethernet" | Where-Object {$_.DisplayName -like "*buffer*"}
# Monitor TCP statistics
netstat -s -p tcp
# Check receive window auto-tuning
netsh interface tcp show global | findstr "Receive Window"
makOS Diagnostics
# Check current buffer settings sysctl kern.ipc.maxsockbuf sysctl net.inet.tcp.sendspace sysctl net.inet.tcp.recvspace # View network statistics netstat -s -p tcp # Monitor socket buffers netstat -an -p tcp
Linux Buffer Tuning
Nastavení Legacy Linux (Circa 2009)
| Parametr | Hodnota odkazu (2009) | Popis |
|---|---|---|
| net.core.rmem _ default | 124928 (122KB) | Výchozí velikost bufferu |
| net.core.rmem _ max | 1071 (128KB) | Maximální velikost přijímacího tlumiče zásuvky |
| net.core.wmem _ default | 124928 (122KB) | Výchozí velikost bufferu send socket |
| net.core.wmem _ max | 131071 (128KB) | Maximální velikost pufru odeslané zásuvky |
| net.ipv4.tcp _ rmem | 4096 87380 174760 | TCP příjem buffer: min, výchozí, max (v bajtech) |
| net.ipv4.tcp _ wmem | 4096 16384 131072 | TCP send buffer: min, default, max (in bytes) |
| net.ipv4.tcp _ mem | 196608 262144 393216 | TCP paměťové stránky: nízká, tlak, vysoký |
| net.core.netdev _ max _ backlog | 1000 | Maximální pakety ve vstupní frontě |
| net.core.optmem _ max | 10240 (10KB) | Maximální velikost pomocného bufferu na zásuvku |
Aktuální nastavení Linuxu (2025-2026)
| Parameter | Současná doporučená hodnota | Description |
|---|---|---|
| net.core.rmem_default | 16777216 (16MB) | Default receive socket buffer size |
| net.core.rmem_max | 134217728 (128MB) | Maximum receive socket buffer size |
| net.core.wmem_default | 16777216 (16MB) | Default send socket buffer size |
| net.core.wmem_max | 134217728 (128MB) | Maximum send socket buffer size |
| net.ipv4.tcp_rmem | 4096 87380 134217728 | TCP příjem buffer: min, výchozí, max (128MB max) |
| net.ipv4.tcp_wmem | 4096 65536 134217728 | TCP send buffer: min, default, max (128MB max) |
| net.ipv4.tcp_mem | 8388608 12582912 16777216 | Paměťové stránky TCP: nízké, tlakové, vysoké (64GB systém) |
| net.core.netdev_max_backlog | 250000 | Maximální pakety ve vstupní frontě (10GbE +) |
| net.core.optmem_max | 65536 (64KB) | Maximum ancillary buffer size per socket |
| net.ipv4.tcp _ congestion _ control | bbr | Použít kontrolu přetížení BBR (algoritmus Google) |
| net.ipv4.tcp _ window _ scaling | 1 | Povolit škálování TCP oken (RFC 1323) |
| net.ipv4.tcp _ timestracks | 1 | Povolit časové razítka TCP pro lepší odhad RTT |
| net.ipv4.tcp _ sack | 1 | Povolit selektivní uznání |
| net.ipv4.tcp _ no _ metrics _ save | 1 | Zakázat caching TCP metrics |
Konfigurační aplikace Linux
Přidat tato nastavení do /etc/sysctl.conf nebo vytvořit nový soubor /etc/sysctl.d/99-network-tuning.conf:
# Network Buffer Tuning for High-Performance Applications # Optimized for 10GbE+ networks with RTT up to 300ms # Core socket buffer settings net.core.rmem_default = 16777216 net.core.rmem_max = 134217728 net.core.wmem_default = 16777216 net.core.wmem_max = 134217728 # TCP buffer settings net.ipv4.tcp_rmem = 4096 87380 134217728 net.ipv4.tcp_wmem = 4096 65536 134217728 net.ipv4.tcp_mem = 8388608 12582912 16777216 # Device buffer settings net.core.netdev_max_backlog = 250000 net.core.netdev_budget = 50000 net.core.netdev_budget_usecs = 5000 net.core.optmem_max = 65536 # TCP optimizations net.ipv4.tcp_congestion_control = bbr net.ipv4.tcp_window_scaling = 1 net.ipv4.tcp_timestamps = 1 net.ipv4.tcp_sack = 1 net.ipv4.tcp_no_metrics_save = 1 net.ipv4.tcp_moderate_rcvbuf = 1 # Apply with: sysctl -p /etc/sysctl.d/99-network-tuning.conf
NIC Ring Buffer Tuning
# Check current ring buffer sizes ethtool -g eth0 # Set maximum ring buffer sizes (adjust based on NIC capabilities) ethtool -G eth0 rx 4096 tx 4096 # Make persistent by adding to /etc/network/interfaces or systemd service
- Paměť Per- připojení: Každé spojení může využít až rmem _ max + wmem _ max (256MB s 128MB buffery)
- Celkový dopad systému: 1000 spojů × 256MB = 256GB potenciální využití
- Bezpečný odhad: Maximální souběžné připojení × 256MB by nemělo překročit 50% systému RAM
- Příklad: 64GB server by měl omezit max připojení na ~ 125 souběžných vysokopropustných spojení s 128MB buffery
- Doporučení pro servery s < 16GB RAM: Snížit pufry na max. 16-32MB a proporcionálně upravit tcp _ mem
Name
Nastavení Legacy Windows (Circa 2009 - Windows Vista / 7 / Server 2008)
| Parameter | Legacy Value (2009) | Umístění |
|---|---|---|
| TcpWindowSize | 65535 (64KB) | Registr: HKLM\ System\ CurrentControlSet\ Services\ Tcpip\ Parametry |
| Tcp1323Opts | 0 (invalidní) | Výchozí škálování oken je zakázáno |
| DefaultReceiveWindowName | 8192 (8KB) | Výchozí okno přijetí |
| DefaultSendWindowName | 8192 (8KB) | Výchozí odeslané okno |
| Globální MaxTcpWindowSize | 65535 (64KB) | Maximální velikost okna TCP |
| TcpNumConnections | 16777214 | Maximální spojení TCP |
Aktuální nastavení Windows (Windows 10 / 11 / Server 2019-2025)
Moderní Windows používá Přijímat automatické ladění okna funkce, která dynamicky nastavuje příjem nárazníků na základě síťových podmínek.
| Funkce | Současné doporučené nastavení | Description |
|---|---|---|
| Automatické ladění | normální (nebo vysoce experimentální pro 10GbE +) | Dynamické nastavení přijímacího okna |
| Receive- Boční měřítko (RSS) | povoleno | Distribuční síťové zpracování přes CPU |
| Přetížení komínů | automatické (nebo vyřazené na moderních NIC) | Vykládka TCP do NIC hardwaru |
| NetDMA | vypnuto | Přímý přístup k paměti (zaokrouhlený) |
| TCP globální parametry | Viz příkazy níže | Systém- wide TCP nastavení |
| Poskytovatel zácpy | CUBIC (nebo NewReno fall back) | algoritmus řízení přetížení TCP |
Příkazy konfigurace Windows
# Check current auto-tuning level netsh interface tcp show global # Enable auto-tuning (normal mode - default for most scenarios) netsh interface tcp set global autotuninglevel=normal # For high-bandwidth, high-latency networks (10GbE+, data center environments) netsh interface tcp set global autotuninglevel=experimental # For conservative tuning (if experimental causes issues) netsh interface tcp set global autotuninglevel=restricted # For very conservative tuning (not recommended for high-performance networks) netsh interface tcp set global autotuninglevel=highlyrestricted # Enable CUBIC congestion provider (Windows Server 2022/Windows 11+ only) netsh interface tcp set supplemental template=Internet congestionprovider=cubic # Note: Windows 10 and Server 2019 use Compound TCP or NewReno by default # CUBIC is not available on these older versions # Enable Receive-Side Scaling (RSS) netsh interface tcp set global rss=enabled # Set chimney offload (automatic is recommended) netsh interface tcp set global chimney=automatic # Disable NetDMA (recommended for modern systems) netsh interface tcp set global netdma=disabled # Enable Direct Cache Access (if supported) netsh interface tcp set global dca=enabled # Enable ECN (Explicit Congestion Notification) netsh interface tcp set global ecncapability=enabled # Set initial congestion window to 10 (RFC 6928) netsh interface tcp set global initialRto=3000
Advanced NIC Buffer Settings (přes Manager zařízení nebo PowerShell)
# View current adapter settings Get-NetAdapterAdvancedProperty -Name "Ethernet" # Increase receive buffers (adjust based on NIC) Set-NetAdapterAdvancedProperty -Name "Ethernet" -DisplayName "Receive Buffers" -DisplayValue 2048 # Increase transmit buffers Set-NetAdapterAdvancedProperty -Name "Ethernet" -DisplayName "Transmit Buffers" -DisplayValue 2048 # Enable Jumbo Frames (if network supports it) Set-NetAdapterAdvancedProperty -Name "Ethernet" -DisplayName "Jumbo Packet" -DisplayValue 9014 # Enable Large Send Offload (LSO) Set-NetAdapterAdvancedProperty -Name "Ethernet" -DisplayName "Large Send Offload V2 (IPv4)" -DisplayValue Enabled Set-NetAdapterAdvancedProperty -Name "Ethernet" -DisplayName "Large Send Offload V2 (IPv6)" -DisplayValue Enabled
Příručky registru (Advanced - Použití s opatrností)
# These settings are typically NOT needed on Windows 10/11 due to auto-tuning # Only modify if auto-tuning is disabled or problematic # Registry path: HKLM\System\CurrentControlSet\Services\Tcpip\Parameters # Maximum TCP window size (if auto-tuning disabled) # TcpWindowSize = 16777216 (16MB) - REG_DWORD # Enable window scaling (enabled by default on modern Windows) # Tcp1323Opts = 3 - REG_DWORD # Number of TCP Timed Wait Delay # TcpTimedWaitDelay = 30 - REG_DWORD (default 240)
makOS Buffer Tuning
Nastavení Legacy macos (Circa 2009 - Mac OS X 10.5 / 10.6)
| Parameter | Legacy Value (2009) | Description |
|---|---|---|
| Kern.ip.maxsockbuf | 262144 (256KB) | Maximální velikost zásuvky |
| net.inet.tcp.sendspace | 32768 (32KB) | Výchozí TCP send buffer |
| net.inet.tcp.recvspace | 32768 (32KB) | Výchozí TCP příjem bufferu |
| net.inet.tcp.autoricvbufmax | 1072 (128KB) | Maximální automaticky vyladěný buffer |
| net.inet.tcp.autosndbufmax | 131072 (128KB) | Maximum automatického odesílání bufferu |
| net.inet.tcp.rfc1323 | 0 (disabled) | Skalování TCP oken |
Aktuální nastavení macosu (MACOS 12-15 Monterey přes Sequoia)
| Parameter | Current Recommended Value | Description |
|---|---|---|
| kern.ipc.maxsockbuf | 8388608 (8MB) | Maximum socket buffer size |
| net.inet.tcp.sendspace | 131072 (128KB) | Default TCP send buffer |
| net.inet.tcp.recvspace | 131072 (128KB) | Default TCP receive buffer |
| net.inet.tcp.autorcvbufmax | 16777216 (16MB) | Maximum auto-tuned receive buffer |
| net.inet.tcp.autosndbufmax | 16777216 (16MB) | Maximum auto-tuned send buffer |
| net.inet.tcp.rfc1323 | 1 (povoleno) | Povolit skenování TCP okna |
| net.inet.tcp.sack | 1 (enabled) | Enable Selective Acknowledgment |
| net.inet.tcp.mssdflt | 1440 | Výchozí maximální velikost segmentu TCP |
| net.inet.tcp.delayed _ ack | 3 | Zpožděné chování ACK |
makOS Konfigurační aplikace
# Check current settings sysctl kern.ipc.maxsockbuf sysctl net.inet.tcp.sendspace sysctl net.inet.tcp.recvspace sysctl net.inet.tcp.autorcvbufmax sysctl net.inet.tcp.autosndbufmax # Apply settings temporarily (until reboot) sudo sysctl -w kern.ipc.maxsockbuf=8388608 sudo sysctl -w net.inet.tcp.sendspace=131072 sudo sysctl -w net.inet.tcp.recvspace=131072 sudo sysctl -w net.inet.tcp.autorcvbufmax=16777216 sudo sysctl -w net.inet.tcp.autosndbufmax=16777216 sudo sysctl -w net.inet.tcp.rfc1323=1 sudo sysctl -w net.inet.tcp.sack=1 # Make settings persistent (create /etc/sysctl.conf) sudo tee /etc/sysctl.conf <Vytvoření LaunchDaemon pro perzistentní nastavení
# Create /Library/LaunchDaemons/com.local.sysctl.plist sudo tee /Library/LaunchDaemons/com.local.sysctl.plist <EOF sudo chmod 644 /Library/LaunchDaemons/com.local.sysctl.plist sudo launchctl load /Library/LaunchDaemons/com.local.sysctl.plist Label com.local.sysctl ProgramArguments /usr/sbin/sysctl -w kern.ipc.maxsockbuf=8388608 RunAtLoad Varování: macOS Ventura (13) a později mají omezení ochrany integrity systému (SIP). Některé parametry jádra nemusí být možné měnit ani se sudem. Nastavení testu ve vašem specifickém prostředí.
Zkouška výkonnosti a validace
Nástroje pro testování výkonu bufferu
iperf3 - testování výkonnosti sítě
# Server side iperf3 -s # Client side - test TCP throughput iperf3 -c server_ip -t 60 -i 5 -w 16M # Test with multiple parallel streams iperf3 -c server_ip -P 10 -t 60 # Test UDP performance iperf3 -c server_ip -u -b 1000M -t 60
tcpdump - Zachyťte velikost TCP okna
# Capture and display TCP window sizes tcpdump -i any -n 'tcp' -vv | grep -i window # Save capture for Wireshark analysis tcpdump -i any -w /tmp/capture.pcap 'tcp port 443'
Wirežralok Analysis
Podívejte se na tyto ukazatele problematiky kapitálové rezervy:
- Zprávy TCP Zero Window
- Pakety pro aktualizaci okna TCP
- Úplná oznámení TCP Window
- Vysoké přenosové rychlosti s nízkou RTT
Monitorování systému
# Linux - Monitor network buffer statistics watch -n 1 'cat /proc/net/sockstat' watch -n 1 'ss -tm | grep -i mem' # Check for drops netstat -s | grep -i drop # Windows - Monitor TCP statistics netstat -e 1 # macOS - Monitor network statistics netstat -s -p tcp
Výpočet výrobku Bandwidth- Delay (BDP)
Pro určení optimálních velikostí bufferů pro vaši síť spočítejte produkt Bandwidth- Delay:
BDP = Bandwidth (bits/sec) × RTT (seconds) Example for 10 Gigabit Ethernet with 50ms RTT: BDP = 10,000,000,000 × 0.050 = 500,000,000 bits = 62.5 MB Buffer Size = BDP × 2 (for bidirectional traffic and headroom) Buffer Size = 62.5 MB × 2 = 125 MB This is why modern settings recommend 128MB maximum buffers.
Pracovní zátěž - specifická doporučení
| Typ pracovního zatížení | Doporučená velikost bufferu | Klíčové parametry |
|---|---|---|
| Web Server (Nízká latence) | 4-16 MB | Dolní nárazníky, více připojení, rychlá odezva |
| Database Server | 16-32 MB | Středně velké nárazníky, konzistentní propustnost |
| Přenos souborů / zálohování | 64- 128 MB | Maximální nárazníky, nejvyšší priorita propustnosti |
| Video streaming | 32- 64 MB | Velké rezervy, konzistentní míra dodání |
| HPC / datové centrum | 128- 256 MB | Maximální nárazníky, specializovaná kontrola přetížení |
| Bezdrátové / mobilní | 2-8 MB | Konzervativní nárazníky, s proměnlivou latencí |
Společné chyby a pády
Chyby, kterým se má vyhnout
- Přepufrování: Extrémně velké nárazníky mohou způsobit bufferbloat, zvýšení latence
- Ignorující paměťová omezení: Velké buffery násobí počtem připojení; server s 10.000 spoji a 128MB buffery potřebují 1.25TB RAM
- Vypnutí automatického ladění bez důvodu: Moderní OS autoladění je obvykle lepší než statická nastavení
- Netestování po změnách: Vždy validovat zlepšení výkonu s reálným pracovním zatížením
- Zapomenout NIC nárazníky: Vyčerpání prstencového pufru může nastat nezávisle na zásuvkových pufrech
- Nekonzistentní nastavení: Klient a server by měli mít kompatibilní konfigurace bufferu
- Ignorování kontroly přetížení: BBR a CUBIC jsou podstatně lepší než starší algoritmy
Řešení problémů
- Stanovení výchozí hodnoty: Měření aktuálního výkonu pomocí iperf3 nebo podobných nástrojů
- Zachytávací pakety: Použijte tcpdump / Wireshark k identifikaci chování TCP okna
- Kontrola systémové statistiky: Hledejte kapky, vyčerpání pufru, přenosy.
- Vypočítejte BDP: Určete teoreticky optimální velikost bufferu
- Aplikujte přírůstkové změny: Neměň všechno najednou.
- Zkouška a ověření: Měřit skutečné zlepšení výkonnosti
- Monitor v průběhu času: Zajistit optimální nastavení při různém zatížení
Odkazy a další čtení
- RFC 1323 - Rozšíření TCP pro vysoký výkon (škálování oken)
- RFC 2018 - TCP Selective Recommendation Options
- RFC 6928 - Zvyšování počátečního okna TCP
- RFC 8312 - algoritmus CUBIC Congestion Control
- Společnost BBR Congestion Control (Google) - https: / / research. google / pubs / pub45646 /
- Linux Kernel Documentation - networking / ip-sysctl.txt
- Name
- Viz poznámka pod čarou1.
Závěr
Vyčerpání bufferu je běžnou příčinou problémů s výkonem, které se zdají být spojené s networkem. Díky pochopení vývoje bufferu o velikosti od 128KB v roce 2009 do dnešních 128MB schopností mohou síťoví inženýři tyto problémy rychle identifikovat a vyřešit.
Klíče:
- Moderní systémy potřebují podstatně větší nárazníky než historické (2009) konfigurace
- Vždy počítejte BDP pro specifické síťové podmínky
- Používejte funkce automatického ladění OS, pokud jsou k dispozici (Windows, moderní Linux)
- Monitor a test pro ověření změn
- Zvažte specifické požadavky na pracovní zatížení při dolaďování
Pamatujte: "síťový problém" odhalený analýzou paketů zobrazující okna TCP nula je vlastně problém zdroje hostitelského systému. Se správným nastavením bufferu můžete tyto falešné diagnózy eliminovat a dosáhnout optimálního výkonu.
Aktualizováno: 2. února 2026
Autor: Baud9600 Technický tým