المشكلة: تطبيق قاعدة البيانات هو "سلو". فريق الشبكة يلوم فريق الخادم فريق الخادم يلوم الشبكة وفي غضون ذلك، يشعر المستخدمون بالإحباط، وتهدر الساعات في التحلل الدائري.
الحل: A systematic, scientific approach to troubleshooting that uses evidence, not assumptions, to identify root causes.
The Cost of Haphazard Troubleshooting: الوقت الضائع، تصحيح غير صحيح أن القناع المشاكل الحقيقية، تحديد الأصابع بين الفرق، وتجربة المستعمل المتدهورة.
إن التشويش على الشبكات هو أساساً ممارسة في الطريقة العلمية:
وتوفر هذه المادة إطاراً منظماً للكشف عن اضطرابات الشبكات التي تحول دون حدوث عقبات مشتركة مثل:
قبل التخلّص من التشخيصات التقنية، أجيبوا على هذه الأسئلة الحاسمة الخمسة لتضييق نطاق تحقيقاتكم:
تغيرات الإتحاد؟ معدات جديدة؟ تحديثات البرمجيات؟ تعديلات في علم الطبول؟
مستعمل واحد؟ مبنى واحد؟ الجميع؟ تطبيق محدد فقط؟
يحدث دائما؟ فقط خلال ساعات معينة؟ حوادث عشوائية؟
هل يمكن أن تشعل المشكلة على الطلب؟
تحقق من كل من نهاية الاتصال
ويوفر نموذج التفتيش الموقعي إطاراً منظماً لحل المشاكل. العمل من لاير 1 (الفيزياء) إلى الأعلى، أو من لاير 7 (التطبيق) إلى الأسفل، حسب الأعراض.
عند استخدام: فقدان التوصيل الكامل، لا ضوء للوصل، أو أعراض طبقات مادية
show interfaces.. ethtool eth0show mac address-table.. show spanning-treeping.. traceroute.. show ip routetelnet host port.. netstat -anحزمةnslookup.. dig.. curl -vعند استخدام: المشاكل الخاصة بالتطبيقات حيثما توجد وسائل الاتصال الأساسية
ابدأي في (لايير 7) حلّت إدارة الأمن الوطني لتصحيح IP؟) ولم تعمل إلا إذا لزم الأمر.
استخدام هذه الشجرة التشخيصية السريعة لتحديد أي طبقة تفشل:
TCP/IP stack not functioning. تحقق من خدمات الـ (إس) و إعادة تركيب محركات الشبكة
مُعَوَّل، سائق خاطئ، كابل غير مُسجَّل. تحقق: ip link show أو مدير جهاز
شيك: السلك الفيزيائي، تحويل مركز الميناء، انتداب شبكة VLAN، طاولة البحث والتطوير
دق طاولة، قواعد الجدار الناري الاستخدام traceroute العثور على مكان توقف الحزم
التحقق: أماكن الخواديم التابعة لدائرة الأمن الوطني، وتوافر خواديم إدارة الأمن الوطني، ووقف الجدار الناري
التحقق: قواعد الجدار الناري، مجموعات الأمن، خدمة الاستماع إلى الميناء
وتتمثل المشكلة في الطلب نفسه، أو التوثيق، أو تشكيلة التطبيق
عندما يكون لديك فرضية حول السبب الجذري، استخدام هذه تقنيات العزلة لتأكيد أو رفضه:
حركة المرور في المصدر، النقاط الوسيطة، والمقصد للتعرف على المكان الذي تسقط فيه أو تعدل فيه العبوات:
# Capture on client
tcpdump -i eth0 -w client.pcap host server.example.com
# Capture on server
tcpdump -i eth0 -w server.pcap host client.example.com
# Compare:
# - Do packets leave client? (check client.pcap)
# - Do packets arrive at server? (check server.pcap)
# - If yes/no: problem is in the path between
# - If yes/yes but server doesn't respond: server-side issue
القضاء على المتغيرات الخارجية عن طريق اختبار الربط داخل جهاز واحد:
# Test TCP stack without network
ping 127.0.0.1
# Test application listening locally
telnet localhost 80
# Test loopback on network interface (if supported)
# Some NICs support physical loopback for Layer 1 testing
Compare formation and behavior against a working system:
# Compare interface settings
diff <(ssh working-switch "show run int gi1/0/1") \
<(ssh broken-switch "show run int gi1/0/1")
# Compare routing tables
diff <(ssh router1 "show ip route") \
<(ssh router2 "show ip route")
الوثائق الحسنة تمنع التعميم من التزييف حيث تحاول نفس الشيء عدة مرات دون أن تدرك ذلك
Issue ID: TICKET-12345
Date/Time: 2026-02-02 14:30 UTC
Reported By: Jane Smith (jane.smith@company.com)
Affected Users: ~50 users in Building A, 3rd floor
Symptom: Cannot access file server \\fileserver01
Initial Observations:
- Issue started around 14:00 UTC
- Only affects Building A, 3rd floor
- Other buildings can access fileserver01
- Ping to fileserver01 (10.1.50.10) times out from affected users
- Ping to default gateway (10.1.30.1) succeeds
Tests Performed:
1. [14:35] Checked switch port status: gi1/0/15 is UP/UP
2. [14:38] Checked VLAN assignment: Port is in VLAN 30 (correct)
3. [14:42] Checked interface errors: 1,234 CRC errors on gi1/0/15
4. [14:45] Replaced patch cable - still seeing CRC errors
5. [14:50] Moved uplink to different port (gi1/0/16) - errors persist
6. [14:55] Checked fiber cleanliness - dirty connector found
Root Cause:
Dirty fiber connector on uplink between Building A floor switch
and distribution switch causing CRC errors and packet loss
Resolution:
Cleaned fiber connector with proper cleaning kit. CRC errors
dropped to zero. File server access restored.
Verification:
Users confirmed file server accessible. Monitored for 15 minutes
with no errors.
Time to Resolution: 25 minutes
وتضاءلت أوقات الاستجابة لتطبيق قاعدة البيانات من 100 متر إلى 5 ثوان. فريق الطلب كان يلوم "ملاءة الشبكة"
وكانت حاجزات قاعات قاعدة البيانات (SOS) صغيرة للغاية بالنسبة لمنتجات التأخير ذات النطاق الترددي العالي (X). نافذة (تي سي) ستملأها وتجبر المرسل على الانتظار
# Increased TCP receive buffers on Linux database server
sysctl -w net.ipv4.tcp_rmem="4096 87380 16777216"
sysctl -w net.core.rmem_max=16777216
لا تفترض: "سلو" لا يعني دائماً "خطوبة العمل" جمع الأدلة دائماً قبل القفز إلى الاستنتاجات
الإتصال بالسيرفر سينخفض عشوائياً خاصة تحت الحمولة في بعض الأحيان عمل جيد، وأحيانا غير مستجيب تماما.
وفشل التفاوض على السيارات. (سيرفر) تفاوض على الإلتفاف، تحول إلى نصف دوبلكس. وحدثت الاصابات تحت الحمولة فقط عندما حاول الجانبان نقلها في وقت واحد.
! Cisco switch - force full duplex
interface GigabitEthernet1/0/10
speed 1000
duplex full
تحقق من كلا النهاية ويتبين من المركز المشترك بين الوجوه الظروف المتفاوض عليها. عدم المطابقة يعني فشل التفاوض دائماً ما تكون سرعة الشفرة الصلبة للخواديم
ويمكن للمستعملين أن يصفوا بعض المواقع الشبكية (غوغل، ياهو) ولكن ليس مواقع أخرى (موقع مصرفي، بوابة شركات). ونجحت الطلبات الصغيرة المقدمة من شركة HTTP، ووقت صفحات كبيرة.
ping -M do -s 1472 تنجح ping -M do -s 1473 الفشلنفق شبكة (في سي) تقلص من وحدة مكافحة الإرهاب إلى 1400، لكن الجدار الناري كان يحجب رسائل ICMP "Fragmentation Needed" لم يستطع جهاز كشف الحركة إيجاد ثقب أسود حزمة صغيرة، وحزمة كبيرة مع DF قليلا تم قذفها صامتة.
! Implemented TCP MSS clamping on router
interface Tunnel0
ip tcp adjust-mss 1360
! Alternative: Allow ICMP Type 3 Code 4 through firewall
access-list 101 permit icmp any any packet-too-big
مسائل الحجم: وفي حالة إخفاق الطلبات الصغيرة ولكن عمليات النقل الكبيرة، يشتبه في وجود قضايا تتعلق بالوحدة/النقل. استعملي التجسس مع (دي.دي) لتختبري طريق (إم.تي)
المكالمات الصوتية كانت مقطعة صوتية و متقطعة Only occurred during business hours (9am-5pm).
سياسة (كيو إس) موجودة لكن توزيع الترددات كان عكسياً: أفضل منفور حصلت على 60 في المائة وخلال ساعات العمل التي زادت فيها حركة المرور بالبيانات، أسقطت عبوات الصوت نتيجة لتدفقها المفرط.
! Corrected QoS policy
policy-map WAN-QOS
class VOICE
priority percent 33
class VIDEO
bandwidth percent 25
class CRITICAL-DATA
bandwidth percent 20
class class-default
bandwidth percent 22
المسائل القائمة على الوقت = القدرة: إذا كانت المشاكل تحدث فقط خلال ساعات العمل، فإنه ليس فشلاً صعباً ولكن مشكلة القدرة/الكهرباء. إحصائيات الشوكة، ليس فقط الضمادات.
| الرمز | Layer | أوامر للهرب | ماذا تبحث عن |
|---|---|---|---|
| لا يوجد ضوء | Layer 1 | show interfaces |
الحالة: أسفل، لا ناقلات، كابل غير مزروع |
| خسارة الحزمة | 1/2 | show interfaces |
أخطاء لجنة حقوق الطفل، الجرعات، العملاق، التصادم، الاصطدامات المتأخرة |
| لا أستطيع الدخول | Layer 2 | arp -a |
No ARP entry, MAC not learned, STP blocking |
| لا أستطيع الوصول إلى شبكة الأنترنت البعيدة | Layer 3 | traceroute |
الطريق المفقود، الخطأ التالي |
| رفض | Layer 4 | telnet host port |
دائرة لا تستمع، حاوية الحماية، TCP RST |
| بطء الأداء | Layer 4+ | ping (RTT) |
درجة عالية من الرطوبة، الحد الأقصى للزوارق، إعادة إرسال TCP، صفر من النوافذ |
| لا يمكن حل اسم المضيف | Layer 7 | nslookup |
DNS server unreachable, wrong DNS config, NXDOMAIN |
| هبوط متقطع | Layer 1/2 | ping -f (flood) |
داء دوبليكس غير المطابقة، وفشل الكابلات، |
| يعمل في بعض الأحيان، لا غيره | متعددة | Extended ping |
Load balancing issue, ECMP asymmetry, state table overflow |
معرفة متى تتصاعد إلى البائع TAC أو كبار المهندسين. Escalate when:
فكل جلسة لرد المشاكل هي فرصة للتعلم. بناء قاعدة معارف شخصية:
# Example structure
~/troubleshooting-journal/
├── 2026-01-15-duplex-mismatch.md
├── 2026-01-22-mtu-black-hole.md
├── 2026-02-02-tcp-window-exhaustion.md
└── README.md # Index of all issues
# Each file contains:
# - Symptom
# - Diagnostic steps
# - Root cause
# - Resolution
# - Lessons learned
# - Related tickets/documentation
تنظيم أوامر مستعملة في كثير من الأحيان من خلال سيناريو مرجعي سريع أثناء عملية فرز المشاكل.
فتغيير التشكيلات دون فهم المشكلة كثيرا ما يزيد الأمور سوءا أو يخفي المسألة الحقيقية.
في كثير من الأحيان "مسائل الشبكة" هي التطبيق، الخادم، أو مشاكل جانب العملاء. جمع الأدلة قبل قبول اللوم
سوف تضيع وقتك في تكرار الإختبارات التي قمت بها بالفعل أو لا تستطيع أن تشرح للزملاء ما حاولت
وكثيراً ما تكون المشاكل المتقطعة علامات إنذار مبكر على الفشل الوشيك. التحقيق معهم قبل أن يصبحوا حاسمين
إعادة تشغيل جهاز قد يعيد الخدمة، ولكن إذا كنت لا تعرف لماذا تحتاج إلى إعادة التشغيل، المشكلة سوف تتكرر.
مشكلة الشبكة هي العلم والفن The science is following a systematic methodology, using diagnostic tools correctly, and understanding protocols. الفن هو معرفة أي اختبارات تجري أولاً استناداً إلى الأعراض، والاعتراف بأنماط الخبرة، ومعرفة متى تتصاعد.
ومن خلال اتباع النهج المنهجي المبي َّن في هذه المادة في طرح الأسئلة الصحيحة، والعمل بطريقة منهجية من خلال نموذج التفتيش الموقعي، وتوثيق خطواتكم، والتعلم من كل مسألة - سوف تصبحون أكثر كفاءة في حل المشاكل وتفادي العثرات المشتركة التي تؤدي إلى إهدار الوقت والتجهيزات غير الصحيحة.
تذكر: الهدف ليس فقط إعادة الخدمة، ولكن لفهم لماذا فشل حتى تتمكن من منع حدوث ذلك مرة أخرى.
آخر تحديث: 2 شباط/فبراير 2026 | Author: Baud9600 Technical Team