要根据业务类型估算资源:CPU优先考虑单核性能与并发线程数,内存按应用与缓存需求留有余量,磁盘优先选择SSD/NVMe与高IOPS方案。静态站点和缓存多可选较小CPU+大带宽;动态应用(数据库、PHP、Node)需更多CPU与内存。
1) 并发QPS与响应时间;2) I/O密集型是否需要本地NVMe或云盘IO优化;3) 是否启用RAID或快照备份策略。
上生产前做压力测试,观察CPU、内存、磁盘IO的飙升点,按1.5—2倍峰值预留资源。
小流量站点:2核/4GB/50GB NVMe;中等流量:4核/8–16GB/100GB NVMe;高并发:8核以上+大内存+独立数据盘。
先确认运营商链路类型,若使用 CN2 线路,通常延迟与丢包较低,但带宽计费模式(包月不限、按流量、95峰值)会直接影响成本。评估时测算业务峰值带宽、并发连接数、峰值持续时间。
按日/按月包月带宽适合稳定流量;95峰值适合波动型但要注意短时突发会被计入峰值;按流量计费则适合极低基线的大爆发型。
把预计峰值乘以缓冲系数(1.2–1.5),并与供应商谈判突发带宽策略或预留额外弹性带宽。
与CDN或供应商协商短时带宽提升/临时购买峰值包以避免业务中断。
高防能力关键看清洗流量峰值(Gbps)、清洗并发连接数、支持的防护层级(L3/L4/L7)和是否有Always-on或按需清洗。选择时要明确SLA、清洗时延与误报率。
1) 防护峰值:比你预估最大攻击流量高出至少1.5倍;2) L7防护是否支持自定义WAF规则;3) 是否提供黑洞策略、清洗池与智能规则。
默认启用基础流量清洗,关键业务上做Always-on或双线冗余,结合WAF限速、IP白名单、行为分析降低误伤。
要求提供清洗历史、响应时间、是否支持跨机房清洗、以及价格和升级路径。
核心思路是把可缓存的流量尽量转移出源站:结合CDN、反向代理、以及本地缓存策略,降低源站带宽与CPU压力。对无法缓存的API流量,采用水平扩展和负载均衡。
静态资源使用CDN并设置合理Cache-Control;动态页面可使用边缘缓存或分层缓存(Memcached/Redis + 应用缓存)。
使用负载均衡器(L4/L7)做流量分发,配合自动扩容(或预启动备用实例)以秒级响应流量突增。
实现熔断、限流与灰度降级,针对非核心功能降级服务以保证主业务可用。
完善的监控和演练比单纯的高配更重要。应该覆盖链路带宽、连接数、CPU/内存/Disk IO、应用响应与业务指标,并设置分级告警与自动化响应脚本。
流量(入/出)、活跃连接、请求错误率、后端队列长度、资源使用趋势和异常流量源IP。
定期做DDOS演练、带宽突发演练和扩容演练,明确沟通链路与责任人,备好快速切换到备用链路或CDN的脚本。
建议保留网络与应用流量日志(至少7–30天),以便攻击分析与供应商协调清洗时取证使用。