在台湾,具备完整冷却与电力冗余能力的多数为大型电信业者与专门的机房/Colo业者。代表性厂商包括:中華電信(Chunghwa Telecom)、台灣大哥大(Taiwan Mobile)、遠傳電信(FarEasTone)等电信三雄,以及若干在地专业机房与ISP(例如Seednet等)提供的托管与机柜服务。這些業者通常結合自有通信骨幹、動力系統與冷卻設施,能提供從低密度到高密度机架的冷却与电力解决方案。
業者普遍採用空調(CRAC/CRAH)、熱/冷通道封閉(Hot/Cold Aisle Containment)、機架級液冷或in‑row冷卻與free cooling(外氣節能冷卻)等技術,以降低PUE並支持高密度運算節點。
在電力冗餘方面,多數機房採用UPS N+1或2N設計、雙路或多路市電輸入、備用柴油發電機組(含自動切換ATS)、以及PDU與配電母線冗餘,並以監控系統整合告警與負載平衡。
不同机房会根据定位(企业级托管、云服务或高性能计算)选择不同冷却策略,常见方案与特点如下:
以CRAC/CRAH机组结合冷水机组与空调系统,配合冷、热通道管理。
优点是技术成熟、对老旧机房改造门檻低;缺点是能效较低、难以应对极高机柜密度。
将冷却单元放置于机柜行间,或直接在CPU/GPU级别采用液冷冷板与冷回路。
优点为对高密度负载(如GPU集群)效果显著、能效优;缺点为初期投资高、流体管理与安全要求更严。
在气候允许时使用外气直接或间接冷却以降低机械制冷负荷,同时结合能量回收或热交换器。
优点是长期运营成本降低;在台湾夏季高温期,free cooling效果受限,需要与其他方案混合使用。
为达成高可用性(例如业界目标99.99%甚至99.999%),本土机房常见设计如下:
通过两条独立市电进线或多电源路径,配合自动切换装置(ATS),降低单一路故障风险。
N+1:在UPS单元中配置冗余模块,能承受单点设备故障;2N:完全冗余的两套独立UPS系统,切换时几乎无中断。
配备柴油或天然气发电机,且考虑燃料储备天数与自动启停策略,重要机房会配置足够燃料以应对长期断电情况。
採用双路PDU供电给关键机柜,配合智能PDU监控电流、电压与环境数据,提升运维可见性。
BMS(Building Management System)与DCIM平台整合UPS、发电机、空调、温湿度与烟感等数据,支援远端告警与自动化调配。
选择机房时查看第三方认证与遵循的行业规范是重要判断依据,常见且具参考价值的包括:
Uptime Tier(I至IV)评估机房在冗余与可维护性上的等级,Tier III以上通常表示具备持续运行与并行冗余能力。
TIA‑942涵盖拓扑、供电、冷卻、電纜與運維空间等,遵循该标准有助于确保机房设计完整性。
ISO 27001侧重信息安全管理,ISO 50001則彰显能源管理与节能措施,对冷却与能效改善尤为相关。
机房必须符合台湾地区电力、消防(含FM‑200/IG、水幕/喷淋的配合)与建筑安全规范,确保在异常或灾害时能正确切换与保护设备。
选择机房除了看设备规格外,运维能力与服务水平更关键,应关注以下要点:
询问机房的冷却最大承载密度(kW/机架)、是否支持液冷以及未来扩容的能力,避免后来因为密度增加而需搬迁或追加设备。
确认UPS与发电机的配置(N+1/2N)、双路市电来源与定期进行的切换/负载测试纪录,验证真实可用性。
要求提供DCIM/BMS视图权限或关键监控数据、明确的SLA指标(停机赔偿、故障响应时间)与24/7现场支援或远端工程师服务。
了解设备保养周期、备件库存位置与更换流程,尤其是UPS模组与空调关键组件的更换时效。
查看审计报告、认证文件与历史事件记录(如市电中断、发电机启停纪录),验证商家宣称的能力与实际纪录是否一致。