上海电机学院核心机房服务器及算力平台驻场运维服务快速采购公告

发布者:梁燕 发布时间:2025-10-09

根据《上海电机学院采购与招投标管理办法》等规定,因工作需要,现进行编号为:SDJU-2025171上海电机学院核心机房服务器及算力平台驻场运维服务快速采购。欢迎具备相应资质和实力的供应商参与报价。

一、采购需求(概述、维保服务内容、验收要求等)

(一)服务内容概述

本项目为上海电机学院核心机房服务器及算力平台驻场运维服务采购,旨在保障学校算力平台及核心机房服务器设备的稳定运行。服务内容主要包括算力平台运维和核心机房服务器运维两方面:平台运维涵盖CPU、GPU、存储等资源的日常监控、故障排查、性能优化及版本升级,同时负责计算资源调度、用户权限管理、日志审计及数据备份;服务器运维包括服务器安装调试、硬件维护、故障处理、网络配置及机房环境协同管理。

(二)具体维保服务内容

1、服务范围

服务器/操作系统、虚拟化与超融合(HCI)平台、分布式/并行存储、应用系统,以及 HPC/AI 集群 的软件与配置层面运维支持(远程与现场)、巡检与优化、版本维护、备份检查与恢复演练、监控与告警、报表与RCA、文档与培训。

2、服务器与存储运维服务

1)远程技术支持

7×12 小时热线与远程支持,受理技术咨询、故障申报与培训需求。涉及硬件的事件,由乙方完成定位并在约定时限内向甲方指定维保单位报修与对接。

2)硬件故障报修与协同

发生或判定为硬件故障时,30 分钟内完成信息收集与分级,1 小时内向甲方指定维保单位/厂商发起报修(电话+工单/邮件)并同步甲方;提供日志/诊断信息与现场配合;工作日每日跟进并记录,维修完成后配合验证与业务恢复。硬件维修、备件及其时效的责任以甲方与维保单位/厂商合同为准。

3)应急现场技术支持

提供1 名专业技术人员对口甲方现场支持。范围涵盖软件配置、系统与网络连通性排障、虚拟化/存储/HPC 调度系统恢复,以及与硬件维保单位的沟通协调。

4)维护性软件版本更新

在服务期内实施操作系统、虚拟化/中间件等维护性版本升级,包含评估、窗口计划、回退方案与验证。

5)产品故障现场支持

因应用变更、系统配置变更、资源分配调整或应用系统故障需排障优化时,乙方安排技术专家现场支持;确认属硬件问题的,转由维保单位处理,乙方持续协调与配合。

6)巡检服务

每周2 次 现场巡检(9:0016:00)。内容包括:

l 运行环境读数与告警核对(温/湿/电源冗余)

l 资产与版本盘点(固件/OS/中间件/虚拟化/容器运行时/驱动版本比对)

l 配置合规检查(账号/权限、日志、时间同步、备份与快照策略、RPO/RTO

l 结构与性能分析(CPU/内存/IO/网络指标、瓶颈识别与优化建议)

l 网络效率分析(连通性/丢包/RTT/VLAN/端口状态核对)

l HPC/GPU 专项:节点在线率、温度/功耗/风扇、内存 ECC、磁盘 SMARTGPU/驱动/CUDA/容器运行时版本矩阵核对;nvidia-smi/DCGM 指标与异常初判(含 Xid/温度超限);作业调度(Slurm)队列/配额/状态统计、失败作业收敛与隔离;IB/RoCE 连通性与基础性能粗检(ibstat/iblinkinfoMTU/端口状态核对)

l 容量与增长趋势(含存储重建/校验进度与热点分析)

l 巡检报告与优化建议(含风险项与整改优先级)

7)现场值守/重大项目保障

按甲方要求驻场,承担运行维护、咨询与保障,以及跨厂商沟通与协调。

8)系统优化

围绕安全性、稳定性、性能与可用性开展周期性评估与优化,形成实施建议与变更/回退方案。

3、存储运维(含分布式/并行存储)

1)远程支持:技术咨询与软件层面故障处理;提交问题定位与修复报告。

2)定期维护:每月一次参数核对、日志/告警复盘、配置合规、性能与容量评估;现场开展软件方向培训;形成普遍性问题通报与预防建议。

3)故障服务:远程/现场排障恢复;属硬件事件的,由乙方负责报修与协调直至关闭;提交 RCA 与避免复发建议;对甲方人员开展故障处理培训。

4、虚拟化/超融合与 HPC/AI 运维

1)平台职责:负责虚拟化/超融合与 HPC/AI 集群的软件与配置层面运维。

2)宿主机巡检:CPU/内存/磁盘 IO 与硬件健康读数(温度/风扇/内存 ECC/磁盘 SMART)告警核对。

3)虚机/容器/作业运行检查:OS 状态、资源使用、日志与进程、网络连通;作业调度(Slurm)队列/配额/状态查询,失败作业重试与隔离。

4)备份与恢复演练:纳管新增虚机与关键数据;按 RPO/RTO 制定备份周期,支持增量/差异/全备;每季度≥1 次 抽样恢复演练并归档。

5)运行监控分析:主机/虚机/集群关键指标、DCGM/GPU 指标与作业调度指标的实时与历史分析,提出主动调整建议。

6)数据迁移:按需完成物理/虚拟服务器与数据迁移并验证。

7)网络侧:开展 VLAN、分布式交换机、端口组等配置与连通性排查;涉及物理链路/模块由维保单位处理,乙方负责协调。

8)存储侧:完成数据存储挂载、容量与告警处置;涉及物理部件由维保单位处理,乙方负责协调。

9)版本矩阵管理:维护 GPU/驱动/CUDA/容器运行时版本矩阵与兼容性建议;提供异常版本回退方案。

10IB/RoCE 基础联通:执行 ibstat/iblinkinfo、端口/MTU 核对与基础性能粗检;复杂问题升级二线或对接维保单位。

5、漏洞修复与安全加固

1)漏洞修复:基于甲方漏扫平台,对低//高危漏洞实施修补与复核,评估风险并协助处置。

2)漏开洞预防:协助安全加固、补丁、关闭不必要服务与安全防护部署。

3)漏洞消减:展补丁有效性与安全性验证;无法更新时制定替代措施(隔离/规则临时加固等)。

4)漏洞跟踪:定期检查处置效果并提交报告。

6、应用系统维保

1)新建信息系统:需求调研、质量监控、文档、上线运维;与统一身份认证/共享数据平台/信息门户集成;虚机维护;部署与数据库设计文档完善;进度管控与多方协调。

2)已建信息系统:变更与质量监控、文档完善;数据导入/导出/统计/清洗;杀毒/备份/虚机维护;客户端安装与故障处理;建立应急流程与制度;每学期 13 次常见故障技术指南;完成网信办日常工作。

7、监控与告警

1)覆盖对象:主机/虚机/集群、DCGM/GPU、作业调度、存储、备份、关键服务。

2)平台选型:Prometheus+Grafana Zabbix(其一),配置阈值、抑制/静默与分级策略。

3)告警通道:IM/短信/邮件。

4)管理闭环:告警—工单—处置—复盘(RCA 纳管)。

8、服务时效与 KPI

1)响应:电话/IM 30 分钟;远程介入 ≤1 小时;需到场 ≤4 小时。

2)恢复目标:

l P1(核心服务/生产作业大面积中断):临时恢复 ≤2 小时,并 ≤30 分钟完成二线升级;

l P2(关键业务可降级):临时恢复 ≤4 小时;

l P3(一般故障/服务请求):≤1 个工作日。

3)运行指标:

l 变更成功率98%;备份成功率 ≥98%CMDB/资产准确率 ≥98%

HPC 作业整体成功率 ≥95%(排除用户脚本错误);

l 关键集群可用性99.9%/月(以分钟计,计划性停机不计入)。

l 硬件相关SLA 引用:硬件维修、备件与到货时效等以甲方与硬件维保单位/厂商的合同约定为准;乙方负责报修与协调。

9、工具与支撑

1)工具:SSH/RDP/串口、日志收集与分析、批量脚本(Shell/Python 基础)、DCGMvSphere/FusionCompute/AHV/KVM 控制台等。

2)升级支撑:供应商二线/三线升级矩阵(虚拟化、HCIHPC 方向),P1 级 远程介入 ≤30 分钟。

10、安全与合规

账户最小权限与堡垒机留痕;人员离场24 小时 完成账号回收。生产数据不出域,敏感日志脱敏;严格执行机房 EHS 与变更审计制度。

11、服务人员

1)指定项目经理负责整体运维与新项目实施管理,并对驻场工程师进行监督与月度复盘。

2)指定 1 名工程师 现场服务。现场人员可按需增至不超过 3 人;提供信息化服务热线(固定电话与移动电话)。

3)提供实施与运维文档:巡检清单、配置台账、变更记录、备份/恢复演练记录、问题与 RCA、优化建议等。

4)提供不限人次培训(软件与配置方向),确保管理人员掌握平台日常运维技能。

12、服务期限:自合同签订后一年内。

(三)验收标准及方法:提交服务总结报告,买方签署意见。

二、对响应单位的资格要求

1.满足《中华人民共和国政府采购法》第二十二条规定;

2.报价人单位负责人为同一人或者存在控股、管理关系的不同单位,不得同时参加本采购项目;

3.未被“信用中国”(www.creditchina.gov.cn)、中国政府采购网(www.ccgp.gov.cn)列入失信被执行人、重大税收违法案件当事人名单、政府采购严重违法失信行为记录名单;

4.本项目面向大、中、小、微型企业,事业单位、社会组织等各类供应商采购;

5.本项目拒绝联合体投标或转包。

、报价及付款方式

1.报价方式:本项目报价总额不得超过19万人民币。

2.付款方式:签订合同30个工作日内,支付合同总价的80%;服务期结束验收通过后20个工作日内,支付合同余额。

四、报价提交方式及文件包含

1.递交文件时间、地点:

凡愿参加该采购项目的投标人应于2025年10月1710:00将报价文件送达至上海市浦东新区水华路300号行政楼127室。

2. 报价文件中应包含:

1) 供应商法人营业执照副本(复印件加盖单位公章);

2) 组织机构代码证副本;(三证合一单位仅需提交营业执照);

3) 税务登记证副本;(三证合一单位仅需提交营业执照);

4) 法定代表人授权委托书、被授权人身份证(需签字并加盖公章)、联系方式、联系邮箱等;

5) 提供自该项目采购公告发布之日起至递交截止日内任意时间的“信用中国”网站(www.creditchina.gov.cn)、中国政府采购网(www.ccgp.gov.cn)投标人信用查询网页截图。

6) 无利害关系声明

7) 中小企业声明函(如有);

8) 资格证明文件(供应商认为可以证明其能力、业绩、信誉和信用的相关材料)

9) 报价一览表及报价明细表;

10) 详细的技术服务方案及售后服务承诺;

11) 服务标准及人员配置情况等

12) 供应商认为需加以说明的其它内容。

3.提交方式:送达(不接收快递);

4.报价文件接收人:梁老师联系方式:38223209  

五、其他

1. 采购文件的澄清和修改,将通过发布招标信息的媒介以澄清或修改公告的形式发布。

2. 成交结果将通过发布采购公告的媒介进行公示,公示期内如对成交结果有异议可向校方提出书面质疑。

3. 公示期结束后向成交供应商发出成交通知。

4. 最低报价不能作为成交的唯一保证。如不能满足第一、二款条件,校方有权拒绝该报价。

5. 技术联系人:陆老师,联系方式:15262731381

6. 报价文件要求一式二份,可双面打印,胶装成册加盖公章后密封,报价文件封面注明项目名称、编号、报价人名称、地址、电话等信息,并提交报价文件电子稿1份(U盘或光盘格式,不退还)。

7. 招标办汇总响应供应商的相关资料后组织评审。评审组根据满足实质响应要求且价格最低的原则确定成交供应商。

8. 评审费用由成交单位支付,不提供发票;以签收单为准。



温馨提示:校内实行机动车管控,建议绿色出行。前来参加报价的响应单位如自驾前来,请将机动车停放于水华路300号校门对面停车场后,刷身份证进入校园,感谢配合。