异构算力协同调查问卷

全球计算联盟(GCC)智算产发委异构算力协同工作组计划于3月17日左右在北京举办异构算力协同研讨会,交流相关成员单位的产业工作成果与规划、讨论产业协作需求,以支撑工作组标杆案例集、联合验证和创新、国际/国内标准等工作开展。本次会议侧重于交流和讨论,参会人员以产品/技术规划专家、产业生态合作专家为主,预计参会人员在30-50人左右,会议时间为半天或一天(根据议题和报名情况)。现征集各成员伙伴的参会意愿、演讲建议等,后续将根据大家的反馈确定具体的议程。请相关伙伴在3月5日前反馈。谢谢!
本问卷技术问题较多,大概需8~10分钟,感谢您的耐心填写。

注:本问卷所收集的信息不会对外公开,仅供 GCC 内部用于议程设置等相关工作。

如对以下问卷内容有疑问,可以联系:

中国电信 孙老师 sunmy1@chinatelecom.cn

全球计算联盟 桂老师 guizelin@gccorg.com

基本信息
*
1.
您所在单位类型
国产算力硬件厂商
大模型 / AI 算法服务商
算力使用单位(政企、科研、互联网、行业用户等)
其他
*
2.
您单位主要业务方向【多选题】
国产 GPU / 加速卡研发、生产
算力平台 / 智算中心建设与运营
大模型训练、推理、微调
行业 AI 应用落地
算力调度、虚拟化、容器云平台
其他
*
3.
贵单位目前使用 / 提供的 GPU / 算力芯片产品系列【多选题】
英伟达系列
昇腾系列
寒武纪
海光 DCU
沐曦
燧原科技
天数智芯
摩尔线程
昆仑芯
壁仞
平头哥
其他算力芯片,请补充
*
4.
主要使用场景【多选题】
大模型训练
大模型推理服务
深度学习训练 / 推理
科学计算、高性能计算
云桌面、图形渲染
混合业务负载
其他
*
5.
单集群 / 单节点内是否已存在多厂商GPU 混合建设/部署
已规模化混部
小规模试点
有规划,未实施
无规划
异构GPU算力混合使用行业难点
6.
当前行业在异构算力协同的主要困难最多选择2项】
缺少生态标准/规范
多厂商适配难度大
联合性能评测(benchmark、SLA指标体系)
没有具体场景需求
其他
7.
你们最希望通过产业联盟解决的问题最多选择2项】
标准/规范(接口、术语、能力模型)
互操作测试(互通验证、兼容性矩阵)
联合性能评测(benchmark、SLA指标体系)
联合场景落地(电信业务)
其他
8.
当前在使用“异构算力协同”方面最突出难点【多选题】
跨设备数据搬移成本高(Host↔Device/Device↔Device)
异构算力间通信库不互通互联/拓扑瓶颈(PCIe/CXL/片间互联/NUMA)
运行时调度难(并发、QoS、抢占、资源争抢)
多厂商适配成本高(接口碎片化)
框架/编译器/算子生态不足(性能与覆盖)
云原生/虚拟化支持不完善(隔离与性能损耗)
可观测性/调优工具链不足(定位难)
稳定性/RAS不足(故障恢复、升级风险)
安全与可信需求强(启动链、证明、固件治理)
其他
9.
这些难点当前主要靠什么方式缓解【多选题】
自研Runtime/调度器
自研算子库/编译器优化
自研集合通信库
与框架/中间件联合优化
依赖标准/通用框架(如ONNX Runtime/TVM等)
与整机/系统厂商联合调优
其他
10.
对“多厂商互操作/互通”的阻碍主要是什么
驱动/Runtime接口不统一
编译器/算子接口不统一
内存/数据通路不统一
调度与资源描述不统一
安全/隔离模型不同
商业/授权限制
其他
异构GPU算力混合使用技术支持
11.
贵单位硬件 / 平台是否支持不同厂商国产 GPU 在同一服务器内混合部署
原生支持
需驱动 / 固件升级支持
部分支持
暂不支持
未测试
12.
是否支持不同厂商国产 GPU 在同一集群 / 资源池统一调度
支持统一纳管、统一调度
支持统一纳管,不支持跨厂商调度
仅支持同厂商集群调度
暂不支持
13.
贵单位使用的算力调度 / 编排平台【多选题】
自研调度平台
Kubernetes
Slurm
阿里云 / 腾讯云 / 华为云等公有云平台
智算中心专用平台
其他
14.
该平台对多厂商国产 GPU 混合调度的支持程度
完美支持:统一视图、统一配额、统一任务分发
部分支持:可识别但无法统一调度
不支持:只能按厂商分集群管理
未适配
15.
国产 GPU 混合使用时,驱动层面是否存在冲突
无冲突,可共存
存在 minor 冲突,可通过容器 / 虚拟化隔离
驱动强冲突,无法共存
未测试
16.
模型在不同国产 GPU 间迁移 / 混合推理是否可行
模型结构无需修改,直接迁移
需少量适配(算子替换、精度配置)
需大量重写
无法迁移
17.
容器 / 虚拟化对国产异构 GPU 的支持
支持不同厂商 GPU 直通 / 虚拟化混配
仅支持同厂商虚拟化
仅支持物理直通
不支持
18.
监控、日志、告警是否支持统一观测多厂商国产 GPU
统一面板、统一指标
分别展示,无法统一
部分厂商支持,部分不支持
无统一监控
19.
是否对异构GPU推理系统优化技术(如PD分离等)有了解或应用
有了解并使用了相关技术
有了解,但并未使用
没有了解
其他
业务场景
20.
您认为最需要国产异构 GPU 混合使用的场景【多选题】
智算中心资源池化、利旧扩容
大模型多卡 / 多节点推理
多模型混合服务、弹性调度
容灾、高可用、多厂商冗余
降低供应链风险
其他
21.
贵单位对国产异构算力混合使用的迫切程度
必须支持,已影响业务
比较需要,提升资源利用率
一般,可按规划逐步支持
暂不需要
22.
实现混合使用最关键的技术痛点【多选题】
驱动不兼容、冲突
框架 / 算子不统一
调度平台不支持跨厂商调度
性能损耗大
稳定性差
运维复杂
缺少标准与规范
其他
参与意愿与建议
*
23.
能否提供一些开放接口,与其他厂商对接
不能
*
24.
是否有意愿参加异构算力工作组组织研讨、标准制定和案例编写【多选题】
有意愿参加3月的技术研讨会
标准制定(如调度接口与统一管理标准、异构推理引擎统一标准、容器 / 虚拟化适配标准、监控运维指标标准等)
参与异构算力协同案例集编写
暂无以上意愿
其他参与方式
25.
对实现国产异构 GPU 安全、稳定、高效混合使用的其他建议
*
26.
您是否有意愿在上述会议进行分享
*
28.
联系信息
您的姓名:
您的姓名:
邮箱:
邮箱:
联系电话:
联系电话:
单位名称:
单位名称:
职务:
职务:
问卷星提供技术支持
举报