推动“智算可视化”标准化发展,恒为科技引领行业未来
恒为科技
2024年09月29日 14:28上海4人听过
近日,2024年度上海市通信学会“算力浦江”专委会团体标准立项答辩会顺利举行,由恒为科技(上海)股份有限公司牵头,中国信通院华东分院等单位共同参与的《智算可视化平台能力要求》团体标准也将正式进入编撰过程中。

随着AI大模型的火爆,AI行业快速发展,越来越多的科技公司陆续推出千亿、万亿参数规模的LLM,而且LLM参数规模还在不断扩大,同时智算中心的集群规模也越来越大(千卡集群、万卡/十万集群),其数据量和复杂度呈指数级增长,而传统数据中心运维手段已经无法满足智算行业的发展以及智算中心集群高效运维的要求,这就给智算中心的运维带来了严峻的考验和挑战(异构算力集群管理复杂、网络延时抖动和带宽瓶颈等),智算行业急需要高效运维、实时分析和监控、问题及时预警、故障快速诊断、辅助决策支持、灵活可定制的智算可视化解决方案。
智算可视化,是指利用计算、网络、数据可视化以及AI等技术,实现对智算集群关键数据进行实时采集、监控、存储、分析、预警,并将其可视化展现,帮助客户实时监控智算中心的运行情况,定位和识别智算系统性能瓶颈、潜在问题和故障原因,为智算中心提供高效、准确、可观测的运维支撑,并通过优化算力资源调度,保障智算系统稳定运行,提升智算中心整体服务能力。
目前智算可视化行业解决方案存在跨平台适配集成复杂、采集维度和测量精度不够、多维度全方位可视化展示的客户体验不好等痛点问题,也缺少统一可参考的标准规范。
恒为科技积极联合业内具有广泛影响力的权威机构,共同引导和推动《智算可视化平台能力要求》团标草案的制定工作。主要内容包括:
智算资源可视化
智算资源调度和任务可视化
智算平台可视化
智算应用可视化
智算可视化平台展现
智算可视化监控指标

恒为科技紧紧把握产业技术趋势和市场发展动向,致力于推动智算行业的标准化与规范化,助力行业健康发展。公司将通过与行业权威机构、国内头部的光通信厂商、国产交换芯片、GPU/DPU/TPU芯片厂商的紧密合作,推动团标的编撰和推广,为“算力浦江”行动计划的实施提供技术和标准指引,进一步助力智算行业健康有序发展。
*点击下方“阅读原文”,查看详细新闻。
阅读原文
阅读470
追加内容

本文作者可以追加内容哦 !