婺源之行,缘聚新测!2024ODCC春季全会新技术与测试工作组会议顺利召开!
2024年3月28日,ODCC2024春季全会新技术与测试工作组会议在江西婺源顺利召开,来自中国信通院、中国移动、中国电信、美团、博通、英伟达、华为、忆联、三星、联想、大普微等多位业内专家参会,上午会议由ODCC新技术与测试工作组副组长、中国电信研究院云计算研究中心总监赵继壮主持,下午会议由深圳忆联信息系统有限公司高级工程师李军主持。
中国移动研究院项目经理刘振介绍了人工智能加速卡的测试体系及方法,重点对人工智能加速卡在单机、集群中的功能、性能,以及针对大模型训练和推理的测试方法进行了分析,并对后续智算测试工作的研究方向进行了展望。
美团光网络架构师毛明旺表示在AI计算网络中引入OCS光交换机,可以满足网络拓扑按需调整,支持网络碎片资源整合,保障业务干扰隔离,提升计算网络性能,降低网络的成本、功耗、延迟、故障率并提高数倍带宽效率。
英伟达网络市场开发总监陈龙表示受益于LLM 的快速发展,AI集群的规模不断扩大,对大规模AI集群的东西向网络提出了苛刻的要求,如何快速检验判定一个AI集群网络性能的方法成为时下业内关注的重点。
博通架构师周大为表示随着模型和数据规模的高速增长,“世界模型”近在眼前,海量AI加速器的部署已经在逐步地开展,以太网技术如何提高集合通讯效率,更好地发挥海量AI加速器的能力,是业界目前的主要方向。
中国电信研究院云计算研究中心总监赵继壮阐述了对高速RDMA网卡提出要具备可编程拥塞控制能力规范的需求来源,并从信号感知能力、算法可编程能力、发送速率控制能力等多方面论述了主要技术要求,最后介绍了电信研究院与天翼云公司R&D协同项目组在研发CTCC过程中遇到的部分挑战。
华为中央研究院网络技术实验室网络协议专家李映辉针对AI大模型训练对算力需求不断增加的背景,探讨了多AI集群跨AZ、跨region联合训练的可行性,深入讨论了多集群训练面临的组网和通信挑战,并对未来的研究方向进行了展望。
烽火通信网络产出线预研技术专家李传宝介绍了智算中心光互联的需求挑战、研究背景和技术进展,面向AI集群光电混合组网从硬件系统、组网拓扑、路由协议、流量感知拓扑优化以及其他实现方案对比,逐一进行分析。
中国移动研究院项目经理张竞文对通用算力服务器交付验收环节中应满足的技术要求进行了详细的介绍,主要包括对验收准备、内容、方式、结果和自动化方面的要求。并表示该标准将确保大规模服务器交付中的验收效率与质量,支撑业务稳定运行。
忆联高级工程师李军介绍了写放大的定义、成因及其对SSD寿命的影响,对写放大的技术路线,并对控制SSD的空间利用率和内部文件保存时间进行了分析。最后总结了各种应用场景和文件系统等对写放大的影响。
三星高级工程师豆坤表示随着人工智能技术的飞速发展,高性能固态硬盘(SSD)在AI领域的需求日益增长。PCIe 5.0 SSD对于AI应用的性能和效率具有重要影响,PCIe 5.0 SSD能够提供高速的数据读写能力,从而加快数据处理速度,提高AI应用的效率。
联想CSP研发部资深项目经理胡振国表示CXL相关产品和计划层出不穷,离CXL的实用化尤其是Type3也越来越近。因此借鉴NUDD的工具,为CXL项目做前期的风险评估,实现给行业上下游同仁提供切实可行的风险评估类的帮助。
华为数据存储硬件架构师向清懿介绍了大容量SSD的发展趋势和应用场景,从容量与速率的矛盾、重建时间等方面提出了面临的技术挑战,并对大容量SSD的技术指标提出了设想,最后展望了大容量SSD技术要求及评价指标项目的研究规划。
联想部件资深工程师黄福帅总结了NVMe Raid的五种可实现方案,并且对这五种方案进行性能优化调优,瓶颈点分析,炼化五种NVMe Raid方案的性能参数,找到五种NVMe Raid各自适合的应用场景,提供各个应用场景下最高的性能优化与最合理的NVMe Raid方案。
大普微解决方案架构师李根介绍了ZNS SSD 的标准规范,使用场景和测试方法,从测试验证角度理解ZNS SSD 的功能和性能、系统环境要求和测试方法,使设备厂商和用户能更好的评估ZNS 技术在实际业务中的作用。
大普微解决方案总监王晋强指出QLC SSD有着大容量和低成本的特点,在读取密集型应用中表现出色,正逐步如大模型,AIGC和大数据等规模部署。希望通过系统化的方法帮助用户合理选择和使用QLC SSD,发挥出QLC SSD最大的效能。
中国信通院云大所数据中心部业务主管于美泽对智能算力发展背景下液冷系统技术优势、发展路径、产业现状和未来挑战进行了分析,提出构建科学全面的智算中心液冷系统综合评价体系的重要性。基于冷却液、IT设备及配套设施、系统能效、智算中心整体等不同维度,提出其关键指标选取与相应评价标准的初步研究规划。
算力是激活新质生产力、释放数字经济高质量发展新动能的关键引擎。未来,新测组将聚焦网络、存储、人工智能、液冷等热点领域,推进算力产业的新技术研究与测试认证,推动我国算力基础设施高质量发展,夯实数字经济底座。
联系人:温老师:13683598363
邮箱:wenxiaozhen@caict.ac.cn