发布时间:2023-07-21
点击次数: 生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。
如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动态的平衡。算法模型完善带来的“软实力”提升,算力供给优化引发的“硬实力”增强,需要得到进一步的加持——数据传输的“运力”和数据存储的“存力”即是尚待改进的动力源,新型的数据存储基座将在应对诸多挑战的过程中破茧成蝶。
需求复杂且持续进化的应用场景,是数据存储新基座最好的试金石。从这个意义上讲,教科研行业就是其中的典型代表:算力与数据是该领域数字化转型的关键要素,学科融合的科研计算与基于数据的决策支撑同等重要。从HPC迈向HPDA(高性能数据分析)是改善教学及科研效率的一大步,而AI的赋能则有助于解决过往算不了、算不准、算不动的难题。

在近日举办的2025世界人工智能大会上,华为OceanStor Pacific分布式存储助力上海交通大学构建的HPC+AI存力底座正式上线,“交我算”统一数据基座将在今年再扩充25PB,其有望成为教科研数字化、智能化转型的新标杆,也为数据存储新基座的探索之旅树立了一座里程碑。
伴随千行百业的数字化转型进入深水区,以及人工智能、大数据等新兴技术的协同爆发,数据与算力的关系正在发生微妙的变化。

教科研领域身处数字经济的风口浪尖,对这一变化颇为敏感。过去,数据必须跟着算力跑。为了应对复杂科学和工程问题的快速数值求解,教科研界在很长一段时间里更多关注如何打造最强大的算力,而数据仅作为算力的配套设施来考虑。
如今,“算力围着数据转”逐渐成为新的趋势。新兴应用的涌现、数据体量的膨胀、数据安全问题的凸显,让数据本身的价值备受重视。基于AI、大数据等技术的突破,传统超算正向数据密集型超算演变,多元异构算力需要围绕同一个数据存储基座进行构建。
上海交通大学网络信息中心副主任林新华认为,数据与算力的主导权发生逆转,既是建设数据密集型超算平台的契机,也给统一数据存储基座的构建带来不少新的挑战。
首先是数据爆发式增长,对存储容量的需求显著提高。据统计,“交我算”平台的数据规模增长幅度达到每年7PB,气象海洋、能源勘探、卫星遥感、基因测序、冷冻电镜、AI自动驾驶、制造CAE、动画渲染等应用场景的数据量都达到PB级,用一套数据基础设施容纳如此庞大的数据量殊为不易。
其次是新业务不断涌现,对存储性能要求更高。AI通用化进程的提速,特别是大模型、多模态的批量输出,对IO性能构成严峻挑战。在百TB级数据集成为常态的情况下,自然语言处理、多模态应用加剧了数据量的增速,小文件训练数据集的高效访问更要求存储性能再上新台阶。
再次,跨校区多集群存储共用,数据在异构集群间的流动可能造成数据丢失、运行缓慢等问题。“交我算”平台提供多种异构算力,拥有ARM集群、X86集群以及AI集群等。在众多集群中,只有做到全数据流动和数据融合,才能释放算力和数据的最大价值。
最后,传统AI本地盘训练,伴随高并发数据分析,打破IO墙迫在眉睫。数据多次搬迁过程中的IO瓶颈非常突出——传统的读写流程冗长,加载数据涉及三次数据搬迁,checkpoint也有两次数据搬迁,其间产生的效率损失不容忽视。
为了应对上述挑战,自2019年起,上海交通大学与华为存储展开深度合作,共同打造“交我算”数据密集型超算平台。依托在技术和应用创新方面的深厚积累,华为OceanStor Pacific分布式存储产品助力“交我算”建设统一数据基座,支撑起全校多种异构算力平台。

构建分布式统一融合数据基座,是“交我算”拥抱新兴数据应用的必由之路。基于横向扩展分布式存储架构,“交我算”平台的存储容量和带宽可按需扩展。一是性能容量线性增长,单集群可达EB级容量;二是借助高密大容量硬件,节省机柜空间;三是采用大比例EC,以场景化压缩提升磁盘利用率。
据了解,“交我算”平台从初始的2PB容量、6GB/s带宽,到2025年增至20PB容量、60GB/s带宽,2025年又扩容至40PB容量、120GB/s带宽,预计2025年容量将再扩充25PB。与此同时,华为OceanStor Pacific分布式存储拥有5U 120盘位的超高密设计,结合超大比例EC数据冗余保护算法,在满足高可靠性的基础上将硬盘空间利用率提升至91.6%。
分布式全闪硬件加持是“交我算”应对存储性能难题的基石。在华为OceanStor Pacific的助力下,“交我算”平台采用全闪硬件加速,显著提升带宽与IOPS性能,每节点80万IOPS、带宽20GB/S能够满足混合负载条件下的高性能要求。
全局分布式存储跨校区统一管理是“交我算”解决多集群存储共用难题的良方。通过采用全局文件系统跨域多套存储管理的方式,“交我算”平台构建起跨校区的统一数据基座,在华为OceanStor Pacific分布式存储产品的支撑下,达*局文件视图、数据管理与调度、全域数据流动、统一流式元数据等多重目标。
数据分析加速、多种协议访问无损互通、免搬迁高效用是“交我算”打破IO墙的利器。基于华为面向AI的存储方案,以及华为OceanStor Pacific分布式存储“一份数据,多种协议访问”的能力,“交我算”平台实现外置存储减少数据搬迁,并大幅提升分析效率、节省存储空间。
透过“交我算”平台携手华为存储打造分布式统一融合数据新基座的演变轨迹,不难看出数据密集型场景正在加速进化。
从早期的HPC到后来的HPDA,再到HPDA+AI的比翼齐飞,教科研行业的应用场景不断丰富,对存储产品和数据基座的需求也持续跃迁。事实上,教科研只是千行百业数字化进程的冰山一角,数据
存储的大时代已呼啸而来。
大模型时代的到来,将进一步重塑包括存力在内的IT基础设施,带有崭新AI基因的存储产品有望成为行业数字化升级的新宠。7月14日,主题为“数据新范式 释放AI新动能”的大模型时代华为AI存储新品发布会将在线举行。无论您正在企业内部署AI,还是让开发的应用具备AI能力,此次发布的方案都将提供更优的技术架构与产品,帮您踏准时代的节拍。
人工智能通用化的大幕已经开启,存储行业的领头羊率先吹响了冲锋的号角,后面的每一个乐章都值得期待。
以上就是AI大模型时代,数据存储新基座助推教科研数智化跃迁的详细内容,更多请关注其它相关文章!
# 数据存储
# 教科研数智化
# 基座
# 华为
# 高性能
# 开源
# 中国科学院
# 异构
# 存储产品
# ai大模型
# 保定seo优化的网站
# seo实战免费课程分类
# 设计网站有哪些做推广
# 高端品牌如何营销推广
# 丽江关键词排名费用
# 怎么给公司做网站推广
# 江苏营销推广费用
# 酒店网站优化建议有哪些
# 云悦seo
# 呼市网站推广
# 基础设施
# 丰田
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
【搞事】时隔4年 谷歌更新安卓logo 机器人头更饱满了
美踏控股推出创新人工智能大数据模型“心乐舞河”:虚拟人音舞社交的新体验
李开复官宣新公司「零一万物」,进军 AI 2.0
看了天美对AI的布局,我感觉它想得是真明白
AI室内设计软件流行,室内设计行业如何应对效率变革
小艺主导智慧交互升级,借助AI大模型增强能力
城市在采用人工智能方面进展如何?
小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学
生成式AI对云运维的3大挑战
微软AR/VR专利提出使用时间复用谐振驱动产生双极性电源
谷歌将使用公开信息训练 AI 模型,构建更强大的自家产品
MiracleVision视觉大模型上线时间
网易云音乐和小冰推出AI歌手音乐创作软件,首发内置12名AI歌手
利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作
GPT-4不能在麻省理工学院获得计算机科学学位
MiracleVision视觉大模型功能介绍
WHEE网页地址入口
陈根:ChatGPT和人类合作开发机器人
全面拥抱大模型浪潮,ISC 2025打造全球首场AI数字安全峰会
“黑科技”亮相大湾区轨交论坛 智慧交通迈向“强AI”
即将到来:AI婚纱设计软件实际测试,人工智能即将开创婚纱设计新纪元
美图设计室2.0什么时候上线
全新小艺搭载AI大模型,有效提升学生和职场人士的工作效率
洞穴探险神器?可自主导航的单旋翼自旋无人机,效率更高!
生成式人工智能如何改变云安全的游戏规则
AI赋能艺术 超现实达利奇幻之旅在沪开启
联合国秘书长称支持建立全球人工智能监管机构
陈根:AI工具为游戏软件实时3D内容助力
重磅! 捷通华声灵云AICC荣获第二届光合组织AI解决方案大赛二等奖
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
研究发现AI聊天机器人ChatGPT不会讲笑话,只会重复25个老梗
500元一张的AI艺术二维码制作,详细教程来了!
人工智能快速发展 打开就业新空间
人工智能框架生态峰会即将召开,聚焦AI大模型技术与科学智能探索!
百度文心一言App上架苹果商店,人工智能创作引发热议
OpenAI CEO 山姆・阿尔特曼呼吁 AI 领域中美应当合作
GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群
不到2S创作AI图像!Snap发布图像生成器SnapFusion
高质量数据推动AI场景化应用快速发展及落地
AI 程序 Text With Jesus 在海外迅速受到关注:与耶稣和撒旦进行对话
2025智源大会AI安全话题备受关注,《人机对齐》新书首发
十个AI算法常用库J*a版
人工智能自己玩自己
OpenAI高管:AI能创造新的就业机会 但也会淘汰一些
AI浪潮席卷,时空壶为何能成为AI翻译时代的破局者
争鸣:OpenAI奥特曼、Hinton、杨立昆的AI观点到底有何不同?
全媒封面丨⑤商汤科技:原创AI算法“发电厂”
可按用户语气自动回复消息,Zoom 推出基于生成式 AI 的新功能
人工智能正在弥合认知和表达之间的鸿沟
以计算机视觉技术为基础的库存管理如何改革零售行业