400 128 6709

行业新闻

线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署

发布时间:2025-01-31点击次数:

香港大学与上海人工智能实验室、华为诺亚方舟实验室合作,推出高效扩散模型lit,该模型在架构设计和训练策略上均有创新,实现了在普通windows笔记本电脑上离线生成1k分辨率高清图像。

☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

LiT模型在Windows笔记本电脑上离线部署

LiT的核心突破:

为提升扩散模型效率,LiT采用极简线性注意力机制替代计算成本更高的自注意力机制。线性注意力的优势在于简洁性和高并行化能力,这对于大型模型至关重要。研究团队总结了以下关键经验:

  1. 极简线性注意力足够: 无需复杂的线性注意力变体,简化版即可满足图像生成需求。
  2. 权重继承策略: 建议从预训练的Diffusion Transformer模型继承权重,但需排除自注意力模块的权重。
  3. 混合知识蒸馏: 采用知识蒸馏加速训练,同时蒸馏噪声预测和方差预测结果,以获得更佳效果。

性能表现:

LiT在ImageNet基准测试中,仅需DiT模型20%-23%的训练迭代次数,即可达到相当的FID分数。在文本生成图像任务中,LiT-0.6B可在离线状态下,于Windows笔记本电脑上快速生成1K分辨率的逼真图像,展现出强大的端侧部署能力。

论文及项目信息:

Health AI健康云开放平台 Health AI健康云开放平台

专注于健康医疗垂直领域的AI技术开放平台

Health AI健康云开放平台 113 查看详情 Health AI健康云开放平台
  • 论文名称:LiT: Delving into a Simplified Linear Diffusion Transformer for Image Generation
  • 论文地址:https://www.php.cn/link/523f43693bfa6c607d2fe43b43ba96fd
  • 项目主页:https://www.php.cn/link/2d6c3e4023165b5a99515b9bf87cb41d

研究背景:

Diffusion Transformer在文生图领域展现出巨大潜力,但自注意力机制的高计算复杂度限制了其在高分辨率场景和端侧设备的应用。LiT通过线性注意力机制有效解决了这一问题,并通过高效的训练策略进一步降低了训练成本。

线性注意力与其他Sub-quadratic计算复杂度模块的比较

(后续内容可根据原文目录,对架构设计、训练方法、实验结果等章节进行类似的改写,保持原意不变,并保留图片格式和位置)

以上就是线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署的详细内容,更多请关注其它相关文章!


# 扩散模型  # 产业  # 多家  # 来了  # 离线  # 一言  # Simplified  # ai  # 电脑  # windows  # git  # lit  # 山东最好的seo  # seo网站推选火星13  # 外贸网站推广平台蓝颜SEO牛  # seo关键词排名哪家好 火22星 服务好  # 常州网站建设维护  # 怎么在国外网站推广电影  # 威海营销推广策划费用  # 遵义网站推广工具  # 网站优化收录不利的情况  # hyein seo 中国店  # 这一  # 华为  # 祝福语  # 内测  # 诺亚方舟  # 生命科学 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 【趋势周报】全球人工智能产业发展趋势:OpenAI向美国专利局提交“GPT-5”商标申请  AI技术改变*,新骗局来袭,*成功率接近100%  马斯克:将来机器人比人类多!特斯拉机器人亮相人工智能大会  游族AI创新院揭牌成立 推进AI赋能游戏业务  谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域  无人机在电力巡检中的应用:全面解析高效巡检流程  纪录片 《寻找人工智能》全集1080P超清  解决导航“最后50米”难题 高德地图升级AR步行导航找终点功能  人脸识别+全景双摄+AI算法 萤石推动智能锁行业革新  DreamAvatar数字人使用教程  马斯克称人类是半机器人,记忆外包给了电脑  爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT  五项人工智能尚未能够实现的任务  Win11 AI 助手 Windows Copilot 被吐槽:套皮的 Edge 浏览器  DreamAvatar数字人在哪里下载  如布AI口袋学习机S12 将亮相综艺节目《好样的!国货》  RoboNeo操作教程  不到2S创作AI图像!Snap发布图像生成器SnapFusion  不止“文心一言”,消息称百度将推出全新 AI 对话软件“万话”  马斯克称未来机器人数量将多于人类,特斯拉愿共享自动驾驶技术  掌阅科技对话式AI应用“阅爱聊”开启内测  深度学习模型综述:用于3D MRI和CT扫描的应用  智能电网技术:提高能源效率和可靠性  爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化  亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资  搭载星火认知大模型 讯飞听见智慧屏开启AI办公新体验  马克龙密会AI专家,法国加入全球人工智能竞赛  Goodnotes 6推出,带来多项全新AI功能,让电子笔记更智能  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  了解 AGI:智能的未来?  科技赋能司法执行 阿里资产免费为全国法院升级VR新服务  对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型  生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人  7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动  一文看懂基础模型的定义和工作原理  云深处与昇腾CANN携手合作:开设ROS四足机器狗开发训练营  重磅! 捷通华声灵云AICC荣获第二届光合组织AI解决方案大赛二等奖  OpenOOD更新v1.5:全面、精确的分布外检测代码库及测试平台,支持在线排行榜、一键测试  日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病  人工智能如何与智能家居集成  美图吴欣鸿:希望更多人用上AI时代的影像生产力工具  微软大牛加入ZOOM,AI人才大战打响  美图公司影像节或发布AI设计新品  国内阅读行业首款对话式AI应用“阅爱聊”封闭内测  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  Stability AI 推出文生图模型 SDXL0.9,GPU要求下探至消费级水平  软通动力多项AI创新产品及应用亮相2025世界人工智能大会  DeepMind用AI重写排序算法;将33B大模型塞进单个消费级GPU  美踏控股推出创新人工智能大数据模型“心乐舞河”:虚拟人音舞社交的新体验  微软必应聊天现已在Chrome和Safari浏览器上可用,但仍有许多限制存在 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司