400 128 6709

行业新闻

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

发布时间:2024-07-11点击次数:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

llama分子嵌入优于gpt,llm能理解分子吗?这一局meta赢了openai

编辑 | 萝卜皮

OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型(LLM)因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。

加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。

该研究以「Can large language models understand molecules?」为题,于 2025 年 6 月 25 日发布在《BMC Bioinformatics》。

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

1. 分子嵌入在药物发现中的应用

分子嵌入是药物发现中至关重要的任务,广泛应用于分子性质预测、药物-靶标相互作用 (DTI) 预测和药物-药物相互作用 (DDI) 预测等相关任务中。

2. 分子嵌入技术

分子嵌入技术可从编码分子结构连接信息的分子图或其结构的线注释中学习特征,例如流行的 SMILES 表示。

3. SMILES 字符串中的分子嵌入

通过 SMILES 字符串进行分子嵌入与语言建模的进步同步发展,从静态词嵌入到情境化的预训练模型。这些嵌入技术旨在以紧凑的数值表示形式捕获相关结构和化学信息。

码上飞 码上飞

码上飞(CodeFlying) 是一款AI自动化开发平台,通过自然语言描述即可自动生成完整应用程序。

码上飞 430 查看详情 码上飞

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

图示:药物化学表示。(来源:论文)

基本假设认为结构相似的分子行为方式相似。这使得机器学习算法能够处理和分析分子结构,以进行属性预测和药物发现任务。

随着 LLM 的突破,一个突出的问题是 LLM 是否能够理解分子并根据分子数据进行推断?

更具体地说,LLM 能否产生高质量的语义表示?

温莎大学的 Shaghayegh Sadeghi、Alioune Ngom Jianguo Lu 等人进一步探索了这些模型有效嵌入 SMILES 的能力。目前,这一能力尚未得到充分探索,部分原因可能是 API 调用的成本。

研究人员发现,使用 Llama 生成的 SMILES 嵌入在分子特性和 DDI 预测任务中的表现都优于 GPT 生成的 SMILES 嵌入。

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

图示:分类和回归任务的结果。(来源:论文)
值得注意的是,基于 Llama 的 SMILES 嵌入在分子预测任务中表现出与 SMILES 上的预训练模型相当的结果,且在 DDI 预测任务中优于预训练模型。
据此,团队得出的结论如下:
(1)LLM 的表现确实优于传统方法。(2)性能取决于任务,有时也取决于数据。(3)即使针对更通用的任务进行训练,LLM 的新版本确实比旧版本有所改进。(4)Llama 的嵌入总体上优于 GPT 嵌入。(5)此外,观察到 Llama 和 Llama2 在嵌入性能方面非常接近。

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

图示:Llama 与 Llama2 性能比较。(来源:论文)总之,这项研究凸显了 GPT 和 Llama 等 LLM 在分子嵌入方面的潜力。
该团队特别推荐 Llama 模型而不是 GPT,因为它们在从 SMILES 字符串生成分子嵌入方面具有卓越的性能。这些发现表明 Llama 在预测分子特性和药物相互作用方面可能特别有效。
虽然 Llama 和 GPT 等模型并非专门为 SMILES 字符串嵌入而设计(与 ChemBERTa 和 MolFormer-XL 等专业模型不同),但它们仍然表现出了竞争力。该工作为将来改进 LLM 分子嵌入奠定了基础。
未来,该团队将侧重于提高由自然语言句子嵌入技术启发而来的 LLM 分子嵌入的质量,例如对 Llama 标记化的微调和修改。
GitHub:https://github.com/sshaghayeghs/LLaMA-VS-GPT
论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-024-05847-x 

以上就是Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI的详细内容,更多请关注其它相关文章!


# 如何用  # 网站seo优化系  # 360 seo服务平台  # 廊坊天猫网站建设是什么  # 黄贝销售型网站建设  # 郑州网站推广公司策划  # 南昌网站建设工作推荐会  # 微信餐饮推广营销  # 上海南汇网站建设  # seo网络营销专员  # 楚雄seo整站优化  # 学习英语  # 如何将  # 机器学习  # 如何处理  # 一言  # 分子结构  # 自然语言  # 相互作用  # 赢了  # 这一  # git  # llama  # 理论  # llm  # gpt 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 值得买科技入选“北京市通用人工智能产业创新伙伴计划”应用伙伴  第二届光合组织AI解决方案大赛赛果揭晓  鉴智机器人发布基于地平线征程5的标准视觉感知产品  第 66 届格莱美奖规定,AI 作品将无法获得评奖资格  QQ音乐业内率先推出「AI一起听」功能,领取你的AI听歌助手  谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域  给小朋友最好的科技礼物:乐天派桌面机器人  SnapFusion技术大幅提升AI图像生成速度  眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷  OpenAI宣布组建新团队 以控制“超级智能”人工智能  云米Smart 2E AI立式空调开启预售:新三级能效,到手价3899元  英伟达H100霸榜权威AI性能测试 11分钟搞定基于GPT-3的大模型训练  7大探索区域打造沉浸式玩乐“元宇宙” 昆明京东MALL未来科技探索官全城招募中  Win11 AI 助手 Windows Copilot 被吐槽:套皮的 Edge 浏览器  人工智能颠覆软件测试四大方式  机构研选 | 虚拟电厂是电力物联网升级版 智能电网望迎来高速发展  华为推出两款商用 AI 大模型存储新品,支持 1200 万 IOPS 性能  网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准  探索AI前沿理念 2025全球人工智能技术大会在杭州开幕  从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级  苹果AIGC专利:可通过语音指令生成AR/VR虚拟场景  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  助力人工智能产业高质量发展 龙岗区算法训练基地正式启用  田渊栋新作:打开1层Transformer黑盒,注意力机制没那么神秘  财联社首档运用虚拟人技术播报栏目《AI半小时》今晚上线!敬请期待  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  懒人必备的家居清洁好物,石头自清洁扫拖机器人G20  谷歌推出RT-2视觉语言动作模型,使机器人能够掌握垃圾丢弃技能  特斯拉门店可能启动机器人卖车?也许不是你想的那样  微软AR/VR专利提出使用时间复用谐振驱动产生双极性电源  复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐  论文插图也能自动生成了,用到了扩散模型,还被ICLR接收  Unity 内测 Safe Voice 服务,利用 AI 自动识别玩家不当聊天内容  陈根:ChatGPT和人类合作开发机器人  好莱坞面临全面停摆 好莱坞大罢工抵制“AI入侵”  亲身体验鸿蒙4:AI大模型带来的便利,告别单纯的旁观者状态  为什么很多人对纽约《人工智能招聘法》感到生气?  OpenAI 为开发者推出 GPT 聊天机器人 API 大更新,同时降低价格  世界周刊丨AI“棱镜”?  物联网“僵尸网络DDos攻击”增长惊人,威胁全球电信网络  北京公司实施AI技术,推行4.5天工作制,抵制996文化,提升员工工作幸福感  爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT  绿联发布笑脸屏幕显示充电状态的30W/65W Q湃机器人充电器  特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量  云深处与昇腾CANN携手合作:开设ROS四足机器狗开发训练营  九号公司主导制定短途交通和送物机器人领域首个国际标准,标志着零的突破发布  Moka AI产品后观察:HR SaaS迈进AGI时代  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  美图开拍使用教程  AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司