发布时间:2025-02-18
点击次数: 科学家们开发了一个新的基准测试——tomg-bench,用于评估大型语言模型 (llm) 在分子领域的开放域生成能力。该基准测试旨在弥补现有分子-文本数据集的不足,更准确地评估 llm 在实际分子设计中的应用潜力。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

项目资源:
挑战与机遇:
传统的分子发现方法效率低且成本高。虽然图神经网络 (GNN) 等 AI 工具展现出潜力,但其泛化能力和生成特定性质分子结构的能力有限。LLM 强大的语言理解和生成能力为分子发现带来了新的机遇,但分子与文本数据的对齐仍然是一个挑战。现有数据集通常是目标导向的,无法满足化学家在实际工作中对模糊需求的多种解决方案的生成。

TOMG-Bench 的设计:
TOMG-Bench 旨在评估 LLM 在开放域分子生成中的能力,更贴近实际应用场景。它包含三个主要任务,每个任务又细分为三个子任务:
每个子任务包含 5000 个测试样本,提供全面的性能评估。

数据生成和评估指标:
TOM
G-Bench 使用 Zinc250K 数据库和随机生成的方法创建测试用例。评估指标包括成功率、相似性、有效性以及新颖性(针对 MolCustom 任务)。为了综合评估,引入了平均加权成功率指标。
MedPeer科研绘图
生物医学领域的专业绘图解决方案,告别复杂绘图,专注科研创新
166
查看详情

OpenMolIns 指令微调数据集:
为了提升 LLM 的性能,研究人员还开发了 OpenMolIns 指令微调数据集,包含不同规模的数据,涵盖所有九个子任务。

实验结果与发现:
实验结果表明,开放域分子生成任务具有挑战性,即使是先进的 LLM 也存在局限性。开源模型的性能正在快速提升,模型能力与性能正相关,数据规模也对性能有显著影响。TOMG-Bench 揭示了 LLM 在分子领域的优势和不足,为未来的研究提供了方向。
排行榜 (Leaderboard):
TOMG-Bench 提供了模型性能排行榜,方便比较不同 LLM 的表现。
总结:
TOMG-Bench 为评估 LLM 在开放域分子生成能力方面提供了一个重要的基准,推动了 LLM 在分子发现领域的应用和发展。其开源的数据集和测试脚本为研究人员提供了宝贵的资源。
以上就是TOMG-Bench:大语言模型开放域分子生成新基准的详细内容,更多请关注其它相关文章!
# llm
# 广义网站优化在哪里
# 日照网站推广营销
# 奶茶店加盟网站推广营销
# 浦城专业seo公司
# 吉首网站seo优化
# 海外seo有哪些优势
# 带来了
# 相关文章
# 在实际
# 开发了
# 分子结构
# 是一个
# 祝福语
# 开源
# 内测
# 一言
# ai
# 工具
# git
# 产业
# 山东市场营销推广方案
# seo新媒体怎么推广
# 朝阳区环保市场营销推广
# 汝阳网站优化报价公司
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资
能抓取玻璃碎片、水下透明物,清华提出通用型透明物体抓取框架,成功率极高
借力AI!PCB全球巨头,有爆发潜质吗?
Meta发布音频AI模型,仅需2秒片段模拟真人语音
印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
科学家称,面对人工智能,人类未来或只有灭亡与虚拟永生两个选择
消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像
构建AI绘画网站的方法:使用API接口和调用步骤
「从未被制造出的最重要机器」,艾伦·图灵及图灵机那些事
人工智能如何帮助制造业?
中国AI公有云市场2025年逆势蓬勃增长,增速高达80.6%
当TS遇上AI,会发生什么?
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
值得买科技入选“北京市通用人工智能产业创新伙伴计划”应用伙伴
抢占新赛道 加快机器人产业集聚发展
百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧
随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
当孔子遇见AI|尼山的“数字”
人工智能快速发展 打开就业新空间
国内首家,360智脑通过中国信通院可信AIGC大语言模型功能评估
乐天派桌面机器人加入小米米家生态系统,实现与其他智能设备的互联
DreamAvatar数字人使用教程
杭州举办第19届亚运会,主题为「亚运元宇宙」的发布仪式举行
探展WAIC | 第四范式“式说”聚焦toB大模型,布局生成式AI重构企业软件
Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代
创新科学家成功研发FAST激光靶标维护机器人
360发布认知型通用大模型“360智脑4.0” 全面接入360全家桶
全新“AI助手”!讯飞星火助手中心人机协作共创新生态
Meta推出VR订阅服务Quest +:每月免费玩两款游戏,7.99美元/月
鹅厂机器狗抢起真狗「饭碗」!会撒欢儿做游戏,遛人也贼6
高质量数据推动AI场景化应用快速发展及落地
当科幻走进现实 脑机接口新技术能为生活带来哪些惊喜?
工信部信通院发布《2025大模型和AIGC产业图谱》 360智脑覆盖全产业链
揭示经济学论文写作中提高效率与质量的AI助手应用策略
Spotify计划推出AI驱动的音乐播放器功能
丰田汽车研究院推出生成式人工智能汽车设计工具
智能电网技术:提高能源效率和可靠性
音乐制作元工具AudioCraft发布开源AI工具
周星驰支持的人工智能与 Web3 初创公司 Moonbox 完成 100 万美元融资
你们的开机第一屏画面要变了!安卓机器人首次3D化
“可用”“有用”的讯飞星火认知大模型将亮相世界人工智能大会
泗洪:畅通城市“血管” ,管下机器人来帮忙
2025智源大会AI安全话题备受关注,《人机对齐》新书首发
全场景智能车:智能无处不在|芯驰亮相世界人工智能大会
你大脑中的画面,现在可以高清还原了
从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级
7/8上海 | 2025世界人工智能大会分论坛:科技与人文-共筑无障碍智能社会
出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案
人工智能赋能无人驾驶:商业化进程再提速
焊接协作机器人或将成为26届埃森展最大看点