目前,虽然在人体全身姿态与体型估计(EHPS, Expressive Human Pose and Shape estimation)方面已经取得了很大的研究进展,但是最先进的方法仍然受限于训练数据集的限制
最近,南洋理工大学S-Lab、商汤科技、上海人工智能实验室、东京大学和IDEA研究院的研究人员首次提出了针对人体全身姿态与体型估计任务的动捕大模型SMPLer-X。该研究使用了来自不同数据源的多达450万个实例对模型进行训练,在7个关键榜单上都取得了最佳性能
SMPLer-X不仅可以捕捉身体动作,还可以输出面部和手部动作,并对体型进行估计
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
论文链接:https://arxiv.org/abs/2309.17448
项目主页:https://caizhongang.github.io/projects/SMPLer-X/
凭借丰富的数据和庞大的模型,SMPLer-X在各种测试和排行榜上展现出强大的性能,甚至在未知环境中也具备出色的通用性
在数据扩展方面,研究人员对32个3D人体数
据集进行了全面的评估和分析,以为模型训练提供参考
2. 在模型缩放方面,使用视觉大模型来研究增加模型参数量对性能的提升效果
3. 通过微调策略可以将SMPLer-X通用大模型转变为专用大模型,使其能够实现进一步的性能提升。
综上所述,SMPLer-X进行了数据缩放与模型缩放的探索(见图1),并在32个学术数据集上进行排名,同时在其450万个实例上进行训练,在包括AGORA、UBody、EgoBody和EHF在内的7个关键榜单上均实现了最佳性能
Figure 1 增大数据量和模型参数量在降低关键榜单(AGORA、UBody、EgoBody、3DPW 和 EHF)的平均主要误差(MPE)方面都是有效的
对现有的3D人体数据集进行泛化性研究
研究人员对32个学术数据集进行了排名:为了衡量每个数据集的性能,需要使用该数据集训练一个模型,并在五个评估数据集上评估模型:AGORA、UBody、EgoBody、3DPW和EHF。
表中还计算了平均主要误差(Mean Primary Error, MPE),以便于在各个数据集之间进行简单比较。
从研究数据集泛化性得到的启示
通过对大量数据集的分析(见图3),可以得出以下四个结论:
1. 关于单一数据集的数据量,10万个实例数量级的数据集用于模型训练可以得到较高的性价比;
2. 关于数据集的采集场景,In-the-wild数据集的效果最佳。如果只能在室内采集数据,为了提升训练效果,需要避免使用单一场景的数据
关于数据集的采集,排名前三的数据集中有两个是生成的数据集。近年来,生成数据集展现出了强大的性能
关于数据集的标注,伪标签在训练中也扮演了非常重要的角色
现今最先进的方法通常只使用少数几个数据集(例如,MSCOCO、MPII和Human3.6M)进行训练,而本文研究了使用更多的数据集
在考虑到排名较高的数据集为首选的前提下,我们使用了四种不同的数据量:分别是作为训练集的5、10、20和32个数据集,总大小分别为75万、150万、300万和450万个实例
除此之外,研究人员也展示了低成本的微调策略来将通用大模型适应到特定场景。
上表中展示了部分主要测试,如AGORA测试集(表3)、AGORA验证集(表4)、EHF(表5)、UBody(表6)、EgoBody-EgoSet(表7)。
此外,研究人员还对动捕大模型的泛化性进行了在ARCTIC和DNA-Rendering两个测试集上的评估
研究人员希望SMPLer-X能带来超出算法设计的启发,并为学术社区提供强大的全身人体动捕大模型。
代码和预训练模型已经在项目主页开源,欢迎访问https://caizhongang.github.io/projects/SMPLer-X/ ,了解更多详情
# 进行了
# 都是
# 南洋
# 见图
# 最先进
# 中也
# 较高
# 并在
# 榜单
# ai
# 万个
# https
# 人工智能
# 算法
# idea
# github
# Error
相关栏目:
【
Google疑问12 】
【
Facebook疑问10 】
【
网络优化91478 】
【
技术知识72672 】
【
云计算0 】
【
GEO优化84317 】
【
优选文章0 】
【
营销推广36048 】
【
网络运营41350 】
【
案例网站102563 】
【
AI智能45237 】
相关推荐:
即梦ai能否生成国风插画_即梦ai国风元素调用与文化符号添加【技巧】
DeepSeek网页版怎么用_DeepSeek网页版使用方法详细指南【教程】
SmartEbook AI:下一代电子书创作工具,轻松实现被动收入
百度输入法怎么去除ai模块 百度输入法纯净版安装教程
AI海报设计终极指南:用ChatGPT和ImageFX轻松创建专业级海报
AI语音生成指南:免费工具、变现实战与避坑策略
智谱AI绘画怎么用_智谱AI绘画使用方法详细指南【教程】
使用 ChatGPT 构建自动化 SEO 关键词库
OpenAI Sora 2:AI视频生成新纪元
LTX Studio:AI电影制作平台深度评测与应用指南
豆包Ai官方网页版入口地址_豆包Ai官网在线使用入口
AI赋能!图形设计师必备的顶级AI工具
如何通过 DeepSeek 优化 Kubernetes 配置文件
ChatGPT如何进行数据可视化构思 ChatGPT图表设计指南
教你用AI快速制作思维导图,3步理清所有工作思路
Kaiber AI视频制作教程:轻松打造吸睛AI视频
教你用AI将一段旋律扩展成一首完整的曲子
AI赋能QA:测试管理的未来趋势与实践
135编辑器AI排版怎样快速上手_135编辑器AI排版新手入门与功能介绍【教程】
想做自媒体?教你用AI批量生成视频脚本,实现内容自由
如何用AI帮你创作节日贺卡文案?让祝福与众不同
打造AI Jarvis:停止功能、联网、中文与人脸集成
如何用豆包ai做SWOT分析_豆包ai快速生成个人或企业优劣势分析【指南】
历史影像解密:唇语专家如何还原一战士兵对话?
探索心灵的音乐之旅:Kanwar Garewal的《Ishq Bulleh Nu》
ASUS Armoury Crate深度评测:最新功能与个性化定制
易企秀AI排版如何生成H5页面_易企秀AI排版H5制作入口与组件添加【方法】
智行ai抢票如何查看抢票进度_智行ai抢票进度查询与状态解读【实操】
Removebg怎样快速抠图_Removebg上传图片与自动抠图步骤【教程】
小米汽车OTA冬季大版本升级:新增和优化共计9项功能
极氪回应明年车辆质保权益等问题:部分政策有调整
如何用AI帮你把小说改编成电影剧本?3步掌握核心技巧
Ifor Williams拖车终极指南:农场主的选择和省税秘诀
Vizeo AI视频生成器:无需技术,轻松打造营销利器
DesignGen: 5个AI模型革新服装设计,快速实现创意
Django与React构建AI音乐推荐:数据库集成实战指南
AI 3D建模革命:免费生成高质量模型和纹理
寻宝者的发现:古董探测与文物挖掘揭秘
批改网ai检测工具能否检测引用格式_批改网ai检测工具引用格式检查与修正提示【攻略】
OpenAI ChatGPT Agent:AI自主任务的未来
探索贝奥武夫:英雄史诗的起源、故事与文化意义
雷小兔ai智能写作如何生成文案_雷小兔ai智能写作文案生成场景选择【攻略】
Gemini手机端怎么开无障碍_Gemini无障碍设置方法【步骤】
人脸识别的伦理困境:Massive Attack的演出引发的思考
EcoFlow Delta 3 Max Plus:打造你的智能电力生态系统
AI赋能营销:角色、策略与工具选择全指南
Google Gemini 在跨境电商选品分析中的实战
去哪旅行ai抢票助手怎样添加备选车次_去哪旅行ai抢票助手备选车次设置与切换【攻略】
AI学习秘籍:3个高效黑科技,解锁智能学习新时代
揭秘颜值真相:社交实验的背后,你是几分?
2023-10-30
南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。