Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

数据细节问题 #13

Open
zhLawliet opened this issue May 31, 2021 · 11 comments
Open

数据细节问题 #13

zhLawliet opened this issue May 31, 2021 · 11 comments

Comments

@zhLawliet
Copy link

你好,很感谢提供了3dpw和hm36的标签,这里有几个疑惑。
关于pw3d:
企业微信截图_32b5d1a3-7cb3-4008-a212-208862945352
问题1:为什么使用的betas是annots_hmrvideo的而不是pw3d原始提供的beta;
问题2:label['cam_rotation_matrix'] = raw_labels['cam_poses'][j,:3,:3] ,看你的centerHMR,这个相机外参矩阵应该是乘以到pose的global_rotation。在进行最终的监督时,不要单独监督这个相机外参。但是看你最终返回的dataset,好像没有使用这个相机外参。
企业微信截图_4a156cd0-728c-4817-8d1f-002b30113ae8
所以这里的pose,其实没有对global_rotation做额外的处理?

@zhLawliet
Copy link
Author

zhLawliet commented May 31, 2021

关于hm3.6
企业微信截图_b0a32587-d2d4-4608-904e-71faa2304750
1 每一张图对应上面的标签,这里cam,pose,trans,都有三个值,再使用的时候,代码里面是随机选择的,是不是说明这三组数据差不多?

2 同理pw3d,关于pose的处理,这里发现直接将info['cam']赋值给了pose:pose[:3] = root_rotation。所以很困惑,上面的pw3d的pose[:3] 是原始的global_rotation,而这里的pose[:3]被赋值了info['cam']。他们是等价的吗?如何我要使用这个数据集,那么这个cam * pose[:3] 跟canterHMR输的的pose[:3]才是等价的?
image

@Arthur151
Copy link
Collaborator

Arthur151 commented May 31, 2021

对于前两个问题,因为DSD这篇文章的主要competitor就是HMR-video,所以采用和它一样的GT用于评测,主要用于性能对比。所有的设置都是为了与HMR-video的设置保持一致的。

关于h36m数据集,因为每一帧都是按照每五帧采一帧下采样出来的,每一帧有3个SMPL参数是3个真正临近帧的SMPL,随机采样是为了避免过拟合,因为真正临近帧动作基本一致。

对于3DPW数据集的处理还是建议看ROMP的相关部分代码

@zhLawliet
Copy link
Author

好的谢谢

@Arthur151
Copy link
Collaborator

Arthur151 commented Jun 1, 2021

我这里2D pose对的挺好的呀,没什么问题。
575_S11_Discussion 1_3_462 jpg_centermap
我好像是丢弃了每个视频前15帧,应该是整个采样平移了5为倍数的帧数,你可以试一下。具体的太久远,忘记了。。。

@zhLawliet
Copy link
Author

好的,谢谢,我这边实验应该是丢弃了第一帧之后,再整个采样平移了5为倍数的帧数。采用cv2.VideoCapture默认帧率进行抽帧。

@Arthur151
Copy link
Collaborator

恩恩,我中间迭代了几版,都忘记怎么搞得了。方便把数据处理代码(图片抽取)开源给大家么?

@zhLawliet
Copy link
Author

好的,我整理一下,发出来

@Arthur151
Copy link
Collaborator

Thanks for your time and contribution to this respository.

@zhLawliet
Copy link
Author

zhLawliet commented Jun 2, 2021

h36m_preprocess_video.py.zip
目前通过这个视频抽帧脚本(每一个视频完成解码,5倍采样,舍弃采样得到的第一帧),完成了S11和S9抽帧并验证,其中每一个视频完成抽帧验证,发现基本都是对的。
但是其中S9_Greeting_[0|1|2|3] 好像平移不对
如下图:
image
image

除了S9_Greeting_这个动作视频有问题,其他S9和S11的视频基本都是对的:
image
image

@Arthur151
Copy link
Collaborator

Arthur151 commented Jun 2, 2021

感谢!
我也发现有平移的问题了。貌似是ground truth本身有问题。但不影响3D pose 评测。
S9通常protocol里都只用来作为test set,不能用于训练的。

@zhLawliet
Copy link
Author

嗯,谢谢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants