neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose – 基于 Transformer 架构的人体姿态估计模型

ViTPose 是基于 Transformer 架构的人体姿态估计模型。以普通视觉 Transformer 作为骨干网络,通过将输入图像切块并送入 Transformer block 来提取特征,再经解码器将特征解码为热图,实现对人体关键点的精准定位。
16 0 2025-08-31