在 Vision 中检测动物体态

更多视频

在 Vision 中检测动物体态

除了检测图片中的猫和狗，我们还将向你展示如何使用 Vision 实时检测动物的单个关节和它们的体态，以及如何实现一些令人激动的功能，例如使用相机 App 进行动物跟踪，为动物图片应用创意装饰等。我们还将深入探讨 Vision 框架中的其他重要更新，并与你分享最佳实践。想要了解更多有关 Vision 框架新技术的信息，欢迎观看“探索 Vision 中 3D 人体姿势及人像分割”以及“在 App 中提取图片主体”。此外，想要了解更多有关构建实时相机追踪的体验，欢迎观看“使用 DockKit 集成电动 iPhone 支架”。

资源
- Vision
- - 高清视频
  - 标清视频
相关视频

WWDC23
- 使用 DockKit 与电动 iPhone 支架集成
- 在 Vision 中探索 3D 人体位姿和人像分隔
下载

♪ ♪
Nadia Zouba：大家好欢迎观看本次讲座我是 Nadia Zouba 一名 Apple Vision 团队的成员今天我将谈谈 Vision 中一个令人惊叹的新 API：Animal Body Pose 并对 Vision 中一些重要的更新进行回顾我们首先从 Animal Body Pose 开始 Animal Body Pose 可用于多种应用场景想象一下你将猫或狗单独留在家里然后出门上班在你下班回来的时候发现家里一片狼藉不用担心 Vision 框架可以帮你搞清楚发生了什么你的宠物一整天在干些什么以及是谁让家里变得一团糟但在深入探讨这个话题之前我们先来谈谈姿势三年前 Vision 引入了 Human Body Pose 来检测人体姿势该请求可对多达 19 个身体关节进行检测然后生成一个人体关键点的集合得益于该 API 世界各地的开发人员得以在健康、健身等领域创造出大量实用的 App 由于 Vision 会与现实世界发生交互因此我们不仅关心人类同时也很关心动物如今 Vision 已具备了用于识别动物的请求并可以实现对猫和狗的检测和识别该请求会生成一个包围盒同时带有一个标签表明识别到的动物及置信度如果你想对动物进行定位和识别该 API 的效果会相当不错但如果你想要深入了解这只动物呢？要推断出动物在做什么并不容易例如如果我在替邻居照顾狗那么我便需要了解邻居家的狗想吃零食或想要散步时的特定体态你猜怎么样？Vision 不止可以识别人类姿势还可以拓展到识别动物的这很棒
Animal Body Pose 是 Vision 中一个全新 API 在 Vision 中其可通过 DetectAnimalBodyPoseRequest 发出请求该请求一旦经过处理便会返回一个观测结果其中会包含一个动物身体关节位置的集合该请求可以支持猫和狗并会对包括尾巴和耳朵在内的 25 个动物身体关键点进行检测
当前 Animal Body Pose API 在 iOS 17、iPadOS 17、 tvOS 17 及 macOS Sonoma 中均可使用你可以向 Animal Body Pose 输入图片或者视频该请求在 Vision 中经过创建和处理后便会产生一个关节集合用于确定动物的骨架 Animal Body Pose 共定义了 6 组关节： Head 组包含了耳朵、眼睛和耳朵；
Forelegs 组包含了前腿；你猜对了 Hindlegs 组包含的是后腿； Trunk 组包含了颈部； Tail 组包含了 3 个尾关节；最后 All 组包含了所有的关节
为了形象展示以上全部内容接下来我会使用示例 App 根据关键点的位置来绘制动物的骨架我的桌子上有只可爱的小吉娃娃玩具狗因为该玩具狗可以移动所以我会利用其呈现示例 App 的效果接下来我会把该玩具狗放到手机摄像头前然后启动示例 App 可以看到 App 在该动物身上绘制了一幅骨架我们打开电源让玩具狗走起来
可以看到骨架便会随着该动物的移动而移动哎呀！玩具狗离摄像头越来越远了我们将其重新放回到摄像头前
骨架仍然会随着玩具狗的移动而移动效果真的很不错接下来我会通过代码向你展示示例 App 是如何编写的
首先我们从捕捉输出开始在这里我们会接收来自相机视频流的 CMSampleBuffers 第一步创建请求在这里我会使用 VNDetectAnimalBodyPoseRequest
下一步使用 imageRequestHandler 创建请求处理器
接着调用执行向处理器提供请求如果请求执行成功 VNAnimalBodyPoseObservations 将会在请求结果属性中返回并且每个返回都会包含关节位置为了能够从 Animal Pose Observation 中访问这些关节我会调用 .recognizedPoints 来请求获取关节组中已识别关节点的字典由于绘制动物的骨架需要所有关节在这里我会使用 All 组但如果你只需要访问部分动物关节那么只使用你需要的关节组即可最后为了绘制动物的骨架我会遍历所有已识别的关节点并将关节进行连接这里是一个连接头部关节绘制头部骨架的例子
此外你需要注意这样几点在使用新 Animal Body Pose 时你在一张图片中最多只能检测到两只动物输入图片的长宽都必须至少为 64 像素并且使用神经网络引擎可以让输出效果和实时捕捉保持同步接下来我们通过几个例子来看看 Animal Pose 可以做些什么在使用新 Animal Pose API 处理静态图片时你可以按照自己的方式分析关节以识别自家动物的有趣体态例如起床后的伸展……
站立讨食……
遇到狗后的逃跑……
或是蜷缩起来打个小盹儿
正如我之前提到的 Animal Recognition 可让你定位并识别动物而 Animal Body Pose 则可以返回动物身上所有的关键点结合这两个请求你便可以在检测到动物之后知晓动物的种类、所处的位置以及当前的体态现在你便可以知道打乱餐桌的是谁了基于此你还可以为你的宠物开发出许多有趣的 App；例如由动物识别和动物体态检测共同触发的狗粮喂食机此外 Animal Pose API 也可用于处理视频你可以在 App 中引入自己的算法来分析并确定动物当前的行为甚至你还可以对动物体态进行一段时间的跟踪从而了解动物行为的意义直到我使用了 Animal Body Pose 我才知道墙面上的痕迹不是孩子留下的而是猫尝试抓住激光点留下的
哇这只狗的滑板技术比我的还好！另外你还可以利用该技术借助摄像头实现对动物的跟踪想要进一步了解有关此类跟踪的信息欢迎观看 “使用 DockKit 与电动 iPhone 支架集成”讲座同时你也可以为宠物编写有趣的 App 例如给狗戴上帽子和墨镜使用这张图片为宠物的生日制作可爱的卡片并发送给家人和朋友你难道不觉得非常有趣吗？生日快乐 Frenchie 先生！选择相关 Animal Body Pose 关节并贴上表情符号这张图片便可大功告成我会用身边这只可爱的玩具狗来演示一下这个表情符号 App 使用相同的示例 App 并将骨架视图切换为表情符号视图
因为这只小狗走得很慢所以我在其爪子关节上添加了一双溜冰鞋表情符号为其移动进行加速哦等等安全第一！让我们回到代码为其添加一个头盔我已经在这里给爪子关节添加了溜冰鞋表情符号接下来让我们在耳朵关节上添加一个头盔表情符号我可以选择表情符号的大小和方向我们还可以添加一副眼镜让其滑起来更帅
在考虑完小狗的安全后我再来运行一下该 App 小心点总是没错的让我们切换到表情符号视图现在这只狗便有了安全滑行所需的所有装备看起来很酷对吗？快跑小狗快跑！你可以做到的！以上就是 Animal Body Pose 的全部内容我非常期待你可以利用新 Animal Pose API 为 App 引入你想创造的一切有趣内容此外 Vision 中可能还有一些对你有用的更新所以我来为你介绍一下新 Stateful 请求便是其中之一在 Vision 中基于 VNTargetedImage 的请求可作为 Stateful 请求进行使用
Vision 共有 3 个新派生的 Stateful 请求并均以 Track 动词命名因此利用其进行跟踪会更加轻松简便我很高兴向你宣布 Vision 现已支持 MLComputeDevice 使用新 Compute Device API 你可以查询请求执行的位置并指定使用的设备 Core ML 和 Create ML Multilabel Classification 现在也可以与 Vision 兼容从而使你可以训练支持多种标签的分类器想要了解更多信息欢迎观看 “了解 Create ML 中机器学习的新技术”讲座此外现有的请求经过修订后也得到了很大的改进针对条形码发布了新的修订版本也就是 Revision 4 该新版本加入了新 MSIPlessey 符号并支持反色二维码顺便提醒你一下 Revision 1 即将被弃用并且文本识别还将新增对泰语和越南语的支持
最后 FaceCaptureQuality 也发布了新的修订版本 Revision 3 用于提高质量和准确性想要了解更多有关 Vision 中的最新更新请查看开发者文档今天我介绍了新 Animal Body Pose 以及使用该 API 可以实现的奇妙功能此外我还介绍了一些重要 API 的更新以及 Vision 中对你的开发可能有所帮助的新技术但等等还不止这些欢迎观看“探索 Vision 中 3D 人体姿势及人像分割” 了解 Vision 中新的 3D 人体姿势和人像分割 API 如果你想对任意选择的前景物体进行分割欢迎观看 “从 App 中的图像中提取主题”讲座感谢你的观看期待你使用 Animal Pose
正在查找特定内容？在上方输入一个主题，就能直接跳转到相应的精彩内容。

提交你查询的内容时出现错误。请检查互联网连接，然后再试一次。

资源

相关视频

WWDC23