我读过官方教程RealtimeNumberReader,,它使用AVCaptureSession和一个特定的函数layerRectConverted,它只用于AVCaptureSession将坐标从包围框转换为屏幕坐标。
let rect = layer.layerRectConverted(fromMetadataOutputRect: box.applying(self.visionToAVFTransform))
现在我想识别ARFrame's 上的文本,然后在屏幕上显示绑定框。可以吗?
我知道如何从正式的中识别单个图像上的文本,我的问题是如何将规范化的框坐标转换为视口坐标。
请