开放世界探索演练场:
首轮上线
面向AI2.0的新一代OCR技术
登陆网址 https://ocr.gpu.transcengram.com/ 即可开启试用。
OCR技术在自动化、数据录入和图像分析等领域有广泛应用,也是机器与真实开放世界接触与交互的重要基础能力之一。我们正致力于打造以视觉感知和运动控制为基础的多模态世界模型。为此,我们必须让机器以更像人类的方式与能力去阅读文本信息。这意味着需要一种新的OCR技术,这种技术必须更加通用,不仅要具备文字识别能力,还必须具备公式表格识别能力、多格式信息兼容能力、多场景区域检测能力、区域内容理解能力以及阅读顺序优化能力等等。本次上线的面向AI2.0的新一代OCR技术正是因此应运而生。
未来我们还将陆续在开放世界探索演练场上线更多技术能力,敬请期待。