腾讯推出PDF识别神器：复杂文档解析准确率超98%-趣考网

6月21日消息，腾讯云大模型知识引擎新鲜出炉，它有一项新能力——大模型知识引擎文档解析！

基于腾讯优图实验室自研新一代多模态文档解析大模型，它能先通过版面分析定位文档所有内容的位置和类型，再对文本表格公式等内容进行精准识别，最后按照我们人类的阅读顺序输出连贯可读的内容。

比如，面对带表的PDF文档，特别表格没有框的，它能通过融合行列关系特征和元素特征来预测表格的行列间隔线。

算法能推理并对表格数据和结构进行正确复原，极大提高识别准确率。每次复制表格都数据错位的人有福了！

不仅中英文，它还支持20+语言，以及繁体字、生僻字等多种类字体。

更惊喜的是，它还支持将识别后的图片、PDF文档转换为Markdown格式输出。

腾讯表示，大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。

目前，这项文档解析功能已在多个产品上线，大家也可点此在线体验。

文章内容举报

本文转载于：快科技，仅供信息分享，无其他用途

本文中引用的各种信息及资料（包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主体（包括但不限于公司、媒体、协会等机构）的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理！

THE END