准确率超过全球最优方法SOTA,识别效率提升近6倍——
万翼科技在2024年发布了矢量图识别模型SymPoint的研究论文被2024国际顶级AI会议ICLR收录。ICLR会议由深度学习三大巨头之二的Yoshua Bengio和Yann LeCun牵头创办,在最新的谷歌学术期刊和会议影响力排名中位列计算机学科前列。

SymPoint:直接支持矢量图的深度神经网络,让图纸识别准确率和效率得到大幅提升
通用的大模型在识别图纸时,通常将CAD图纸转为图像处理,无法充分利用矢量图元的几何特征与连接关系,且依赖繁琐的后处理,导致误差累积与效率低下。
万翼创新研发的SymPoint模型,采用端到端架构,以Transformer为骨干网络,结合创新的连接注意力机制,直接读取并理解图纸中的线段、圆弧等图元信息,输出语义化的识别结果。
在公开数据集测试中,该模型在精确目标检测(AP75)任务上比基于图像的先进模型准确性提升10.2%,且运行速度较现有矢量识别模型提升近6倍。此外,SymPoint无需后处理即可输出图元级结构化信息,为智能审图等下游工程应用提供了高效可靠的技术基础。
基于独家的AI图纸识别技术,万翼实现大语言模型与工程图纸的智能交互
万翼推出的智能识别CAD图纸的建筑大模型解决方案“卓灵”:不仅运用独家的AI算法集对混合模态的图纸进行识别和语义理解,更通过自研图纸RAG技术,实现从海量的多模态数据中快速检索到最相关的信息,进而生成更加准确、有据可依的回答。
不再需要耗费大量时间精力,手动搜索层层叠叠的本地文件夹、图纸、表格、文档,用户能够以简单的问答方式,快速掌握图纸上的数据信息。
不仅如此,卓灵还能回答图纸上所存在的规范问题、关联的工艺做法等。
案例1:“请问本图有没有违反消防强条的问题”,卓灵将快速给出判断答案,并标注出图纸中全部违反该条规范的地方。

案例2:例如“请问入户门与电梯门是否正对”,卓灵将在图纸中快速识别入户门和和电梯门,并判断两者的空间关系。

案例3:例如“开向阳台的门宽度小于800时不利于搬运洗衣机等,本图是否存在此问题?”卓灵将识别开向阳台,以及阳台门的宽度,并与规范进行融合解析,智能判断是否合规,并自动圈出问题在图上的对应位置。
更多“开箱即用”的业务应用场景

万翼图纸大模型技术能力,已在审图、图纸管理协作、工地数据采集和空间资产可视化等建筑产业链条的业务场景中得以应用:
在审图方面,AI实现将非结构化的设计图纸转化为结构化的建筑构造描述,从而实现自动化的规范审查。平均每个项目可发现1000+个问题,审图效率是人工的7倍。
AI审图入选国家住建部“智能建造与新型建筑工业化协同发展可复制经验清单(第一批)”,并获得国内建筑领域最高科技奖,二〇二二年度“华夏建设科学技术奖”。

在图纸管理协作方面,AI可实现按图纸按专业/子项/图名/图号进行自动整理,图纸查找效率提升6倍以上,支持详图跳转、图纸对比、问题验证等一系列全新能力。
该产品近期更通过深圳市工程建设领域科技计划项目验收。

在空间资产可视化方面,通过图纸识别和自动化建模实现空间资产可视化,帮助运营人员监测产能转化效率、挖掘资产潜力、提升运营管理水平。资产数据录入效率提升30倍。
该智能建模软件,近期也通过深圳市工程建设领域科技计划项目验收。

在工地进度识别方面,从图纸中自动识别楼栋、楼层、层高等信息,与现场无人机等航拍点云模型拟合后,实现现场工程进度自动计算获取。

未来,万翼将坚持以业务实用为目标,不断迭代系列算法,并与大模型Agent做更多融合,提供更多智能解决方案。