《1、 引言》

1、 引言

尽管计算机视觉在建筑中的应用各有不同,但研究往往集中于测量目标检测器的准确度,如更快的循环卷积神经网络(faster R-CNN)和单次探测器算法(SDD)[1]。在建筑领域,人们着重关注计算机视觉这一技术在快速准确探测问题方面的优势[23]。那么,除了这一优势外,计算机视觉在建筑中还有其他何种作用?

建筑方面的研究很少涉及组织如何能够有效地管理和使用计算机视觉,从而在运营中实现效益的问题,文献中也没有相关介绍。现在,人们越来越需要了解计算机视觉以及其他人工智能(AI)技术的确定和不确定的益处和弊端,以便可以有效地利用这些技术来创造商业价值和提高管理水平[4]。尽管许多软件供应商宣称在建筑中使用计算机视觉有显而易见的益处,例如,包括提高生产效率和安全性能,增强质量测量,大幅提高项目的盈利能力,但目前仍没有证实这些说法。

更值得注意的是,在建筑中,各种研究所使用的训练算法的数据集非常小,使得研究结果类似于“概念验证”。在这种情况下,过度拟合就成为问题。虽然采取了措施解决这一问题(例如,通过数据增强、特征选择、交叉验证、正则化和集成等方法),但在这种情况下,小数据集会被操纵以处理问题。Paneru和Jeelani [2]证实了小数据集的问题,并观察到为产生可靠且有效的输出,所需的“针对于训练不同神经网络的建筑环境的可视化数据集的缺失”。尽管迄今为止人们已经进行了许多关于计算机视觉的研究,但在我们开始实现其效益前仍需应对许多挑战(例如,隐私问题,获取优质数据,数据融合,语义理解的提取等)[23]。

本文呼吁计算机视觉研究开始参与效益实现管理(BRM)策略,在科学的基础上,帮助加快投资合理化进程以及建筑施工组织对该技术的采用。如果不这样做,可能会因为无法将其效益转为实践而导致建筑施工组织对计算机视觉的幻想开始破灭[4]。因此,建筑施工组织必须了解为什么以及如何获得计算机视觉效益,以免遭受“红皇后效应”(Red Queen effect),即企业必须不断前进,否则就有落后的风险[45]。

《2、 效益实现管理——管理变化》

2、 效益实现管理——管理变化

信息系统文献大多研究的是检验BRM策略的作用以及相关方法。有许多对BRM的定义,其中,的定义既简洁又全面,将BMR定义为“一个组织和管理的过程,以便真正实现变革投资所带来的潜在效益。”因此,在本文中有两个问题需要考虑:①建筑施工组织如何从投资计算机视觉应用中获得商业价值;②建筑施工组织是否具有实现计算机视觉效益的资源能力?

回答这些问题是很具有挑战性的,主要是因为,尽管该领域已发表了大量的文献,但计算机视觉在建筑业尚未发展起来。建筑信息模型(BIM)也存在类似的问题,Love等[7]利用基于资源的理论开发了一个BRM架构,以确保效益可以在建筑领域内实现。支撑这个架构的是被认为可以提供商业价值的四项关键的主题:①一致性(即我们是否在做正确的事情?);②整合(即我们是否以正确的方式进行?);③能力(即我们是否把事情做好?);④效益(即我们获得效益了吗?)。我们建议以Love等[7]开发的BRM构架作为基础,用以决定建筑施工组织如何能够从计算机视觉带来的发展中创造价值。该架构已经被用于确保组织认识到使用系统信息模型带来的益处[45]。

变化管理是BRM固有的特征[4]。但是,在建筑中使用计算机视觉改变工作实践和步骤所产生的影响尚未得到解决,虽然缺乏实证,但有一种假设认为这样做将解决其所要解决的问题。另外,研究并未考虑在建筑中采用计算机视觉的效益、花费(直接和间接)和风险。不进行改变(例如,在人们的行为和工作实践方面)则无法实现计算机视觉的益处,同时没有益处的改变也无法持续。此外,如果建筑施工组织不进行某种形式的投资合理化解释,他们是不适合对计算机视觉进行财务投资的。这同样适用于任何可能采用的技术,包括增强现实技术(AR)、BIM、区块链和机器人技术。尽管如此,人们却很少注意建筑技术的投资合理解释,即使有,也只会关注传统评估技术,如“投资回报”[4]。

例如,许多用于检查安全性的计算机视觉应用倾向于识别人员是否穿戴个人防护设备,是否进入正在操作重型设备的危险区域,或提取重型设备时的姿势是否正确[3]。事实上,在发现此类行为后,需要改变行为以免这些行为再次发生,然而,研究并没有解释如何有效地实现此类检查。

当提出某项技术解决方案时,需要考虑相应的时间变化,但这在基于计算机视觉的建筑研究中被忽视了。这就是说,许多为提高建筑生产率和性能而提出的技术解决方案都缺少相应的实践改变[4]。建筑行业生产率低下的原因有很多,然而,由于企业无法适应和应对工作实践和流程的变化,这些变化通常会受到技术应用的影响,从而使这一问题变得更加严重。

在过去十年中,我们已经看到过很多研究侧重于应用计算机科学中发展出来的算法,其主要面向建筑问题中的目标检测准确性问题。事实上,在建筑行业发表的无数论文中,很少看到(如果有)新的目标检测算法的传播,以支持计算机视觉的使用。相反,通常只能看到对目标检测器[如卷积神经网络(CNN)]的超参数进行修改。

虽然检测精度可能会略有提高,但这并不能帮助建筑施工组织证明和理解如何在实践中使用计算机视觉应用,以便创造商业价值。如果除了利用计算机视觉进行“目标检测”及其与其他技术(如AR和BIM)融合之外没有取得任何进展,那么研究就会止步于“那又怎么样?”的范畴。我们必须使用技术来解决实践中遇到的问题,而不是为并不存在的或通过其他手段可以解决的问题提出解决方案。正如所说,“成功解决问题要求为正确的问题找到正确的解决方法。我们总是失败,是因为我们解决错了问题,而不是因为我们为正确的问题做了错的解决方案。”

《3、 计算机视觉研究——向前迈进》

3、 计算机视觉研究——向前迈进

毫无疑问,计算机视觉可能从整个资产生命周期的各个方面为组织带来生产力的提高和性能优势。同样,其也存在弊端,特别是有关数字安全、数字隐私及现场硬件限制(即过度依赖边缘计算设备)的方面。然而,缺乏扎实的实证背景阻碍了在建筑中采用计算机视觉。如果要建筑施工组织认识到使用计算机视觉的益处,务必要考虑以下五项要素[9]:

(1)仅仅是具备了计算机视觉技术并不能带来任何效益或创造任何价值。采用计算机视觉成本很高(例如,需要边缘计算),并且只有通过使用它才能实现效益。

(2)当计算机视觉能让组织及其人员以不同的方式做事,其效益就体现出来了。

(3)效益来自于人们在工作中的改变和创新,所以只有业务管理者、用户和客户才能够做出这些改变。

(4)使用计算机视觉可能产生不良后果,甚至可能给组织的竞争地位带来负面影响。

(5)人们必须积极管理效益,这样才能获得效益。如果建筑施工组织不能认真规划,防范已知陷阱,计算机视觉的效益就无法体现出来。

本文建议将研究的重心从解释为何我们应当使用计算机视觉(毕竟这些现在已经被很好地理解和记录下来了),转移到如何确保计算机视觉能为建筑活动和整个资产生命周期增加价值[4]。要解决“如何做”的问题确实是个挑战,据我们所知,只有一少部分建筑施工组织(如日本的大林组和瑞典的斯堪斯卡集团)有将计算机视觉技术用做其日常运营一部分的意愿(如在安全领域)。我们还注意到,有些建筑施工组织正在与大学合作对计算机视觉在各种程序和任务中的应用进行实验,但并未对其效益进行量化,也未提出将其用于备选。在这些情况下,可以考虑通过量化已获得的效益(如生产率的提高)并记录工作实践的改变来对比“旧的”和“新的”工作方法。

尽管通过实验研究对比新、旧工作方式可以开始并为采用BRM定下基调,但我们建议研究应该侧重于支持组织制定采用计算机视觉技术的策略。制定BRM策略的过程一般包含5个阶段,Love和Matthews [4]对此进行了记录:①确认并建立效益架构;②规划效益实现;③执行效益实现计划;④评估并审核结果;⑤发现更多潜在效益。此方法易于识别和管理效益(有形和无形)、成本(直接和间接)、风险及实践中的变化。BRM并非一个新的概念,它已在技术相关领域广受肯定。然而,BRM被建筑领域研究人员所忽略,因为人们本能地认为,数字技术将提高生产率[4]。这一假设非常值得怀疑,因为要解锁数字技术的效益通常需要变换工作场所并重新设计流程。

《4、 结论》

4、 结论

通过对大量的建筑领域计算机视觉文献的粗略回顾,发现人们对该领域研究的兴趣越来越浓厚。建筑行业文献中缺少证明该技术优势的经验证据。建筑施工组织需要此类证据来证实投资计算机视觉技术的合理性,并确保其有助于增加他们的竞争优势。这一空白为本文提供了动机,同时也号召研究人员以及实践人员抓住机会,填补计算机视觉研究中缺失的BRM空白。

最后,我们需要实证研究来证实计算机视觉的效益,否则,建筑施工组织无疑会问:“那又怎样?”目前,尽管我们反复听到软件供应商夸赞,说在AI的加持下,计算机视觉可以改变实践,为建筑带来性能和生产率的提高,但使用计算机视觉的明确益处在文献中却找寻不到。