建城学术 |青年学者论坛第33期:AIGC新时代的建筑学视野

发布时间:2023-07-06

      2023年6 月13日 14:00-16:30,南京大学建筑与城市规划学院第33期青年学者论坛—— “AIGC新时代的建筑学视野”在线上线下同时举行,论坛由召集人之一建筑系助理教授梁宇舒主持,参会总人数达200余人。此次论坛邀请了美国加州大学伯克利分校在读博士生庄新伟、美国德州奥斯汀建筑AI设计在读博士生刘紫东、芬兰阿尔托大学在读博士生钟喜明、我院建筑系在读博士生燕海南四位主讲者,并由南京大学建筑与城市规划学院童滋雨教授与主讲人进行评述与对谈。此外,我院唐莲副教授、孟宪川副研究员也参加了论坛。与会嘉宾以AIGC新时代的建筑学视野为主题,深入讨论了应用生成式神经网络、图像大模型、图神经网络和序列神经网络等对建成环境的塑造,以及在当代人工智能视野下对于建筑的思考。


报告一

《应用生成式神经网络进行性能驱动的建筑设计》

Synthesis and generation for 3D architecture volume with generative modeling

|报告人:庄新伟(线上)|


      庄新伟认为,最初的动机其实是如何学习城市的潜在特征。比如说我们提到巴黎会有一个大概的印象, 什么使巴黎成为巴黎?我们在说一个城市,提到巴黎的时候说的并不是卢浮宫或者埃菲尔铁塔,而是会想到是建筑的立面上面的一些构件,或者说它们独特的路灯结构之类。比如说这11张照片就可以让人们觉得好像建筑是在巴黎的,因为它各种各样的建筑特征。



      但建筑师并不是生活在二维世界,所以如何用3D数据去解决这个问题呢?首先我们没有足够的数据,另外建筑的复杂度很高。如何去解决这两个棘手的问题。第一个是数据收集,另外就是数据编码的过程。所以我们需要找到如何把cad 模型变成可以学习到的数据结构。在这里我选择了两种数据进行测试,一个是voxel,一个是implicit surface。

       SDF的好处有两个,一个是它是梯度,就是它并非是0、1这种二进制数据,有很多的梯度可以让省电网络去学习。第二个好处是它对数据点的要求很低。


      我们最初的目的是学习整个城市的隐含特征,并通过降维的手法,从比如说5万个点它表示一个建筑,降到一个高维空间。当我们有能力去做重建,把一个建筑压缩成1乘200的数据点,再把它重建到一个高维建筑之后,我们就可以说这个网络学习到了一些潜在的建筑特征。


       新建筑的生成过程有两种方法,一种是取样,另一种是差值。


      这篇文章目的是为了去学习城市的隐式特征。它有三个比较突出的贡献,一个是决定了在建筑领域中什么样的数据结构形式是比较适合三维建筑学习,第二件贡献是引入了隐式学习去做衍生设计,最后一点贡献是我提出了两种生成方式,一种是sampling采样,一种是interpolation插值。



报告二

《图像大模型对城市信息的

压缩和解压缩》

Image large model for compression and decompression of urban information

|报告人:刘紫东|


      刘紫东提出,图像大模型对城市信息的压缩和解压缩,大概分成两个步骤。第一个步骤是压缩,也就是编码,我们如何用现在的大模型技术,对城市信息重新进行编码。解压缩,也就是AIGC,即我们利用这个大模型来生成特定的创造性的解决方案。


      当下,技术和市场在发生革命性的范式变革。短期内市场中涌现了大量AIGC的设计平台。从技术范式的角度,在过去的参数化设计,本质上是一种基于写定好的规则进行优化排列,而现在它的思想变成了一种数据库,它会更加的灵活、模糊,但是也更加有创造力。

      

      从产品设计的角度来说,过去的设计软件,图形交互界面有无数按钮,每个按钮背后是一个小函数,通过点击按钮来完成特定参数输入。最后无数参数汇总而成我们想要的方案。这个过程非常琐碎复杂,需要较长使用经验。因此掌握软件成为了设计师较为核心的门槛。但是到了AIGC时代,数据的逻辑变了。我们只需要输入很少的内容(比如一句话),模型会根据语境推测生成大量定制化内容。在未来,产品开发的逻辑应该是注重于背后大模型(甚至是多个)的训练、交互。


      我们的研究范式也会发生变化。例如,空间句法从网络的角度来分析城市。实际上,网络,或者称之为空间关系,当然不能代表城市的全部。城市还有几何形态、功能、社会、经济、文化等等,我们城市的活力是由所有因素相互纠缠在一起。。在过去,我们习惯性的做孤立的研究分析,有了大模型之后,我们突然发现,所有因素可以被同时考虑,可以在一个文脉里找到唯一一个精准的解。


      在谈到现在大模型可以解决这件事情,我们可以先回顾一下到底什么是编码。其实编码就是对某种特征的一种量化描述,找到一种数学模型把某种特征描述为一个可以计算的事情。直到最近的深度学习成熟之后,这个事情才成为可能。因为神经网络的本质,就是来提取一些抽象的特征,比如说风格,将它编码成可以计算的向量。我们能把一个人脸做特征提取之后,就可以通过插值然后找到它们的中间形态。


      大模型进一步的完善了这个工作流。大模型的本质是在一个特定的语境或者文脉下的创造性方案。它的核心在于它是有语境的,而且它是创造性的。我们把这个事情理解为是一种新的城市智能。在过去我们所有的数学工具都实现不了这一点。过去rule-based的方法只能停留于通用性,例如,城市规范都是rule-based的,他能防止人们犯错,但我们不能仅仅停留于此。


      

      在过去,智慧城市的主要内容会做一些顶层设计,设计一些数据的结构架构、规范。另外一个主要的工作内容是大量的数据监测,根据这些数据,做一些回归、参数化设计,这是过去的一个研究范式。但是在未来,会有一种新的一种评判标准。过去,我们很看重回归的准确率。但是在新的大模型面前,例如ChatGPT,重点不再是准确率,因为它是创造新的东西,对既有数据的超越。基于城市大模型来做城市空间的生成,有极大的想象空间。我们每个人都有自己的随心所欲的盗梦空间。最后我们要实现的是一个统一的城市大脑,它是可以把所有的因素,不仅是建筑学的视角,也包括社会学的视角等等综合起来考虑,来找到一个城市问题的最优解。


报告三

《三维空间的人机合作框架基于图神经网络和序列神经网络》

Human-computer cooperation framework in 3D space based on graph neural networks and sequential neural networks

|报告人:钟喜明|


       钟喜明的讲座内容包括三个部分,主要是环境的感知、3D环境的推理和根据这些3D环境进行空间决策。


      感知推理和决策过程,计算机都可以逐渐在某种程度上替代人类完成。但根据时间序列,我们发现这是一个反着发展的过程,反而是机器的感知是最难的。


      先从最容易实现的规则驱动讲起。规则驱动方法,是人和机器共同参与完成的,人机合作及相邻关系进行空间布局。计算机的任务是根据不同空间的相邻关系和尺寸需求,不断的优化预制化模块的位置关系。人的任务是不断的修改这个模型,符合传统的建筑设计的流程,人和机器共同完成整个的布局流程。这种方法和之前的规则驱动不同的点在于,建筑师的实时决策也被当成了下一个迭代计算的引力优化向量。通俗的说,就是把人的反馈和规则建立了某种联系。我们在研究中把交互过程修改了引力的向量,让规则不断的变化,直到稳定,满足建筑师的偏好。所以在规则驱动的过程中,规则其实也是可以根据人的交互变化的。

图片来源《人机合作基于相邻关系进行3D空间布局》  

zhong et al CDRF2022

详细视频可见 https://www.youtube.com/watch?v=9pkud2ijL90


      人类建筑师能凭借空间想象和经验的快速决策,推理单元体块之间的相互关系和位置关系进行决策,机器能不能取代这个过程?


      14年GAN的模型产生之后,大量的数据驱动方式开始占据建筑设计的生成式的领域。GAN的模型主要就是生成器和判别器,它们两个相互对抗,直到生成器能产生和数据集很像的分布。


      基于这个理论,GAN用于城市设计和城市布局的研究,比如道路路网布局,花园布局,公寓布局,城市布局。从这四个典型的研究中,我们发现两个共同点,第一是GAN的监督标签可以很好的控制布局的结果。我们如何去控制GAN,取决于我们如何打标记。第二,GAN学习结果的好坏很大程度取决于数据集。而大型数据集非常难获得,包括良好的数据标记,其实是一个昂贵的过程。


      基于这样的动机,我们提出两个问题。第一,GAN数学上能产生相似性。但是相似性是否意味着好的城市设计?它和历史的样本相似,但是它能满足未来建筑师定制化的需求吗?第二,机器很难从高密度城市数据样本中生成低密度的结果。


      所以定义显性特征和采样是非常重要的,它是建筑师和机器合作的一个基础。无论多么复杂的神经,它的神经元内部数学的表示方式其实非常简单,就是矩阵相乘和非线性激活。那么我们可以观察一下GAN的输出布局或者这类VE模型的输出布局,这种模型它能够很好的模拟和历史数据集相似的数据分布。如何定义一个具有采样自动化的特征标注框架,能帮助建筑师显性的控制层次化的城市布局特征,满足复杂的城市设计需求,是我们最关心的问题。


图片来源A Discussion on an Urban Layout Workflow Utilizing Generative Adversarial Network (GAN) - With a focus on automatized labeling and dataset acquisition,Ximing Zhong


      下一个问题,3D空间里的推理如何能保证机器真正理解了我们输入的三维空间的信息,并且进行推理,在三维空间里像完成数独一样完成这样的智力任务,并而不是简单的像GAN或者像潜在空间差值、或者降维等思想,提供一个似是而非的结果。


      GNN能快速的传递信息和推理全局的布局关系,这是人类建筑师在一瞬间很难完成的快速推理过程。为了进一步达到GNN与我们共同协作解决三维空间的探索和空间分割任务,所以我们提出了building GNN网络。建筑师能和人工智能进行循环反馈,共同探索优化方案,人可以更好的理解场地,机器可以更好的去快速生成原形。


      图网络加上记忆模块,可以进行很好的空间推理。加了记忆模块之后,记忆越久,推理能力越强,记忆越少,建筑师的控制能力越强,所以说我们可以用这种记忆能力或者说RNN的序列,网络的GRU的模块迭代次数来精准的控制人和机器对结果影响的强弱。


      最后一部分是3D环境理解和感知,机器能像人类一样观察和理解三维世界吗?


      麻省理工最新的研究,它的核心是机械臂的每一个动作都会在现实世界产生光场,它把这种光场和预计的光场,类似于VE的思路,进行loss计算精准预测。这个工作对建筑学下游的任务是有巨大影响的。这有潜质让机器观察环境生成潜在向量或者解码器,通过潜在向量的分布和理解,让我们更好的生成符合真实环境的3D空间设计。这个过程其实代替了建筑师的观察。我认为光场是有可能帮助到我们的。


      下一个技术就是open AI,建立了迄今为止最好的我的世界的建造机器人,他的学习方式是看视频学建造,机器通过游戏解说的视频,理解三维的环境,并且能够完成模糊语义的多重任务。这对我们理解3D环境产生了一个很大的影响。第一,我们能完成复杂的建造任务。第二,强化学习在真实世界代理过程的结果,就是我们需要的建造结果,它也完整复刻了建造的过程。而如何在离散的建造过程中,应用一个简单的语义描述,生成复杂多任务。这是我们目前仍在探索的一个角度。


报告四

《气候变化背景下新加坡公共住宅

性能预测与优化分析》

Environmental Performance Prediction and Optimization Analysis of Public Housing in Singapore in the Context of Climate Change

|报告人:燕海南|


      燕海南认为,在建筑设计初期阶段将建筑性能融入设计与分析工作中具有重要的现实意义。然而基干计算机性能模拟的工作流程不仅耗时而且专业门槛较高,无法有效满足建筑设计过程中快速分析与设计决策的相关需求。相对而言,基于机器学习的建筑性能预测与优化技术是效率较高的性能分析工具。


      基于若干建筑案例的建筑设计研究结果不足以推导出精度最高且泛化性最好的机器学习预测算法,也难以揭示建筑性能表现的一般性规律。


      建筑设计预测与优化研究往往需要处理多种类型的建筑物,这对预测模型的通用性和可拓展性提出了更高的要求。为此,在保持计算精度和效率的前提下,应尽可能将不同类型建筑性能的预测任务整合到一个统一的算法框架中。


      在传统的机器学习背景下,通常假设训练数据和测试数据共享完全相同的特征空间和数据分布。但是,一旦新的预测任务出现,并且它的数据分布P(X)与之前的任务不同,就必须使用当前数据从头开始重建新模型。这种方法需要额外的努力,在大多数情况下非常昂贵。与传统的机器学习方法相比,迁移学习可以容忍数据分布的差异,并将来自其他来源的知识用于目标任务。


      文章的题目是长期气候变化影响下数据驱动的新加坡住宅建筑性能预测和优化研究。新加坡大概有80%的人是居住在公共住宅HDB中,称为组屋,类似于国内的廉租房的一个概念,是新加坡主要的一种居住的形式。因此,我们确立了组屋为研究对象。


      我们是选择了两种住宅建筑原型,即点式住宅和板式住宅。从形态、设施、墙体的热工、玻璃参数等等方面做一些设定,是一个比较传统或者说一个标准的建筑模拟的一个流程。


      我们的一个关注点是在于,新加坡的气候韧性,怎么样去更好的应对未来所可能出现的气候变化或者洪水灾害等等。根据这个气候变形的方法,获取了新加坡大概80年跨度的气候数据。在基于未来的气候数据,以及基本的建筑参数化模型以及参数设置的基础之上,进行采样,采样之后进行一个模拟。

      在做完前面的数据准备以及做完数据预测、模型预测之后,我比较关注的两个方面,第一个是关于这个预测模型的一个可解释性,具体的工作展开是用算法将预测模型的黑箱逐一地对每一个特征进行敏感性分析,或者叫可解释性机器学习。这样我们得到了一些初步的结果,对于点式建筑而言,较有贡献的几个特征值有房间进深、遮阳设施、墙体水平旋转角度、墙体隔热性等。对于板式建筑,它则表现为南北向的窗墙面积比以及墙体的隔热性能影响相对较大。这与我们之前论文中所做的相关性分析的结果也是相对保持一致的。第二个方面,我们想去考虑怎样通过迁移学习去提高预测的泛化能力。运用预训练微调的方法,基于一个基础的数据集训练,得到一个预训练的模型,然后识别出来通用特征,将通用特征去迁移到目标任务中。


      总体而言,由于气候变暖,年均制冷能耗(EUl_cooling)和室内热舒适指数(PMV)逐渐增大,而年均有效采光指数(UDI)没有明显变化。对于炎热潮湿的新加坡地区,未来住宅建筑优化设计的总趋势是加强建筑物的隔热性能,增加遮阳设施并采用可见光透射率较低的窗户玻璃,以更好地适应气候变暖的条件。


对谈环节

| 观点交流与碰撞 |


      报告过后,南京大学建筑与城市规划学院童滋雨教授与四位分享者围绕报告内容进行深度讨论和交流,并就传统建筑学在人工智能的背景冲击下,应该如何拥抱AI新的革命,促使建筑学走向交叉学科的应用,从而使建筑学学生的职业发展之路更宽更远展开了深入探讨。



地址:江苏省南京市鼓楼区汉口路22号建良楼,邮编:210093

邮箱:arch@nju.edu.cn,电话:(025)83593020,传真:(025)83595673