伟德国际1946源自英国院讯(通讯员:张素素)近日,Elsevier出版社旗下Computers & Graphics期刊在线发表了我院学术论文(Jiancheng Ni, Susu Zhang, Zili Zhou, Lijun Hou, Jie Hou, Feng Gao. Background and Foreground Disentangled Generative Adversarial Network for Scene Image Synthesis, Computers & Graphics, 2021, 97: 54-66)。该论文以伟德国际1946源自英国为唯一完成单位,倪建成教授为论文第一作者,2018级研究生张素素为论文第二作者和通讯作者。Computers & Graphics最新影响因子为1.351,JCR分区3区。
针对结构场景图无法生成类别多样的实例和高质量复杂场景布局的问题,提出了前景和背景分解的场景图到图像的生成模型(BFD-GAN)。首先,将自然语言转换为结构场景图,并利用图卷积网络推理背景语义布局,将前景和背景分解且分别进行生成,从而提高图像质量、降低生成过程的复杂性。然后,为避免劳动密集的人工标记,构建的前景解析模块学习具有可识别几何外观的前景细粒度特征。最后,利用前景-背景融合模块自适应地细化视觉特征引入前景-关系感知注意力机制,计算前景对交互关系的偏差,并对重叠区域进行最大池化操作,选择最相关的像素实现特征表示,从而使得前景和背景相互兼容并生成合理而真实的复杂图像。
全文链接:https://doi.org/10.1016/j.cag.2021.04.003
该研究得到了国家自然科学基金的资助支持。