!pip install -q mediapy
import mediapy as media
import matplotlib.pyplot as plt
import glob
import numpy as np
import cv2


image = media.read_image('figures/structure.png')
media.show_image(image, title='generator structure')


image = media.read_image('figures/highres_tructure.png')
media.show_image(image, title='generator structure for high resolution output')


def sub_img(img, row_idx, col_idx, height=256, width=512):
    return img[row_idx * height:(row_idx + 1) * height, 
               col_idx * width:(col_idx + 1) * width]


city_seg = media.read_image('figures/epoch050_iter147104_input_label.png')
city_gt = media.read_image('figures/epoch050_iter147104_real_image.png')
city_pred = media.read_image('figures/epoch050_iter147104_synthesized_image.png')

for i in range(3):
    for j in range(3):
        images = {
            'segmentation input':  sub_img(city_seg, i, j),
            'groundtruth RGB':  sub_img(city_gt, i, j),
            'generated RGB':  sub_img(city_pred, i, j),
        }
        media.show_images(images, columns=3, border=True)


coco_seg = media.read_image('figures/epoch025_iter117208_input_label.png')
coco_gt = media.read_image('figures/epoch025_iter117208_real_image.png')
coco_pred = media.read_image('figures/epoch025_iter117208_synthesized_image.png')

for i, j in {(1, 0), (1, 3), (2, 0), (2, 1), (2, 2), (3, 1), (8, 3), (9, 1), (9, 2)}:
    images = {
        'segmentation input':  sub_img(coco_seg, i, j, height=256, width=256),
        'groundtruth RGB':  sub_img(coco_gt, i, j, height=256, width=256),
        'generated RGB':  sub_img(coco_pred, i, j, height=256, width=256),
    }
    media.show_images(images, columns=3, border=True)


pred_list = glob.glob('figures/pred512/*.png')

for pred in pred_list:
    filename = pred.strip().split('/')[-1]
    seg_img = media.read_image('figures/seg2017/' + filename)
    gt_img = media.read_image('figures/val2017/' + filename[:-4] + '.jpg')
    gt_img = cv2.resize(gt_img, dsize=(256, 256), interpolation=cv2.INTER_CUBIC)
    images = {
        'segmentation input & groundtruth':  np.vstack((seg_img, gt_img)),
        'high-res RGB synthesis':  media.read_image(pred),
    }
    media.show_images(images, columns=2, border=True)

16-726 21spring Final Project¶

Image Generation via Independent Semantic Synthesis¶

Author: Zhe Huang (zhehuang)¶

Acknowledgement: Andrew Luo (afluo)¶

1. Introduction¶

2. Methods¶

2.1. The overall design of PosGen generator¶

2.2. Special design for generating high-res images¶

2.3. About the discriminator¶

3. Results¶

3.1. Implementation details¶

3.2. Training & testing on the Cityscapes dataset¶

3.3. Training & testing on the COCO-Stuff dataset¶

3.4. Synthesizing high-res images¶

4. Discussion¶

References¶