student_loss.backward() in LADD 

    student_loss.backward()
    torch.nn.utils.clip_grad_norm_(student_unet.parameters(), 1.0)
    student_optimizer.step()
    student_scheduler.step()
    student_optimizer.zero_grad()

Wouldn' t above code generate gradients on the discriminator as well? Then in the next training iter, those gradients on the discriminator will be used to in optimizer.step . I think we need a discriminator_optimizer.zero_grad() after student_optimizer.zero_grad() ?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

student_loss.backward() in LADD #3

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

student_loss.backward() in LADD #3

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions