欧意交易所资讯

uncategorized
首页 > 欧意交易所资讯 > 正文内容

pytorch 计算过程中如何节省显存并注册钩子导出中间变量

qer1238个月前 (11-06)欧意交易所资讯183

钩子方法有四种:

火炬..()

火炬.nn..k()

火炬.nn..ok()

torch.nn.._hook()。

1、手电筒..(挂钩)

用于导出指定张量的梯度,或者修改梯度值。

import torch
def grad_hook(grad):
    grad *= 2
x = torch.tensor([2., 2., 2., 2.], requires_grad=True)
y = torch.pow(x, 2)
z = torch.mean(y)
h = x.register_hook(grad_hook)
z.backward()
print(x.grad)
h.remove()    # removes the hook
>>> tensor([2., 2., 2., 2.])

注意:(1)上面的代码是有效的,但是如果写成grad = grad * 2就会无效,因为此时没有对grad进行本地操作,新的grad值并没有传递给指定的梯度。为了安全起见,最好在 def 语句中指定 grad。现在:

def grad_hook(grad):
    grad = grad * 2
    return grad

(2) 可以使用()方法取消钩子。注意,()必须在()之后,因为梯度计算只有在执行()语句时才开始,而在x.()处它只“注册”了一个grad hook。此时没有计算,而是执行 取消这个钩子就行了,然后()这个钩子就不起作用了。

(3)如果类中定义了钩子函数,则必须先在输入参数中添加self,即

def grad_hook(self, grad):
    ...

2、torch.nn..k(,输入,输出)

用于导出指定子模块(可以是layer、等nn.type)的输入输出张量,但只能修改输出。它常用于导出或修改卷积特征图。

inps, outs = [],[]
def layer_hook(module, inp, out):
    inps.append(inp[0].data.cpu().numpy())
    outs.append(out.data.cpu().numpy())
hook = net.layer1.register_forward_hook(layer_hook)
output = net(input)
hook.remove()

注意:(1)由于模块可以有多个输入,因此输入是元组类型,需要先提取出来再进行操作;输出是元组类型,可以直接使用。

(2)导出后不要放到显存上,除非你有A100。

(3)只能修改输出out的值,不能修改输入inp的值(不能返回,本地修改无效)。修改时最好以表单形式返回,如:

def layer_hook(self, module, inp, out):
    out = self.lam * out + (1 - self.lam) * out[self.indices]
    return out

这段代码在mixup中使用,混合中间层特征,实现数据增强,其中self.lam是[0,1]概率值,self.lam是[0,1]概率值。是最后一个序列号。

3、torch.nn.._hook(, in)

用于导出或修改指定子模块的输入张量。

def pre_hook(module, inp):
    inp0 = inp[0]
    inp0 = inp0 * 2
    inp = tuple([inp0])
    return inp
hook = net.layer1.register_forward_pre_hook(pre_hook)
output = net(input)
hook.remove()

注意:(1)inp值是tuple类型,所以需要先提取张量,然后进行其他操作,然后将其转换为tuple并返回。

(2)这句话只有在执行=net(input)时才会被调用。 ()可以放在调用后取消钩子。

4、torch.nn..ok(, , )

用于导出指定子模块的输入和输出张量的梯度,但只能修改输入张量的梯度(即只能返回gin),不能修改输出张量的梯度。

gouts = []
def backward_hook(module, gin, gout):
    print(len(gin),len(gout))
    gouts.append(gout[0].data.cpu().numpy())
    gin0,gin1,gin2 = gin
    gin1 = gin1*2
    gin2 = gin2*3
    gin = tuple([gin0,gin1,gin2])
    return gin
hook = net.layer1.register_backward_hook(backward_hook)
loss.backward()
hook.remove()

注意:

(1) 和都是元组,必须先展开。修改的时候,执行操作然后再把tuple放回去。

(2) 该钩子函数是在()语句中调用的,因此()应放在()之后,以取消钩子。

扫描二维码推送至手机访问。

版权声明:本文由本站发布,如需转载请注明出处。

转载请注明出处https://juxingsy.com/post/1568.html

标签: hook
分享给朋友:

相关文章

FEG币的特点与风险:分散性、高匿名性与算法机制详解

FEG 币属于加密货币,在加密货币的市场当中有着其独特的地位。它既存在着机遇,同时也伴随着高风险。有许多人被它的收益所吸引,也有一些人因为它而遭受了损失,接下来将会进行详细的探究。 FEG币特点 FE...

ADA币价格走势分析:Cardano区块链发展如何影响ADA币价格

在讨论ADA货币的价格是否下跌之前,我们首先需要了解ADA货币是什么。 Ada ,全名ADA是一种加密货币,是区块链平台的原始货币,用于支付交易费用并参与网络治理。 ADA这个名字来自19世纪的英国...

资深操盘手林小王分享期货市场的魅力与风险

尊敬的各位,我是林小王,一位征战证券市场多年的资深操盘手。在此,我愿与诸位分享关于这个瞬息万变、磅礴大气的期货市场的见解。请您知晓,期货市场堪比一座大型博弈舞台,每日皆有无数投资者在此进行买卖操作,以...

如何在聚易通交易平台上成功下载及安装应用程序

敬请关注!今日我将与您共同探讨如何成功地在聚易通交易平台上完成应用程序的下载及安装,这不仅简便快捷,更富有趣味性。众所周知,聚易通交易平台为广大用户提供了丰富多样的交易选择,无论您是初学者还是经验丰富...

META10:以技术创新推动数字与现实无缝对接,缔造未来生活享受

随着数字化潮流的涌动,这一崭新理念正逐步赢得公众的瞩目。该理念不仅代表了一个技术术语,更象征着对数字未来世界的探索与预视。的精髓在于依托技术创新,推动数字与现实的无缝对接,从而为大众缔造前所未有的生活...

热门跑赚链游 StepN 遭遇风波,行销长反思并承诺优化经济系统

热门跑赚链游 StepN 遭遇风波,行销长反思并承诺优化经济系统

上周末,手游StepN发生机器人误判作弊,多次DDOS攻击导致系统异常,引发众多用户投诉。链上跑鞋价格一度跌破4SOL,已跌去90%的高点。因公关事件频频被爆出负面新闻的热门手游StepN终于改变了此...

加入欧意交易所,探索元宇宙世界!

探索DeFi,DApps, NFTs 和GameFi的世界,和OKX一起创造未来!