transformers Jupyter Notebooks

TwoAdmin 2025-9-17 116 9/17

Jupyter Notebooks

我们包括三个Jupyter Notebooks，可以用来检查Pythorch模型的预测是否与原始TensorFlow模型的预测相同。

第一个Notebooks(Comparing-TF-and-PT-models.ipynb:https://github.com/huggingface/transformers/blob/master/notebooks/Comparing-TF-and-PT-models.ipynb)提取了TensorFlow和PyTorch模型每一层上完整序列的隐藏状态，并计算了它们之间的标准差。在给定的例子中，我们得到模型的各种隐藏状态的标准差为1.5e-7到9e-7。

第二个Notebooks(Comparing-TF-and-PT-models-SQuAD.ipynb:https://github.com/huggingface/transformers/blob/master/notebooks/Comparing-TF-and-PT-models-SQuAD.ipynb)比较了TensorFlow和PyTorch模型计算的BertForQuestionAnswering微调层相同初始化的损耗，并计算了它们之间的标准偏差。在给定的例子中，我们得到模型之间的标准偏差为2.5e-7。

第三个Notebooks(Comparing-TF-and-PT-models-MLM-NSP.ipynb:https://github.com/huggingface/transformers/blob/master/notebooks/Comparing-TF-and-PT-models-MLM-NSP.ipynb) 比较了TensorFlow和PyTorch模型计算的预测，并使用预训练的掩码语言模型对掩码标记语言进行建模。

请按照Notebooks中的说明运行和修改它们。

- THE END -

Tag：Transformer

TwoAdmin

9月17日14:32

最后修改：2025年9月17日

0

非特殊说明，本博所有文章均为博主原创。

如若转载，请注明出处：https://www.yaokuai.cn/article/archives/18.html

transformers 模型上传和共享

transformers 预训练模型

相关推荐

transformers 示例教程

transformers 示例教程

2025-9-17 122℃

有的agent skills 就一个.Md文件，他们是如何达到执行的效果的

有的agent skills 就一个.Md文件，他们是如何达到执行的效果的

2025-10-21 68℃

langgraph同时使用tool和mcp（一）

langgraph同时使用tool和mcp（一）

2025-9-25 104℃

vLLM 加载和部署 LoRA 微调后的模型

vLLM 加载和部署 LoRA 微调后的模型

2025-10-27 66℃

陕ICP备10001693号

Copyright © 要快网