转载于 腾讯Bugly 发表于 腾讯Bugly的专栏 原文链接:https://cloud.tencent.com/developer/article/1389555 本文首先介绍BERT模型要做什么,即:模型的输入.输出分别是什么,以及模型的预训练任务是什么:然后,分析模型的内部结构,图解如何将模型的输入一步步地转化为模型输出:最后,我们在多个中/英文.不同规模的数据集上比较了BERT模型与现有方法的文本分类效果. 1. 模型的输入/输出 BERT模型的全称是:BidirectionalEnc