A正确
B错误
BERT是一种Transformer的双向编码器
NLP算法模型中,BERT采用了Transformer的全部网络结构。
Bert里面mask的用处是为了更好地提升Bert词向量的双向编码能力。
首页
每日一练
打赏一下
浏览记录