1.变分函数 微分(非严格)$$ dy = f(x_1+dx)-f(x_1) $$ $dy$是$y$的微分,也就是函数的微分,是指的$x$变化了一个极小值引起的因变量函数的变化。 泛函泛函
BERTBERT(Bidirectional Encoder Representations from Transformers)由谷歌在2018年提出[1]。在语言模型中,它的优势是采用了动态
文本哈希 数据集 20Newsgroups 基于文档的多轮问答 任务 数据集 描述 语言 对话式问答(Conversational Question Answering, CQA) CoQA,CuQA等 基于给定文档的多轮问答
前言本项目为个人实践项目,按实验室老师要求将项目部署上云服务器,主要实现基本的网站结构和api交互,使用nginx进行反向代理,提供web服
权重冻结在使用预训练语言模型进行下游任务的微调时,有时数据量难以使得其收敛,此时我们可以选择固定住某些层的参数,使其仍然保持在预训练语料上的
Tensor是什么?Tensor又叫张量,与标量,向量等的区别如下: 标量其实就是一个独立存在的数,比如在线性代数中一个实数 5 就可以被看作一个
简介pyecharts 的呈现十分美观,尽量搭配jupyternotebook使用,jupyterlab上的显示尚有瑕疵。在使用中,可以将ju