Tuwee 风滚草

Thinking will not overcome fear but action will.

CUDA 性能优化

CUDA Program Optimization

CUDA 性能优化 在异构众核系统飞速发展的今天,NVIDIA 的 CUDA 编程模型也变得日渐流行。CUDA 模型使得利用 GPU 进行通用计算不再需要掌握复杂的图形学知识,大大降低了使用 GPU 进行高性能计算的门槛。CUDA 编程模型支持多种语言,CUDA C 是 C 语言的拓展,它让在 GPU 上运行的代码可以简单的以 C 语言的函数形式来定义。本文主要介绍如何根据硬件特性来...

图像的数据增强

image augment

图像的数据增强 在深度学习中,大量的数据是深度学习的源动力,好比于内燃机时代,汽车的原动力–“油”。但是往往我的实际应用中,我们难以收集到足够的数据量来完成任务。数据增强的方法便应运而生。 数据增强(data augmentation),是为了将我们现有的有限数据产生更多的数据集合, 进而提高网络的精度和泛化能力 。本篇主要讲解在深度学习中的图像数据增强,分为两个部分: 基于人工...

Rasa-core中文文档

Rasa-core中文文档

Core About Stories Rasa的stories是一种特殊的训练数据,基于此来训练DM模型。 story用来表示用户和机器人之间的对话,只不过其并非正常的文本句子,而是经过了转换。 用户的输入用意图和实体(如果意图中有实体)代替,机器人的回复则用在domain中定义好的action名字来代替。 因此一个story本质上是有一定泛化能力的模板。 一个sory就是训练Rasa对...

Rasa-nlu中文文档

Rasa-nlu中文文档

NLU ABOUT Rasa NLU: Language Understanding for Chatbots and AI assistants Rasa NLU 是一个独立的开源NLU组件,可用于多轮对话中的意图分类、问答检索以及实体抽取。示例如下: 输入: "I am looking for a Mexican restaurant in the center of town" 输出...

Bert线上部署,从150ms到20ms

Bert as Service,form 150ms to 20ms

前言 预训练模型(BERT,XLNET,GPT)的成功,毫无疑问加速了NLP领域的进程,在多个任务中(分类、ner、文本生成、阅读理解)上都超越了现有模型,在作者看在重要的两点是,模型容量和数据体量。Transformer提供了足够的模型容量,其并行计算提供了大规模训练的可能, 由大量无监督数据生成的有监督训练数据同时也提供了足够的数据体量。大模型也带来了模型部署的困难,本文会对其部署中的...

BERT-文本相识度分类-部署tensorflow-serving服务

BERT-文本相识度分类-部署tensorflow-serving服务

小明刚进公司,被老板要求应bert构建文本相识度分类的服务,网上相关的资源少之又少,因此作此记录。 整体流程 BERT在文本相识度,文本分类,和实体识别上对现有模型的提升都是相当可观的,将bert部署成服务的步骤大致有如下过程: 下载代码和原生模型 按照自己的任务更改process 在训练集上fine-tune模型 将模型保存成saved model的形式 部署模...

Java学习笔记总结

The study note of Java

Java学习笔记总结 Java基本概念 基本特点 java是面向对象的语言,java中的所有东西都要属于某个类;具有面向对象有封装、继承、多态性的特性 具有易维护、易复用、易扩展的特点; 由于java虚拟机的存在具有平台无关性; 可靠与安全。 支持多线程 Java虚拟机(JVM)与编译器 编写好源文件(.java文件)用编译器编译成字节码(.class文...

Java SE基础部分学习笔记

Notes of Java

Java SE基础部分学习笔记 Java中标识符规则与C/C++不同之处在于,Java中$(美元符号)等同于_(下划线)地位,可以作为标识符组成部分,可以作为标识符开始。 /** * 此种注释为Java中特有的注释,称之为 文档注释。可用javadoc来提取。 */ Java中的null也属于一种常量,称为null常量,...

离散时间系统的状态估计

State Estimation On Discrete-Time System

离散时间系统的状态估计 离散时间系统(Discrete-Time System) 对于一个离散系统,我们通常会用如下的方程组来描述。 其中,称为运动方程,描述了状态是怎么变到的,而观测方程描述的是从 是怎么得到观察数据的。运动方程和观测方程具体形式并不固定。我们会根据,是否线性,把它们分为线性/非线性系统。同时,对于噪声,,根据它们是否为高斯分布,分为高斯/非高斯噪声系统。 本篇博客主要...

Kubernetes+Tenserflow-serving搭建可对外服务的机器学习应用

tensorflow-serving with Kubernetes

小明刚进公司,被老板安排搭建可对外提供文本分类、实体识别的服务。作为小白,开始了自己的学习之路。。。 需求及问题分析 拿文本分类服务来说,小明将需求拆分为五个部分:数据集存储、线下模型训练和调试、模型部署、线上提供服务、服务维护。分析了自己的业务场景之后,小明希望每个部分都能应对一下问题: 数据集存储:数据集非常大,机器的内存是不能够加载的,这和平时在实验室训练模型稍有不同。 ...