自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (2)
  • 收藏
  • 关注

原创 互联网公司优雅的转正述职

教你进行优雅的转正

2022-07-07 19:43:48 837 1

原创 基于pytorch+transformers的NER实体识别

命名实体识别作为一项基础的NLP任务,其用在信息抽取、关系抽取、图谱构建等任务中都作为基础存在

2022-07-06 10:36:14 1804

原创 基于pytorch+transformers的文本分类

文本分类作为NLP基础任务,是最常用的服务了,本文提供一个开箱即用的文本分类器。

2022-07-05 13:42:25 2346 1

原创 NLP实用工具

在做NER实体识别时,经常会遇到将BIO等格式的标注或者预测数据转成brat等json格式,反之将brat等json格式(各类比赛中采用格式)转成BIO格式进行模型训练也是常常遇到的,下面给出开箱即用的函数工具。...

2022-07-04 16:04:40 269

原创 数论:数学的皇后

数学是科学的皇后,而数论是数学的皇后

2022-07-04 11:46:42 292

原创 活体检测技术

活体检测技术应用场景金融支付,门禁,打卡机等应用场景。任务目标为判断捕捉到的人脸是真实人脸,还是伪造的人脸攻击。任务难点主要是:攻击源分布过于广泛不同攻击源之间差距不明显使用场景限制检测方法当前开放样本数据不足2019世界黑帽安全大会,腾讯公司演示了攻破苹果Face ID。工具为:一款特制眼镜,眼镜镜片上贴有黑色胶带,黑色胶带中心还贴有白色胶带。《福布斯》的记者们决定使用 3D 打印石膏人脸攻击手机的人脸识别功能。 在一通测试之后,他们发现石膏人脸竟可以破解当时四种流行旗舰手机(LG G

2022-05-21 18:12:21 1431

原创 深度学习(一、入门)

从人工智能开始让机器具有人类的智能,能够理解人类语言、语音、图片、视频以及各种人类活动数据,并以此为依托辅助甚至代替人类做出决策,是人工智能的终极目标。最早提到机器智能的是图灵,1950年,他提出机器是否拥有智能的测试方法为:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的,而该测试也称为图灵测试。1956年的达特茅斯(Dartmouth)会议。在这次会议上,“人工智能”...

2022-05-21 16:15:17 1627

原创 From TextCNN to Sentence Similarity(句子分类到表征)

TextCNN basic基础知识自动提取文本的特征,将sentence进行分词,组成每个句子的词,每个词对应一个id,(也可以不分词,以字为粒度)并将词转化为id,每个句子都是id组成的数据,将所有的句子都padding到最长的句子max_len_stence,也可以设置一个值为句子长度值。然后进行embedding,每个id对应一个size的词向量,这样每个句子的presentation即为[max_len_stence,size],到此也就完成了embedding,后面类似图像的卷积和池化提取句子

2022-05-17 15:01:52 185

原创 深度学习(五、注意力机制与强化学习以及目前主要应用)

注意力机制由于优化算法和计算能力的限制,神经网络在实践中很难达到通用近似的能力。网络不能太复杂(参数太多)。为了提高网络的能力,分别采用了一些措施,如局部连接、权重共享、汇聚操作等。简单循环神经网络存在长期依赖问题,( LSTM网络)引入一个近似线性依赖的记忆单元来存储远距离的信息。记忆单元的存储能力和其大小相关。如果增加记忆单元的大小,网络的参数也随之增加。大脑中的注意力:人脑每个时刻接收的外界输入信息非常多,包括来源于视觉、听觉、触觉的各种各样的信息。但就视觉来说,眼睛每秒钟都会发送千万比特的信息给

2022-05-16 20:46:16 1936

原创 深度学习(四、循环神经网络RNN)

前馈网络的一些不足连接存在层与层之间,每层的节点之间是无连接的。(无循环)输入和输出的维数都是固定的,不能任意改变。无法处理变长的序列数据。假设每次输入都是独立的,也就是说每次网络的输出只依赖于当前的输入。循环神经网络循环神经网络通过使用带自反馈的神经元,能够处理任意长度的序列。循环神经网络比前馈神经网络更加符合生物神经网络的结构。循环神经网络已经被广泛应用在语音识别、语言模型以及自然语言生成等任务上。h(t)=f(h(t−1),x(t))h(t) =f(h(t-1), x(t))

2022-05-16 19:59:29 394

原创 深度学习(三、卷积神经网络CNN)

引入原因前文提到过理论上一个两层的全链接神经网络即可拟合任意的函数,那为何还要引入CNN呢?主要是全连接网络的权重矩阵的参数非常多,其想要拟合任意的函数神经元必须非常大,运算量也就特别多,现在主流观点为将深度神经网络做得比较深,有理论支持拟合同样复杂的函数,在深度上发展所需要的神经元比横向发展所需要的神经元更多,因为深层能够捕获到高层的语义特征。卷积神经网络主要依靠局部连接与权重共享达到其减少运算,保留强表征的效果。卷积操作卷积操作作为常用的特征提取器,以图片特征为例:不同的滤波器(卷积核)可

2022-05-15 18:15:48 242

原创 深度学习(二、全连接网络FNN)

在前馈神经网络中,各神经元分别属于不同的层。整个网络中无反馈,信号从输入层向输出层单向传播,可用一个有向无环图表示。为了引入非线性变换(因为如果没有非线性变换,即使层数再多也只是做了一些仿射函数而已),在各个层中可能会引入一些激活函数(如sigmonid激活函数将值域映射到0~1,tanh激活函数将值域映射到-1~1。)这个设计初衷最开始是模仿人脑神经元的想法(其实关联并不是特别大),细胞体中的神经细胞膜上有各种受体和离子通道,胞膜的受体可与相应的...

2022-05-15 17:38:58 979

原创 强人工智能:GPT3?

GPT3问世已经半年之久了,GPT3模型在刚刚问世之前一段不可思议,超出预期,可后期却有点后劲无力了,被测出各种badcase,今天一起吃瓜看看吧!喧嚣GPT-3 是著名人工智能科研公司 OpenAI 开发的文字生成 (text generation) 人工智能,相关论文今年5月份已经发表,当时就以天文数字级别的1,750亿参数量引发轰动。7月份时候GPT3提供了对商业公司、学校和个人可以使用的OpenAI api供研究者自行调用,自此研究者做了五花八门的应用,名噪一时。随便看一个GPT3常识推理的

2020-12-02 16:01:29 1240

原创 机器学习一线性模型——logistics回归

# -*- coding: utf-8 -*-"""Created on Mon Jul 9 13:36:25 2018@author: Wei_Zhan"""import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_model, discriminant_analy...

2018-07-10 10:25:39 307

原创 机器学习一 线性模型

    此为python机器学习的系列作品的第一篇,对于线性模型的求解与讨论,理论部分可以参考《python大战机器学习》,此系列的主要代码来源也是这本书。对于线性回归模型的学习数据采用scikit-learn中的diabetes数据集。总共有10个属性,都是数字化的类型数据。def load_data(): diabetes = datasets.load_diabetes() ...

2018-07-10 10:13:40 427

原创 python单链表实现

# -*- coding: utf-8 -*-"""Created on Tue Jun 12 18:06:24 2018@author: Administrator"""class LNode: def __init__ (self, elem, next_ = None): self.elem = elem self.next = next...

2018-06-12 11:39:09 120

原创 python中函数、修饰符、和文件操作

1、函数在 Python 中,函数是一种基本类型的对象,这意味着· 可以将函数作为参数传给另一个函数· 将函数作为字典的值储存· 将函数作为另一个函数的返回值 · Python 中的函数传递方式是 call by reference 即引用传递,例如,对于这样的用法:· x = [10, 11, 12]· f(x)· 传递给函数 f 的是一个指向 x 所包含内容的引用,如果我们修改了这个引用所指向...

2018-04-28 11:12:16 288

原创 Python中常见模块的使用(OS、Re、DateTime的使用)

1、OS· os.remove(path) 或 os.unlink(path) :删除指定路径的文件。路径可以是全名,也可以是当前工作目录下的路径。· os.removedirs:删除文件,并删除中间路径中的空文件夹· os.chdir(path):将当前工作目录改变为指定的路径· os.getcwd():返回当前的工作目录· os.curdir:表示当前目录的符号· os.rename(old,...

2018-04-28 10:17:59 2117

原创 双向链表实现——Java语言版

对于双链表,每个节点既有前驱节点又有后继节点,在某些应用方面更加方便,对于其插入和删除需要修改两个指针,其实现的Java代码如下:package datastructure;public class DLLNode { private int data; private DLLNode next; private DLLNode previous; public int getData...

2018-04-23 10:39:52 160

原创 单链表的实现——Java版本

对于数据结构中最基础的单链表的实现,因为链表不需要连续的内存存储空间,不需要在创建时指定大小,因此比线性表更有优势,对其的插入,删除操作也就更复杂,以下是对链表的实现代码:package datastructure;public class Listnode { private int data; private Listnode next; public int getData() {...

2018-04-23 10:28:23 144

原创 栈的三种实现——Java语言描述

对于数据结构中常用的栈结构,其实现方式通常分为三种:一、基于简单数组的实现方式二、基于动态数组的实现三、基于链表的实现方式1、简单数组实现方式//最大空间必须事先声明public class ArrayStack { private int top; private int capacity; private int[] array; public ArrayStack() { ca...

2018-04-22 16:43:51 379

原创 CSDN第一天——简单的登录注册及针对不同用户显示不同界面

感谢生活中的良师益友,一本好书,一个好的教学视屏,一个好的学长推荐,希望明天会更好!

2015-06-28 12:58:29 3710

脉冲分频器

此为硬件学习与开发的基础教程。每一位和C51打交道的学院的必修课程,希望对你们会有帮助

2014-12-17

单片机方波发生器

这是硬件单片机的入门,方波发生器。里面有详细的代码及设计文件。在proteus下可以直接模拟结果!!

2014-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除