自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

转载 (转)git ssh Permission denied(每次连接成功后重新打开一个git bash,都是Permission denied)

每次连接github都告诉我permission denied。​.ssh/config​​文件中加入以下内容。zhe篇文章 就是我的神!

2022-10-20 04:09:51 138

原创 Representation theory之稀疏编码和自然图像

自然图像在统计学上 与视觉系统相适应的相似的统计结构自然图像如何分布?不是随机,不是uniform,是highly non-uniform(redundancy很高)自然图像的大部分统计模型基于计算特征,利用图像的redundancy图像建模: 用线性权重加和...

2021-03-27 22:45:12 118

原创 Representation theory之稀疏编码

Neural codebinay active/inactive units 产生或者不产生outputspikesindividual spike(sequence of times)frequency coding(low number->low frequency)spike pattern, timing(spike inter时间段,relative timing 很小,可省略)建立binay 神经码, 看每行或者每列有多少1每一列的1有多少个->breath of

2021-03-23 16:53:07 142

原创 强化学习笔记4-MC,TD方法

不需建模的策略评估先复习需要建模的方法 动态programming:我们需要model,P,R无需建模的:R(s)累计的瞬时reward 其期望为Vπ(s)V^{\pi}(s)Vπ(s)Vπ(s)V^{\pi}(s)Vπ(s)的估计不用模型计算R(s)采用从s开始的N trajectories有的reward:R1,R2,R3…Monte Carlo 方法V(s)的近似值为1/N Rk的和 ,近似期望估计值收敛到实数期望,variance收敛到0,方差很大通过迭代平均来完成 很浪费

2021-03-14 23:20:19 458

原创 强化学习笔记3-解bellman方程

贪婪策略某一策略是贪婪的for 状态值方程V,if $\pi(s,a)=1 $ ifa等于估计状态动作值方程最大值,否则为0;最优策略(最大的状态值方程)V∗(s)=maxπVπ(s)V^{*}(s)=max_{\pi} V^{\pi}(s)V∗(s)=maxπ​Vπ(s)V的贪婪策略是最优的,V的贪婪策略可能不止一个,但所有的 Vπ∗V^{\pi ^{*}}Vπ∗都等于V*;如何计算最优策略?(期望)计算最优状态值方程,写出Bellman equation,从各部分加到一起V*(s)是从s

2021-03-14 23:01:27 558

原创 NLP--4 语言模型

语言模型语言定义为字母表的某一子集统计学语言模型在概率的角度看语言production,从词汇表分配随机的token序列P(<w1,w2,…wn>)generative model 不考虑condition,语言模型就是classification model P(x|c)LMV->vocalbularies最近更多的subword 和字母基础的语言模型广泛应用现在讨论word based language modeling概率语言模型用于语法检查 预测输入 语音转换,

2021-03-08 23:43:00 168

原创 NLP--3 Tokenization

对于很多书写系统,都用空格分离文字但是我们想把标点标记为分开的tokens(U.K. 10,000,000)有时候不能用空格拆分(isn’t)regular 表达用更复杂 sophisticated 的 pattern 描述 token 边界以上下文依赖方式,通常用regular 表达(regexes)给定有限的字母表,regexes和他们的matches可以通过连续的循环定义:1 空字符和单字符 in 这个集合的是该集合的regex,且自匹配2 如果r1 r2都是这个集合的regexe

2021-02-27 22:44:15 144

原创 强化学习笔记2-马尔科夫决策过程

Markov Decision Processes强化学习的任务agent(include strategy和model)环境提供state给agent,agent选择action 作用于环境,环境reward给agent…成分:环境,黑盒 只看得到输入输出学习的agent,state,agent关于环境的observationreward,single number(随时间改变)strategy, state->action mappingaction, 影响环境最大的问题是

2021-02-23 22:13:42 318

原创 Github安装与第一次使用

Github安装与第一次使用转自:https://blog.csdn.net/zeng308041977/article/details/83107019安装OS:http://code.google.com/p/git-osx-installer/downloads/list?can=3Windows:http://msysgit.github.io/Linux:http://book...

2021-02-22 17:08:45 172

原创 web开发Laravel安装 php composer+vs code+Linux core

先说一个重要的突破!composer install 安装依赖包超时报错需要切换到阿里云镜像源composer config -g process-timeout 600composer config -g repo.packagist composer https://mirrors.aliyun.com/composer/参考:https://learnku.com/articles/53614安装Step1 安装 php composer1 官网下载,参考官网入门指南或其他,2 在p

2021-02-21 20:23:23 2229 3

原创 NLP--2 语言结构和传统pipeline

自然语言是复杂的符号(词,短语,句子)系统 比ordinary符号更多的内部结构, 以下四层:phonological,individual sounds,书写语言,符号,字母;(最低)词素morphological,morphemes级别,最小意思语言单元,或者组成词;syntactic,词组成句子semantic,meaning级,(前三个都不涉及meaning),例如语言符号的表示以上四种不全面...

2021-02-20 23:54:07 422

原创 Representation theory之图论

图论帮助定义和可视化不同成分之间的关系:vertex/node,edges1图G=(V,E)edge(u,v)是各顶点之间的链接两点至neighbors 如果两点之间由edge链接degree of v等于连接到v点的edges的个数2path是一系列由edge连起来的点path length 是一个path所含的edge数3cycle 起始和结束点是同一点4connectivity两点连接 if他们之间存在path如果某图中所有点都连接了,称连接图连接成分:一组(子集)是

2021-02-20 22:10:18 156

原创 机器学习-非参数估计

非参数模型非参数模型在相似度定义上不同,没有global model,local model 随着需要而估计,只受nearby 训练实例影响不需要prior参数形式 复杂度取决于训练集的大小或者数据内部的复杂问题非参数模型也成做实例-based 或者memory-based 学习算法左右的训练实例存储O(N)的内存,根据所给输入找相似输出的计算量也是O(N),也称作lazy学习算法。不用马上计算模型,而是在给测试实例时在计算,缺点是对内存和计算能力的需求增加相似输入有相似输出非参数密度估计

2021-02-16 23:27:35 1710

原创 Leetcode 26+561

Leetcode26给定数组 nums = [1,1,2],函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。你不需要考虑数组中超出新长度后面的元素。来源:力扣(LeetCode)链接:https://leetcode-cn.com/problems/remove-duplicates-from-sorted-array我的:class Solution:def removeDuplicates(self, nums: List[int]) -> int

2021-02-14 23:25:08 112 2

原创 强化学习笔记1-introduction

1 intelligence->actionsmachine learning ,deep learning result in breakthrough有些方面超过人类,一些不如人类(fragile)2 different mistake导致分错类component depends on the environment, neighbor->需要 explainable AIdata-driven AI 由于大量可获得的数据 计算能力 复杂计算模型 而获得成功3 但是强人工

2021-02-14 22:44:15 113

原创 NLP--1

NLP,一种交叉学科使自然语言access to电脑交流,输入输出理解,获得、使用信息 情感内容语言协助(检查语法连贯)2 相关领域计算机语言学- 提供architectural inspiration for NLPsystems.;NLP更关注design 和分析自然语言的方法AI 语言与概念**,表示和推理能力**相互依赖,knowlege的获取需要从自然语言输入中提取信息能力;-ML :NLP依赖ML,用监督,板间的,强化学习text是离散信号,用ML模型处理此类信号的输入和输出.

2021-02-14 20:48:49 77

原创 博弈论Lecture1

决策三要素:谁(一个/多个);什么选择(choice,离散或连续);决策结果(objective functions)多个决策者和一个objective->gameDMs-> players;决策选项->strategies;objective functions->payoff functions离散例子1 监狱dilemma两人偷盗,给了boss,没有抓到证据,现审问二人,在不能互相交流的情况下,坦白/不坦白,给出ϕ1,ϕ2\phi_{1},\phi_{2}ϕ1​

2021-02-14 14:41:11 137

原创 Representation theory之信息论

Introduction针对信息在神经网络(人工和自然)的表示方式和学习方式不仅仅关注输出,更作用于广泛tasks关注生成原来和形成表示的基础关注无监督和自监督学习重要性监督学习的有标签数据少强化学习的reward/publishment 少无监督学习中,representations应该反映环境的结构,大量的observation(无标签数据)。学习类型| Table | 有老师 | 没老师 || 主动的 | 强化学习 |内部motivation

2021-02-09 22:11:22 419 2

原创 leetcode 1480+1672+45

leetcode 1480我的class Solution:def runningSum(self, nums: List[int]) -> List[int]:sums = []tmp = 0for i in range(len(nums)):tmp += nums[i]sums.append(tmp)return sums别人的解法class Solution:def runningSum(self, nums):newnums = numsfor i in r

2021-02-08 20:50:26 93 2

原创 Leetcode打卡 Day1--978

这里写自定义目录标题978题目解答978练习Python3的第一天题目当 A 的子数组 A[i], A[i+1], …, A[j] 满足下列条件时,我们称其为湍流子数组:若 i <= k < j,当 k 为奇数时, A[k] > A[k+1],且当 k 为偶数时,A[k] < A[k+1];或 若 i <= k < j,当 k 为偶数时,A[k] > A[k+1] ,且当 k 为奇数时, A[k] < A[k+1]。也就是说,如果比较符号在子数组

2021-02-08 15:12:14 128

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除