自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (2)
  • 收藏
  • 关注

原创 self-ensemble label filtering

self-ensemble label filtering自集成标签滤波模型将噪声标签剔除出来,仅对干净的数据训练。剔除数据主要思路:模型在训练时,对于那些噪声标签的样本的预测值常常飘忽不定(文章是这么指出的,准备做复现的时候试一试),因此采用信号处理中的滤波,而实现的方法是对模型求均值。Model ensemble:在训练过程中对模型的参数进行移动平均,当训练数据更新normal model参数时,通过权重的指数移动平均来维护teacher model,同时利用正则项来令两个model尽量保持

2021-01-17 21:12:45 873 1

原创 多文档的抽取式自动文本摘要

1.抽取式自动文本摘要本文自动文本摘要实现的依据就是词频统计。文章是由句子组成的,文章的信息都包含在句子中,有些句子包含的信息多,有些句子包含的信息少。句子的信息量用"关键词"来衡量。如果包含的关键词越多,就说明这个句子越重要。"自动摘要"就是要找出那些包含信息最多的句子,也就是包含关键字最多的句子。而通过统计句子中关键字的频率的大小,进而进行排序,通过对排序的词频列表对文档中句子逐个进行打分,进而把打分高的句子找出来,就是我们要的摘要。2.原理这种方法最早出自The Automatic

2020-12-11 15:25:56 3102 3

原创 NoisyLearning---Divide Mix

Divide Mix关键点1:混合高斯建模,将labeled的样本集和unlabeled的样本集区分开;关键点2:半监督学习;关键点3:独立网络模型;GMM将一件事物的数学特征用曲线表述出来后再用若干基于高斯(正态分布)概率密度函数行程的模型。找到一个合适的高斯分布,确定高斯分布两个参数,即μ和∑,使得这个高斯分布能够产生本组样本的可能性尽可能大,就形成了拟合样本数据这一说。GMM也被称为一种聚类方法,我是对比机器学习算法K-Means去理解的。GMMK-Means

2020-09-07 14:43:59 603 2

原创 Noisy label learning

Noisy Label Learning1.f’create_noisy_data’include cuda :numpy, random, matplotlib, pandas, tensorflow, os, sklearnFunctions:class cluster_data_preprocess:visualize_data: showing the distribution of the points we gennernateget_centroids: with the

2020-08-09 09:50:06 555

winequality.zip

葡萄酒质量

2021-03-07

tf2.x_resnet50_pretrained_model.zip

内包含ResNet50网络模型,模型预训练参数(.h5文件,基于tf2),以及一项使用tf2实现的对ResNet50的网络结构和预训练参数的分开调用。

2020-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除