涂漾图森魄-CSDN博客

原创 self-ensemble label filtering

self-ensemble label filtering自集成标签滤波模型将噪声标签剔除出来，仅对干净的数据训练。剔除数据主要思路：模型在训练时，对于那些噪声标签的样本的预测值常常飘忽不定（文章是这么指出的，准备做复现的时候试一试），因此采用信号处理中的滤波，而实现的方法是对模型求均值。Model ensemble：在训练过程中对模型的参数进行移动平均，当训练数据更新normal model参数时，通过权重的指数移动平均来维护teacher model，同时利用正则项来令两个model尽量保持

2021-01-17 21:12:45 873 1

原创多文档的抽取式自动文本摘要

1.抽取式自动文本摘要本文自动文本摘要实现的依据就是词频统计。文章是由句子组成的，文章的信息都包含在句子中，有些句子包含的信息多，有些句子包含的信息少。句子的信息量用"关键词"来衡量。如果包含的关键词越多，就说明这个句子越重要。"自动摘要"就是要找出那些包含信息最多的句子，也就是包含关键字最多的句子。而通过统计句子中关键字的频率的大小，进而进行排序，通过对排序的词频列表对文档中句子逐个进行打分，进而把打分高的句子找出来，就是我们要的摘要。2.原理这种方法最早出自The Automatic

2020-12-11 15:25:56 3102 3

原创 NoisyLearning---Divide Mix

Divide Mix关键点1：混合高斯建模，将labeled的样本集和unlabeled的样本集区分开；关键点2：半监督学习；关键点3：独立网络模型；GMM将一件事物的数学特征用曲线表述出来后再用若干基于高斯（正态分布）概率密度函数行程的模型。找到一个合适的高斯分布，确定高斯分布两个参数，即μ和∑，使得这个高斯分布能够产生本组样本的可能性尽可能大，就形成了拟合样本数据这一说。GMM也被称为一种聚类方法，我是对比机器学习算法K-Means去理解的。GMMK-Means

2020-09-07 14:43:59 603 2

原创 Noisy label learning

Noisy Label Learning1.f’create_noisy_data’include cuda :numpy, random, matplotlib, pandas, tensorflow, os, sklearnFunctions:class cluster_data_preprocess:visualize_data: showing the distribution of the points we gennernateget_centroids: with the

2020-08-09 09:50:06 555

winequality.zip

葡萄酒质量

2021-03-07

tf2.x_resnet50_pretrained_model.zip

内包含ResNet50网络模型，模型预训练参数（.h5文件，基于tf2），以及一项使用tf2实现的对ResNet50的网络结构和预训练参数的分开调用。

2020-09-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人