自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 问答 (3)
  • 收藏
  • 关注

原创 lgb 训练 listwise

【代码】lgb 训练 listwise。

2024-03-29 16:08:31 88 1

原创 deepfm和wide&deep知识点记录

Generalization:代表模型能够利用相关性的传递性去探索历史数据中从未出现过的特征组合,通过embedding的方法,使用低维稠密特征输入,可以更好的泛化训练样本中从未出现的交叉特征。笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尔积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。但要泛化,则需要更多的特征工程。wide&deep 在贝壳推荐场景的实践。

2024-03-27 20:29:59 134

原创 lgb自定义损失和评估函数

较简单,无需计算梯度,可先实现。

2023-06-14 11:50:35 822

原创 TfidfVectorizer 和 word2vec

简单使用例子,可以统计子变量的频次类特征TfidfVectorizer是scikit-learn库中的一种文本特征提取方法,它可以将文本转换为TF-IDF特征向量表示。在使用TfidfVectorizer时,可以通过stop_words参数来指定停用词,停用词是指在文本中频率很高但是无实际意义的单词,如“the”、“a”、“in”等。停用词列表可以是一个字符串,如英文停用词列表可以使用NLTK库中提供的停用词:from sklearn.feature_extraction.text import Tfid

2023-03-30 19:18:05 372

原创 pairwise、listwise在lgb中的应用,以及相关listwise的简单实现

在使用’rank:pairwise’进行训练时,需要将数据集按照样本排列顺序,以列表的形式传入模型,其中每个子列表包含了单个查询(query)的所有样本。在预测时,也需要将测试集按照样本排列顺序,以列表的形式传入模型的predict方法。在使用lgb模型进行listwise训练时,需要将数据集按照样本排列顺序,以列表的形式传入模型,其中每个子列表包含了单个查询(query)的所有样本。例如,一个包含3个查询的数据集,每个查询包含5个样本,可以表示为一个包含3个子列表的列表,每个子列表包含5个样本。

2023-03-28 14:45:32 1084

原创 日常代码小技巧【python、sql、go等】

相关技巧

2022-12-27 19:31:54 114

原创 lgb+xgb+cat分类,stacking示例

stacking

2022-11-09 10:00:04 327

原创 pandas按照某列groupby之后获取每个分组某列特征里出现次数最多的值

groupby 获取出现次数最多的值

2022-11-04 11:15:31 441

原创 autogluon trick

trick

2022-07-07 20:11:52 120

原创 对抗验证——训练测试集特征分布是否一致

训练测试集对抗验证

2022-07-04 20:06:19 910

原创 tensorflow1.12中checkpoint文件和save_model模型的保存和加载

tensorflow的checkpoint和save_model模型保存和加载

2022-06-07 14:48:23 530

原创 Tensorflow 1.13训练模型.pb文件转换成Tensorflowlite可以使用的.tflite文件过程记录

@Tensorflow 1.13训练模型.pb文件转换成Tensorflowlite可以使用的.tflite文件过程记录前言之前一直通过1.13版本的TensorflowGpu训练模型,使用范围局限在电脑端(例如opencv调用模型等等)。最近的一个项目需要在移动端部署,将训练好的.pb模型可以成功移植到安卓移动端,但是出现了一个老生常谈的问题,就是无法迅速连续识别,这主要是因为移动端和PC端...

2020-04-20 11:35:44 3481 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除