自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 向量Top K方法简介

随着深度学习的不断丰富发展,基于Embedding的向量召回引擎的使用场景越来越丰富,本文简要介绍一下,向量召回算法的基本分类以及现在流行的实现方式。 通常来说,面向向量的相似性检索的方法分为精确检索和近似检索两类。 精确检索 精确检索的本质就是线性查找。线性查找通过在整个向量空间内,遍历所有已存向量计算其与检索向量的距离,通常是计算欧几里德距离或者点积。欧氏距离最近的向量或者点积最大的向量就是相似度最高的向量。线性查找算法简单,不需要建立额外的数...

2020-09-20 15:45:48 1208

原创 Faiss使用教程详解

详情将官方Github地址:https://github.com/facebookresearch/faiss/wiki/Faiss-indexesFaiss是一个速度很快的向量Top k的召回算法库,适用于不同的应用场景,由于Faiss有各种索引构建的方式,本文主要简单介绍倒排索引的增、删、改、查的功能,以及Faiss算法的准确性和检索速度进行了介绍。## 增加数据(注:插入相同id的数据,不是把之前的数据进行更新,而是又增加了一天相同id的数据)# -*- coding: utf-8

2020-09-20 15:13:24 3192

原创 python中使用excutemany执行update语句,批量更新

当一次性需要批量更新许多数据时,这时需要使用excutemany()函数可以更快速地将数据更新到数据库,如下程序示范了如何使用excutemany执行 update 语句:# coding:utf8import pymysqlimport loggingconnection = pymysql.connect(host=HOST, port=3306, user=USER, pa...

2019-09-21 16:13:38 8606

原创 将多个dataframe的内容保存在Excel的不同的sheet中

将多个DataFrame保存在同一个Excel文件中的不同Sheet中# -*- coding: utf-8 -*-import pandas as pdexcel_out = pd.ExcelWriter(r'./测试.xlsx')dic1 = { '测试一': [88, 66, 55], '测试二': [99, 77, 33], '测试三': [55, 88, 65]}dic2 = { '测试四': [88, 66, 55], '测试五'..

2020-09-20 14:46:03 411

原创 利用pandas得到dataframe中重复的数据

pandas中过滤出后来重复的数据:import pandas as pddata={'one':[1,1,2,2,1,2,2],'two':['a','b','c','d','b','c','d']}frame=pd.DataFrame(data)print("***************原始数据*************")print(frame)data1 = frame....

2019-09-21 16:56:42 4101 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除