技术宅不宅-CSDN博客

原创墨西哥区域相关的西班牙语日期的处理方案。。

西班牙语带有月份缩写的日期处理

2022-01-25 16:34:39 351

原创 pandas处理excel相关，插入折线图并保存xlsx文件用的，搬运一篇外网文章里的内容吧。

先放英文原文链接：原文链接这里好像并没有用到matplotlib，而是直接用了pandas里面的产生insert_chart（）的方法。大致过程如下：首先嘛，导包之后，先用xlsxwriter（第三方库，如果没有的话需要pip安装）作为engine，声明一个writer=pd.DataFrame(r’文件绝对路径’ , engine=‘xlsxwriter’)然后就是往writer里df.to_excel(writer , sheet_name=‘工作表名字’)，这里的df就是pandas的dat

2021-04-16 15:36:16 1123

原创 python中关于面向对象的一些小感悟，库的import问题

python之禅中有“Simple is better than complex.”这么一句话。理解为“简洁比繁琐好”，我觉得是没啥问题的。日常写脚本的时候，导库一般都会统一写在最开头，并且会通过换行，加以区分（无论看视频还是看书，很多示例都会有这样的特点。当然也有例外，但那种可以理解为一段代码里分成不同的功能区域，《轻量级Django》中，第一章部分代码就是这样。）那么如果在写类的时候，里面每写一个方法，都得import一次库，且不说用起来怎么样，光是写的时候，每个方法的开头都得from datet

2021-04-08 12:23:23 116

原创关于pandas+sql使用中的小坑：三个数字列转成字符串，然后补零拼接成新字符串

由于数据库存储日期数据时，年份，月份，日份这三个字段均保存成了整形（int），直接做拼接的话会导致结果出现诡异的情况。。首先，不做转换的话，会直接变成数字相加：year|month|day2021|4|6table[‘year’]+table[‘month’]+table[‘day’]出来的结果是2031。。然后，做了强制转化：year|month|day2021|3|102021|4|6table['date']=table['year'].astype('str')+table['mo

2021-04-06 11:10:24 485

原创记录一下最近在使用pd.pivot_table时遇到的坑：pivot_table的index参数中的列，如果存在nan值，该行记录将会被不计算

如题。最近在做个简易的统计脚本，思路大致描述一下：用到的工具：mysql，selenium.webdriverpymysql，sqlalchemy，pandas，numpymysql的建库建表部份就直接省略了：1，毕竟与这个主题是弱关系；2，大部份的问题都能直接从百度上，甚至直接在CSDN网站里检索到；3，关于mysql报错还是提一嘴吧，执行sql语句报错时候会有个报错数字号码（一般为4位数），可以直接按照关键词格式“数据库软件名（空格）报错数字号码”，在搜索引擎（如百度，谷歌，CSDN的

2021-03-10 12:19:56 2899

原创 pandas处理欧洲区域数据的csv文件，直接通过形参指定千分位和小数点

最近在做数据处理的时候，碰上了欧洲区域的账单，他们的千分位和小数点是这个样子的：可以看到：他们的小数点是英文逗号，而他们的千分位，则是小数点。。当场裂开。。但从pandas的官方文档中，查到pd.read_csv的参数中，有这两项：这意味着，可以通过参数传入，指定千分位和小数点。而原文的括号中，也直接说明了“例如从欧洲地区获取的数据”所以实际上可以通过如下代码解决：import pandas as pdeu_csv_table=pd.read_csv(r'eu_csv.csv',e

2021-03-08 16:35:40 519

原创 PANDAS处理英文日期的笨办法

好吧，工作中碰上了这种情况：这是用pandas读取表格后，日期/时间列里面的东西。。>>> order_only_asin_unhvp['date/time']4 Jul 29, 2020 6:18:30 AM PDT>>> type(order_only_asin_unhvp['date/time'][4])<class 'str'>更恶心的是，我还得把这个日期给重新换成日期格式才能继续干活。。看来真就只能做切割了。。。目前

2020-09-29 18:52:19 1009 1

原创 selenium 元素定位增加超时timeout设置

这其实算是我上课之后的收获吧，听了康神的爬虫课，get了这么个技能。这里厚颜无耻地链上康神的博客哈～康神的CSDN博客地址实际上我在使用链式编程解决“将日常工作自动化”的需求时发现，selenium包里面的元素定位（selenium原装的元素定位方法，参照博文《史上最全！Selenium元素定位的30种方式》），偶尔会出现卡在那里不动的情况，而且如果页面不存在需要定位的元素时，卡顿往往会超过1分钟，这就很难熬了。结合康神上课时给出的代码，稍加改良，就得出来下面这两个safe_get元素的自定义函数了。

2020-08-27 11:51:20 2809

weixin_43315203的博客