- 博客(4)
- 资源 (7)
- 收藏
- 关注
原创 2019年工行总行本部暑期实习生才选AI面试经历
2019年工行总行本部暑期实习生才选AI面试经历前天收到工行总行本部暑期实习生招聘面试通知,形式是参加“才选AI面试”小程序的视频面试,即在微信小程序中搜索“才选AI面试”。今天参加了面试,下面说下具体内容,供大家参考:正式面试之前可以点击“模拟练习”,熟悉面试流程。点击“进入正式面试”按钮,开始面试。面试共有2道题,分别是1道文字题,1道视频题。每题允许准备的时间为1分钟,允许作答的时间为...
2019-05-16 23:01:37 17215 4
原创 Pandas处理百万条csv或excel数据,提高效率np.where用法
最近在工作中遇到一个问题:需要对200万条csv数据进行清洗判断,考虑到在hive中不好操作循环,数据是从hive上下载下来的,然后考虑用python解决:数据处理需要先对行数做判断,然后根据该行某一列的数据值跟200作比较再判断取值,涉及到后面的值会取到前面一行的值。原来程序是这样:for i in data1.index: if i % 9 == 0: d...
2019-03-31 13:50:11 7124 1
原创 Pandas根据差值条件构造辅助列对几十万数据去重处理
最近碰到这样的一个问题:有一对数据t1列,t2列(如下图所示),用pandas读入,这些数据中会存在一个问题:①某一行的t1列值与另一行的t1列值相等,但t2列值的差值小于0.0001;②某一行的t2列值与另一行的t2列值相等,但t1列值的差值小于0.0001。我认为这两种情况是属于重合冗余情况(因为其他数据差别都大于0.0002),想要对数据进行去重,数据量有几十万条。一开始想要不...
2019-04-04 00:07:55 489
原创 提高Fortran代码运行效率以及速度
最近一直在研究自己的Fortran程序的运行效率,查阅了一些资料和做了大量的程序测试,总结如下:程序编写方面:1.Module的使用:尽可能多使用某些数组以及变量值要重复用到,比如有多个子程序需要调用,存在两种情况:(1)值已知,这种情况下单个变量值较常见,比如圆周率π,就用parameter声明在Module中;real,parameter::pi=3.1415926...
2019-03-30 11:14:04 8233 1
用python绘制txt文本中中文汉字的词云
2018-09-05
VTune_Amplifier_XE2013.lic
2018-05-19
从txt文本中读取数据,python作概率密度函数图像
2018-04-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人