自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Alan's Blog

/* 枕上诗书闲处好,门前风景雨来佳 */

  • 博客(8)
  • 收藏
  • 关注

原创 Pandas+multiprocessing处理大文件时内存溢出问题

pandas multiprocessing 内存溢出

2022-06-22 16:10:30 1520 4

原创 M1 MacBook Pro编译GloVe时报错clang: error: the clang compiler does not support -march=native

使用M1 MacBook Pro编译GloVe时报错,完整输出如下:mkdir -p buildgcc -c src/vocab_count.c -o build/vocab_count.o -lm -pthread -O3 -march=native -funroll-loops -Wall -Wextra -Wpedanticclang: warning: -lm: 'linker' input unused [-Wunused-command-line-argument]clang: erro

2022-04-26 10:15:42 3040

原创 而立(一)

而立之年,有感而发,遂记之。

2021-06-07 17:47:43 391

原创 DataFrame.filter(Column.notEqual("value"))会不会过滤NULL值

select * from table where column != "value";这样一句SQL妇孺皆知,而且在MySQL/Oracle中column为 null 的也会被过滤掉;那么在Spark中表现又会是怎样呢?(Spark SQL也在悄悄得往SQL的语法标准上靠)import org.apache.log4j.{Level, Logger}import org.apache...

2019-07-15 11:33:52 1432

翻译 如何使用HDFS命令行处理带有空格的文件名

touch 'x y z'1. 上传文件1.1 %20 替换:使用%20代替文件名中的每一个空格hdfs dfs -put x%20y%20%20z {dest path}1.2 | 戏法使用管道符|巧妙连接cat和putcat x\ y\ \ z | hdfs dfs -put - /tmp/test/x\ y\ \ zcat x\ y\ \ z | hdfs df...

2019-07-15 11:31:57 1643

原创 搜索引擎高效使用技巧

最近留意到 搜索引擎百度已死 这样一篇文章席卷各个平台。在此,笔者不置可否,不去探讨哪个搜索引擎表现最好(准确 / 客观 / 符合预期),相信大家心中都有答案。笔者试与大家分享一些搜索技巧,无关乎大家使用哪个搜索引擎,希望大家都能快速准确得搜到想要的答案,欢迎一起探讨~1. 站内搜索说明期望搜索的结果来自于某个固定站点,例如CSDN / Stackoverflow用法在搜索...

2019-07-15 11:29:41 2243

原创 Spark中SimpleDateFormat的安全使用

日常开发中,我们经常使用 SimpleDateFormat 来对时间进行格式化/转换等操作。我们可以放心得使用在单线程环境中,但是需要时刻谨记 SimpleDateFormat 是非线程安全的,在 Spark 开发中同样需要注意。尤其碰到时间相关数据的处理时,不管是 UDF 还是 匿名函数 ,都需要谨慎使用非线程安全的 SimpleDateFormat 。在这里和大家分享笔者如何在 Spar...

2019-07-15 11:27:29 1016

原创 Hive多表插入遇坑记

众所周知,Hive多表插入可以有效避免多次读取同一数据集所造成的资源浪费,提升性能。但是,笔者在使用过程中,遇到了一小坑,遂记之与大家分享~1. 环境Hadoop: 2.9.1Hive: 1.2.2.62. 问题重现2.1 建表create table test_o (`id` int, `value` string);create table test_i1 (`id` in...

2019-07-15 11:11:48 1732

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除