自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python-中文分词并去除停用词仅保留汉字

对于一个由中文句子组成的列表,现在需要去除一切标点符号及数字,仅保留中文并将句子输出为列表。sentence0 巴林新增3例新冠肺炎确诊病例 累计确诊50例1 稳外资外贸 中国这样做2 工信部:每天保障湖北地区防护服数量达25万件3 广东建口岸联防联控机制 疫情严重地区...

2020-03-07 22:12:33 7699

原创 Python-精准提取行政区省市区

对于下表所示的地址序列(pd.Series),提取出每个元素的省市区,并单独生成列。山东省济宁市邹城市孟子大道前韩村东北991米 湖北省恩施土家族苗族自治州宣恩县G6911(安来高速)酸枣坪北526米 广东省惠州市惠城区S120(龙和路) 湖南省邵阳市大祥区G60(潭邵高速) 湖南省衡阳市衡南县兴中成不锈钢衡南县总代理西120米 需要采用的是Python里的...

2020-01-17 18:19:16 11403 1

原创 Python-MacOS上matplotlib显示中文字体

当在MacBook上使用matplotlib绘制统计图表时,中文很可能会无法正常显示,如下图中图表文字部分的方块。为了使之正常显示,许多人会参照别人的方法使用下述代码。但问题往往没能解决。原因是MacOS并没有SimHei这一字体。plt.rcParams['font.sans-serif']=['SimHei']Input:print(plt.rcParams[ 'fon...

2019-08-19 12:26:58 8792 2

原创 R语言-ggplot2-柱形图与饼图设计

1 柱形图R软件中生成柱形图与饼图的基本函数是一致的,都是使用geom_bar(),不过饼图需要+coord_polar()来将柱形图转为饼图。一般来说,R软件在生成柱形图时的思路与Excel是不同的,Excel只需要一个数据框,标明标签和数量,就可以生成柱形图,但R一般需要数据框包涵每个个体的情况,以标签为划分计量来建立柱形图。以下面的数据框df1为例,在ggplot2中生成柱形图需要在ge...

2019-05-08 15:22:58 8625

原创 R语言-gsub替换字符工具

gsub()可以用于字段的删减、增补、替换和切割,可以处理一个字段也可以处理由字段组成的向量。具体的使用方法为:gsub("目标字符", "替换字符", 对象)在gsub函数中,任何字段处理都由将“替换字符”替换到“目标字符”这一流程中实现,令替换字符为''''可实现删除,令替换字符为"目标字符+增补内容"可实现增补,替换和切割也是使用类似的操作。> text <- "A...

2018-08-27 00:47:43 116470 1

中文停用词库 chineseStopWords.txt

txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt txt格式的中文停用词库 chineseStopWords.txt

2020-03-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除