自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大邓和他的Python

内容涵盖python爬虫、文本数据编码、(文本)数据分析、金融量化、机器学习和深度学习

  • 博客(306)
  • 资源 (4)
  • 收藏
  • 关注

原创 2021最漂亮的5张可视化图

Link: https://towardsdatascience.com/the-10-best-data-visualizations-of-2021-fec4c5cf6cdbAutho...

2021-11-17 08:30:00 1013

原创 用matplotlib绘制体重变化十年趋势图

author: Quantified Bobsrc: https://www.quantifiedbob.com/body-composition-data-visualization/每...

2021-10-30 08:00:00 1522

原创 Shifterator库 | 词移图分辨两文本用词风格差异

以往对比两个文本数据差异,比较简单的技术实现方法是生成两文个词云图,但是词云图无法直观显示词语层面的权重。Shifterator包提供了构建词移图的功能,垂直条形图可以量化哪些词会导致两个...

2021-10-28 08:30:00 748 1

原创 视频专栏课 | Python网络爬虫文本分析

试看&购买支持开票先试看再购买可免费试看22节,含全部python语法、部分爬虫、个别文本分析为何要学Python?在科学研究中,数据的获取及分析是最重要的也是最棘手的两个环节!在...

2021-10-20 11:26:36 1087 3

原创 SmartScraper | 简单、自动、快捷的Python网络爬虫

腾讯课堂 | Python网络爬虫与文本数据分析SmartScraper使页面数据抓取变得容易,不再需要学习诸如pyquery、beautifulsoup等定位包,我们只需要提供的ur...

2021-10-14 08:00:00 522

原创 DataShare | 6000+个股票的每日财经新闻

整理自https://www.kaggle.com/miguelaenlle/massive-stock-news-analysis-db-for-nlpbacktestshttps://...

2021-10-07 07:50:00 649

原创 文本分析方法在《管理世界》(2021.5)中的应用

开学特惠|Python网络爬虫与文本分析案例文献胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156...

2021-09-02 08:30:00 1679

原创 connector-x | 让数据从DB高速导入到DataFrame中

开学特惠|Python网络爬虫与文本分析ConnectorX 使您能够以最快和最节省内存的方式将数据从数据库加载到 Python 中。你需要的是一行代码:importconnector...

2021-08-27 20:10:00 1609

原创 TFIDF | 有权重的计算文本情感得分

2021暑期 | Python数据挖掘暑假工作坊腾讯课堂 | Python网络爬虫与文本分析在论文Kai Li, Feng Mai, Rui Shen, Xinyan Yan, Measu...

2021-07-21 15:42:43 1926 2

原创 wordexpansion包 | 新增词向量法构建领域词典

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊腾讯课堂 | Python网络爬虫与文本分析一、项目意义情感分析大多是基于情感词典对文本数据进行分析,所以情感...

2021-07-19 14:37:03 1945 6

原创 中文金融情感词典发布啦 | 附代码

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊可以使用cnsenti库中的自定义方法,计算年报或财经类社交媒体的文本情绪。姚加权,冯绪,王赞钧,纪荣嵘,张维...

2021-07-14 14:20:00 7742 2

原创 whatlies包 | 简单玩转词向量可视化

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊whatlies可以与spacy语言模型结合,可视化词向量。安装zh_core_web_md、en_core_...

2021-07-08 18:48:16 396

原创 Clumper库 | 其他数据分析

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper前期文章Clumper | dplyr式的Python数据操作包Clumper库 | 常用的数据...

2021-07-01 20:00:00 146

原创 Clumper库 | Groupby具体案例用法

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper前期文章Agg聚合描述性统计方法agg如下图,可以理解成三个步骤,即group->spli...

2021-06-30 14:49:33 171

原创 Clumper库 | 常用的数据操作函数

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊前天分享了Clumper | dplyr式的Python数据操作包,其实Clumper有点跟之前的plyd...

2021-06-29 08:30:00 214

原创 Clumper | dplyr式的Python数据操作包

2021暑期 | 结构模型、Stata实证前沿、Python数据挖掘暑假工作坊Clumper可以用来处理嵌套样式的json数据结构。安装!pip3installclumper为了展示...

2021-06-23 13:56:20 188

原创 最好用的15个Typora主题

Typora简介Typora是一个所见即所得的Markdown格式文本编辑器,支持Windows、macOS和GNU/Linux操作系统,拼写检查、自定义CSS样式、数学公式渲染(通过Ma...

2021-06-03 08:30:00 27081 6

原创 companynameparser中文公司名称分词工具

companynameparser中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。安装pip3installcompanynameparser==0...

2021-05-23 15:37:19 1507 1

原创 addressparser中文地址提取工具

addressparser中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射。!pip3installaddressparser==0.2.1省市区提取默认采用全文模式,...

2021-05-22 10:30:30 1851

原创 multistop ~ 多语言停用词库

一、cnstopwords停用词表, 同时支持中英德等15种语言。 https://github.com/thunderhit/multistop二、安装pip3installmu...

2021-05-14 08:30:00 505 1

原创 hiResearch 定义自己的科研首页

Hi Research参考GreatDanton 项目,丢弃庞杂丑陋的收藏夹, 打造简洁科研首页。每个人都可以自定义自己的浏览器首页,替换默认浏览器首页/起始页。该项目可在任何现代浏览器上...

2021-05-11 08:30:00 416

原创 来自kaggle最佳数据分析实践

翻译: 大邓作者: Bex T标题: Weekly Awesome Tricks And Best Practices From Kaggle链接: https://towardsdev....

2021-05-09 08:30:00 671

原创 语法最简单的微博通用爬虫weibo_crawler

weibo_crawle可以做轻度的微博数据采集。一、支持爬虫用户信息抓取用户微博抓取(全量/指定时间段)用户社交关系抓取(粉丝/关注)微博评论抓取基于关键词和时间段(粒度到小时)的微博抓...

2021-04-30 21:22:44 2522 1

原创 使用Hugo快速搭建个人博客

之前分享过一期Hugo的教程,这次换了模板,感觉颜值提高了很多。之前的教程使用的 主题是academic, 本文教程依然是基于academic展开。大家如果学会了,可以换成别的模板。1. ...

2021-04-23 09:00:00 619

原创 使用streamlit上线中文文本分析网站

cnsenti App这是使用streamlit库将中文情感分析[cnsenti部署到网络世界,可在线提供简单的中文文本的情绪及情感计算。streamlit库(https://docs....

2021-04-14 09:00:00 2413

原创 SciencePlots | 科研样式绘图库

安装!pip3installSciencePlotstips:SciencePlots库需要电脑安装LaTex,其中MacOS电脑安装MacTex https://www.tug.o...

2021-04-06 09:00:00 1296 2

原创 B站视频 | Python自动化办公

Python自动化办公Python自动化办公视频课,原价99元,现在可全部免费观看,视频观看地址准备篇1.想象力丰富的自动化场景2.展示自动群发邮件软件简单文件处理篇1.批量更改文件名2...

2021-03-26 09:00:00 215

原创 2021寒假赋能!Python网络爬虫与文本分析直播课

Python网络爬虫与文本分析课在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家...

2021-02-06 00:06:50 891 2

原创 akshare库 | A股股票价格指数数据获取

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~A股函数类型功能ak.stock_sse_summary()数据总貌当日上海证券交易所-股票数据总貌ak.stock_szse_...

2020-12-10 12:30:29 9039

原创 akshare库 | 初识Python金融经济大数据库

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~AkShare是基于 Python 的财经数据接口库, 目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品...

2020-12-09 12:48:37 3680

原创 pdf2docx库 | 转文件格式,支持抽取文件中的表格数据

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~今天在知乎看到如何免费地、完整地把 PDF 转换为 Word?近几年【pdf转word】在百度指数中呈上升趋势,由于pdf文件本...

2020-12-06 09:00:00 2053

原创 爬虫实战 | 采集&可视化知乎问题的回答

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~问题链接https://www.zhihu.com/question/432119474/answer/1597194524爬...

2020-12-02 08:00:00 645

原创 实操 | 复习Pandas一些常用操作

腾讯课堂 | Python网络爬虫与文本分析我挺喜欢看B站up主-老师好我叫何同学 , 所以今天就用bsite库采集一下何同学的视频信息及评论数据,每个视频的评论以csv文件存储于dat...

2020-10-26 09:00:00 449

原创 pyttsx3库 | 2行代码将文本转音频

腾讯视频 | Python网络爬虫与文本分析pyttsx3简介pyttsx3是一个款将文本转为语音的Python包,不同于其他Python包,pyttsx3真的可以文本转语音。安装pip...

2020-10-19 09:00:00 1136

原创 bsite库 | 采集B站视频信息、评论数据

腾讯课堂 | Python网络爬虫与文本数据分析一、简介bsite是用于采集B站用户视频列表页、视频评论数据的python包。二、安装pipinstallbsite三、使用方法3...

2020-10-16 11:41:58 2796 3

原创 五步写爬虫 | 采集大众点评数据采集实战

腾讯课堂 | Python网络爬虫与文本数据分析任务采集 http://www.dianping.com/shanghai/hotel爬虫设计阶段类型问题需要做到1请求网页数据在哪里?发...

2020-10-13 16:56:11 2659

转载 40000字 Matplotlib 实操干货,真的全!

预备通知 | Python数据挖掘与Stata应用能力提升与实证前沿国庆工作坊导读Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出...

2020-09-22 09:00:00 224

转载 带你来看全国3000所高等院校分布

截至2020年6月30日,全国高等学校共计3005所,其中:普通高等学校2740所,含本科院校1272所、高职(专科)院校1468所;成人高等学校265所。本名单未包含港澳台地区高等学校...

2020-09-21 15:11:07 5233 1

转载 用Python分析18万条《八佰》影评,看看观众怎么说?

腾讯课堂 |Python网络爬虫与文本分析大家好,我是J哥。最近《八佰》这部电影比较火,上映仅15天就已斩获22亿票房。对于沉寂了半年、影院上座率仍限定在50%的电影市场而言,这样的成...

2020-09-19 09:00:00 1789 4

转载 Pandas学习笔记之时间序列总结

早起导读:pandas是Python数据处理的利器,时间序列数据又是在很多场景中出现,本文来自GitHub,详细讲解了Python和Pandas中的时间及时间序列数据的处理方法与实战,建...

2020-09-11 09:00:00 1443

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除