自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 问答 (3)
  • 收藏
  • 关注

原创 DataWhale组队学习-李宏毅深度学习Task01

DataWhale组队学习-李宏毅深度学习Task011 人类探索人工智能的阶段2 生物的本能3 人类设定好的天生本能4 机器学习方向的简单定义5 学习模式5.1 监督学习(Supervised Learning)5.2 半监督学习(Semi-supervised Learning)5.3 迁移学习(Transfer Learning)5.4 无监督学习(Unsupervised Learning)5.5 结构学习(Structured Learning)5.6 强化学习(Reinforcement Lea

2021-09-13 22:19:28 164

原创 writing

文章目录Ⅰ. Academic Reading0. The ReadingList in UCL1. Definition of Text Types2. Reading Academically Advice3. Basic rules of academic style4. Basic strategies of academic reading5. Note taking6. Search Plan (※)6.1 Plan you searchUnderstanding the nature of y

2021-08-10 23:24:20 875

转载 datawhale-动手学数据分析task02

datawhale-动手学数据分析task02(1)删除缺失值Drop the rows where at least one element is missing.Drop the rows where all elements are missing.Keep only the rows with at least 2 non-NA values.define in which columns to look for missing values.Keep the DataFrame with vali

2021-06-17 21:42:47 229

原创 datawhale-动手学数据分析task01

datawhale-动手学数据分析task01与read_csv()输出相同格式的数据df = pd.read_csv('train.csv',chunksize=1000)DataFrame的基础属性行数 列数列数据类型数据维度行索引列索引对象值,二维ndarray数组DataFrame整体情况显示前10行,默认是5行显示末尾几行,默认是5相关系数,如行数,列数,列索引、列非空值个数,列类型,内存占用快速统计结果,计数、均值、标准差、最大值、四分数、最小值我们以"Age"为筛选条件,显示年龄在10岁以下的

2021-06-15 20:06:45 237 1

原创 动手学数据分析

数据分析入门【思考】知道数据加载的方法后,试试pd.read_csv()和pd.read_table()的不同,如果想让他们效果一样,需要怎么做?了解一下’.tsv’和’.csv’的不同,如何加载这两个数据集?【答】TSV与CSV的区别:从名称上即可知道。TSV是用制表符(Tab,’\t’)作为字段值的分隔符;IANA规定的标准TSV格式,字段值之中是不允许出现制表符的。CSV是用半角逗号(’,’)作为字段值的分隔符;【思考】什么是逐块读取?为什么要逐块读取呢?【答】是指通过指定一个chunk

2020-08-19 21:55:10 218

原创 北京地铁客流数据特征分析

To build the characteristics of passenger flow prediction under the framework of passenger flow machine learning prediction, it is necessary to analyze its changing characteristics and influencing factors on the basis of fully understanding the passenger f

2020-08-19 11:04:13 3635

原创 DAU下降了怎么分析?

DAU下降了怎么分析?第一步:问题严重嘛对比历史数据,看一看是否是正常波动,还是异常波动第二步:是技术问题嘛看一看是不是服务器宕机了哪个网页不好使了是不是统计错误(eg:有新的入口没有统计?)第三步:拆分问题1.拆解不同的渠道2.不同的版本/平台/系统3.新/老用户4.拆分区域5.拆分时间第四步:找到原因1.考虑活动的影响(推广取消了?对手开始推广了?)2.考虑渠道的影响(某些渠道是不是遭到特殊情况了?)3.考虑产品的功能,策略是否调整了4.考虑产品的技术问题(用户增多导致

2020-08-16 20:08:43 717

原创 数据分析项目-淘宝用户数据分析

分析思路1、 分析用户在使用淘宝APP时的行为,确定相关指标,确定用户流失环节。2、 分析用户在不同时间段的行为趋势变化。3、 通过对部分商品的用户行为分析,提出针对不同类型用户的调整建议。AARRR(海盗模型)其实是用户生命周期的模型:先拉新,其次促活,接着提高留存,然后获取收入,最后实现自转播。AARRR模型主要针对一款特定产品,最初使用该产品的用户群体在各个环节会逐渐有一定的流失,通过层层深入达到最终的转化。相关指标1.不同时长,不同行为下的pv/uv等用户行为分析2.日ARPPU,

2020-08-16 17:46:24 1201 1

原创 数据分析项目-英国礼品商城数据分析

Kaggle: UK E-Commerce 用户行为分析项目概览数据背景:此次项目数据来自Kaggle,是英国零售商的实际交易数据,包含了2010年12月1日至2011年12月9日在英国注册的非实体网上零售发生的所有交易。公司主要销售独特的全天候礼品。该公司的许多客户都是批发商。分析目的:采用RFM模型,从用户、地区和时间等维度分析用户行为并提出优化建议。理解数据将下载好的数据导入数据库中,得到一个542K x 8 的数据集,列属性分别为:InvoiceNo --> 订单

2020-08-12 16:23:18 977 1

原创 nlp入门

说实话啥也不会,还在学,没啥时间写文档赛题综述赛题以自然语言处理为背景,要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题数据赛题以新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构

2020-07-21 23:25:08 180

原创 数据分析基础-Excel练习

逆向查找在更多工作的时候,直接构造出辅助列,这样可以沿用原来的正向查找的方法,所以我们要学会灵活多变

2020-07-20 21:28:37 2708 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除