自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 特征工程:机器学习中的特征与标签nlp化

这是一篇关于机器自然语言应用和特征工程结合的文章,目的在于探讨在企业或科研场景中,特征工程的另一种可能性——解决特征稀疏或数据和模型异构场景下一种通用的解决方案。一种大大降低模型开发及数仓建设人力成本,同时提高模型精度的解决方案。

2017-09-10 17:56:51 5666

原创 Hbase Region still in transition修复

问题背景hbase内出现部分region挂空的现象。在界面上发现某个表的regionserver无法点击进入鼠标移至该rs上的链接本应端口号为60030,但却指向为60010。此时所有对该region的访问都将失败。原因分析该情况意味着该region正处于transition状态,但在transition时的目标rs却因为以外重启或失效,这些region即出现了该不

2016-02-19 15:33:04 3919

原创 hbase批量导入之bulkloader使用实战

HBase大量导入数据时,使用client方式将会导致大量网络IO以及损耗集群计算资源,Hbase官方的bulkloader可以很好解决这个场景。bulkloader支持将写成HFile格式的数据直接放入HBase,这个过程分为:1.准备HFile格式的文件于HDFS中:本样例代码场景为读取另一个HBase表中的数据,写为HFile格式。其中写入方式可以通过MR任务

2015-11-19 17:04:01 2468

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除