自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 Hive上游为ORC格式的表,下游读取不完整

下游读取数据的时候,一直反复尝试,数据仍然不完整,理论上来说上游有四条数据,下游始终只能读到一条,反复排查后发现上游的任务都是spark类型,下游是用hive进行处理的时候会遇到这种问题,原因是下游的hive和上游的spark对于ORC格式的处理方式有所区别,spark底层对于读和写替换了原有的hive方案,所以导致两边不兼容,引发了数据不对齐的情况。遇到同类问题,采用spark.sql.hive.convertMetastoreParquet=false也可以解决问题。

2023-02-14 15:35:12 441

num.traineddata

自己训练了三张图片,里面有0123456789+-/*=的图像集,图片量不大,所以识别率会低一点,这两天在训练一个准确度高一点的继续上传

2019-10-22

img_knn_know.jar

这个也是摸索了才慢慢搞出来的,也借鉴了很多大牛的资料,自己做了一个比较简易的版本,其中设计了OPENCV和KNN,精准度92%,并不是太高,目前在考虑结合TESS4J能否优化这个项目,如果有问题的话可以私下交流一下,保存的训练集是存在本地F盘下面的trainimg文件夹的,这个是加载的时候自动生成的。(导入jar包实例化Main就可以运行了)

2019-10-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除